다국어 스캔 PDF → OCR → AI 번역 → 구조화 → 벡터 검색 + RAG 질의응답
python3 phase1_ocr_pipeline.py --input scans/ --batch
./run_phase2.sh batch output/
./run_phase3.sh batch output/
POST /rag