📜 고대 기독교 문서 아카이브

다국어 스캔 PDF → OCR → AI 번역 → 구조화 → 벡터 검색 + RAG 질의응답

Phase 1OCR 파이프라인

로딩…
스캔 이미지 → InternVL2 OCR → 원문 텍스트 + 신뢰도 판정
스캔 입력
-
OCR 결과
-
검토 대기
-

Phase 2번역 + DOCX

로딩…
Claude API 번역 + 교리 검정 + 원문/번역 2단 DOCX 생성
번역 JSON
-
DOCX
-
-
·

Phase 3구조화 + DB 저장

로딩…
TEI XML + JSON-LD 생성 + MariaDB 인덱싱
문서
-
세그먼트
-
신학용어
-

Phase 4임베딩 + 검색 + RAG

로딩…
VoyageAI 임베딩 → pgvector 벡터검색 + Claude RAG 질의응답
문서 임베딩
-
세그먼트
-
검색 이력
-