https://www.youtube.com/watch?v=NfQrRQmDrcc

⭐가 붙은 부분은 중요

RAG 프로세스 간단 설명


문서 전처리 단계

  1. Document Loader : 문서 로드

  2. Text Splitter : chunk를 나누는 분할 전략

  3. Embedding : 임베딩

  4. Vector Store : vector DB

  5. Retrievers : vector DB 검색

    image.png

    각 단계에서 Langchain 내에 수많은 전략들이 있고 조합하면 3억개가 넘는다.<br> 현실적으로 모든 조합을 실험해 볼 수 없다.


Document Loader

(테디노트는 PDF 형식을 많이 다뤄서 이번 영상도 해당 로더를 다룬다.)

PDF Loader 추천

Document loaders | 🦜️🔗 LangChain

🔸 fitz