langchain의 마법같은 문법 LCEL Runnable
[x] ⭐ https://youtu.be/ckHAvm-L6Sc?si=fbIqK0cQ0tKqgAWO
리트리버 전략이 아주 많은데 모두 실험하기 벅참. 오픈에아이에서 발표한 실험에 따르면 전략을 추가할수록 정확도가 45에서 98까지 올랐으나 마커에아이 실험결과 결국 문서에 따라 결과는 달라짐. 예를들어 금융 문서에선 bm25가 좋았고 대학 학칙 문서에선 코사인 유사도가 좋았음.
기본적으로 한국어 형태소 분석기와 함께 bm25를 베이스라인으로 써보는 걸 추천. 키워드를 잘 찾아내는지 확인하면 좋음
한국어 임베딩 모델의 성능이 크게 리트리버 성능을 좌우하는 것 같진 않다고함
Retrieval 평가지표에 대한 이해(recall, precision, f1 score, nDCG, mAP, mRR)
한글 형태소 분석기(Kiwi, Kkma, Okt) + BM25, FAISS 리트리버로 한글 검색 성능 테스트