Recall, Precision 복습

(노란 gt는 negative, 파란 gt는 positive)

(노란 gt는 negative, 파란 gt는 positive)

N,P : 예측이 true인지, false인지에 대한 정보

T,F : 예측이 맞았는지 틀렸는지에 대한 정보

gt(ground truth) : 정답

Retrieval 지표 이해하기

image.png

RAG에서 retrieve하는 passages의 개수를 늘리면 recall은 증가하지만, precision은 감소한다. precision은 retrieve한 전체 passage들 중 정답 passage의 비율이다.

passage가 많아진다는 것은 곧 LLM(generator)이 쓸모없는 passage를 참고하여 환각 증세를 더 보이기 쉽다는 의미.

⇒ hallucination을 줄이고 싶다면 precision을 높이는 것이 유용할 수 있다.

금융, 법률 도메인처럼 절대 거짓말을 하면 안 되는 분야에서 precision 지표가 중요하게 작용한다.


nDCG, mAP, mRR 평가지표 이해하기

https://kgw7401.tistory.com/90

[example]

[example]

해당 retriever에 3개의 query를 질문한 뒤 성능을 측정하려고 한다.

세가지 query의 recall은 모두 1로 동일하지만, nDCG, AP, RR값은 모두 다르다.