$$ Accuracy = \frac{TP+TF}{TP+TF+FP+FN} $$
$$ P=\frac{TP}{TP+FP} $$
$$ R=\frac{TP}{TP+FN} $$
$$ F1=2\cdot\frac{P\times R}{P+R} $$
ImageNet을 사전 학습한 모델(e.g. Inception v3)을 분류기로 사용하여 GAN을 평가하기 위해 고안된 지표이다.
예리함(sharpness), 다양성(diversity) 2가지를 주요하게 고려한다.
[https://deepgenerativemodels.github.io/2019/assets/slides/cs236_lecture13.pdf]
Entropy 관점에서 지표를 설명할 수 있다.
entropy 계산에는 ‘확률’이 필요하고, 분류기 모델은 클래스에 대한 예측 확률을 출력하기 때문에 사전 학습된 분류기를 IS 평가에 활용하게 된다.
Sharpness : 분류기의 예측 확률이 하나의 클래스에 집중되어 있을 수록 좋은 지표이다. 즉, entropy가 낮을수록 좋다.
$$ \operatorname{sharpness}(x)=\sum_y p(y|x)\log p(y|x) $$
Diversity : 모든 이미지가 같은 클래스만 생성하면 diversity는 낮아지고, 모든 클래스가 균등하게 나타나면 diversity는 높아진다.
$$ p(y)=\mathbb{E}_x[c(y|x)] \cdots\text{marginal distribution} $$
Metric
$$ IS=S\times D=\exp(\mathbb{E}{x\sim p_g}[D{KL}(p(y|x)||p(y))]) $$
한계