[빨간색이 사람이 개입하지 않는 부분]
학습 데이터 샘플에 대한 총 손실은 각 데이터 샘플에 대한 손실의 합과 같다. ⇒ 각 샘플별 손실은 덧셈으로 구성되어야 한다.
$$ C=\frac{1}{2n}\sum_x||y(x)-a^L(x)||^2 $$
⇒ $\frac{\partial C}{\partial w}=\sum_x \frac{\partial Cx}{\partial w}$ 이기 때문에 덧셈으로 구성된 손실함수에서는 각 데이터 샘플의 미분에 집중할 수 있다.
각 학습 데이터 샘플에 대한 손실은 $a^L$(모델)에 대한 함수이다. 즉, 모델의 최종 출력에 대해서만 손실을 계산해야 한다.
$$ C_x = \frac{1}{2}||y-a^L||^2 $$