![[빨간색이 사람이 개입하지 않는 부분]](https://prod-files-secure.s3.us-west-2.amazonaws.com/e371e029-4777-4e5f-9f19-cf1a46662c10/589207b8-ae1d-4af0-8f77-38733cd7880a/%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2023-09-02_155107.png)
[빨간색이 사람이 개입하지 않는 부분]
학습 데이터 샘플에 대한 총 손실은 각 데이터 샘플에 대한 손실의 합과 같다. ⇒ 각 샘플별 손실은 덧셈으로 구성되어야 한다.
$$ C=\frac{1}{2n}\sum_x||y(x)-a^L(x)||^2 $$
⇒ $\frac{\partial C}{\partial w}=\sum_x \frac{\partial Cx}{\partial w}$ 이기 때문에 덧셈으로 구성된 손실함수에서는 각 데이터 샘플의 미분에 집중할 수 있다.
각 학습 데이터 샘플에 대한 손실은 $a^L$(모델)에 대한 함수이다. 즉, 모델의 최종 출력에 대해서만 손실을 계산해야 한다.
$$ C_x = \frac{1}{2}||y-a^L||^2 $$