1. 平方误差 对于单个数据来说,其平方误差为 E=12∑k(yk−tk)2\begin{array}{c} E = \frac{1}{2} \sum_{k} (y_k - t_k)^2 \end{array} E=21∑k(yk−tk)2 其中,yky_kyk 表示神经网络的输出,tkt_ktk 表示监督数据(ttt 采用 one-hot 编码),kkk 表示数据的维度。 对于所有训练数据来说,其平方误差为 E=12N∑n∑k(ynk−tnk)2\begin{array}{c} E = \frac{1}{2N} \sum_n \sum_k (y_{nk} - t_{nk})^2 \end{array} E=2N1∑n∑k(ynk−tnk)2 2. 交叉熵误差 对于单个数据来说,其交叉熵误差为 E=−∑ktklogyk\begin{array}{c} E = - \sum_{k} t_k \log y_k \end{array} E=−∑ktklogyk 其中,yky_kyk 表示神经网络的输出,tkt_ktk 表示监督数据(ttt 采用 one-hot 编码),kkk 表示数据的维度。 对于所有训练数据来说,其交叉熵误差为 E=−1N∑n∑ktnklogynk\begin{array}{c} E = -\frac{1}{N} \sum_n \sum_k t_{nk} \log y_{nk} \end{array} E=−N1∑n∑ktnklogynk