Nesterov
1. 简介
Nesterov 加速梯度算法是一种对 Momentum 动量法的改进。
2. 原理
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 为动量因子,通常设为 。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 お前はどこまで見えている!
评论
WalineTwikoo
Nesterov 加速梯度算法是一种对 Momentum 动量法的改进。
第 次迭代时:
其中, 为需要更新的参数, 为损失函数, 为 关于 的梯度, 为学习率, 为动量因子,通常设为 。