关于使用SGD时如何选择初始的学习率这里SGD是指带动量的SGD,momentum=0.9): 训练一个epoch,把学习率从一个较小的值10-8)上升到一个较大的值10),画出学习率取log)和经过 … Continue reading sgd学习率选择问题
关于使用SGD时如何选择初始的学习率这里SGD是指带动量的SGD,momentum=0.9): 训练一个epoch,把学习率从一个较小的值10-8)上升到一个较大的值10),画出学习率取log)和经过 … Continue reading sgd学习率选择问题