在斯坦福的深度学习课程中找到了这张幻灯片 https://youtu.be/wEoyxE0GP2M?t=1h18m2s
给出的解释是这是参数初始化不良的症状。有一段时间几乎没有学习,然后突然参数调整到正确的方向,你的准确度和/或损失都会大幅增加。