TensorFlow：训练BLSTM时CTC损失没有减少

作者: 晴天3
发布时间: 2024-09-08 12:56:31 (6天前)
转自：

3 条回复

0#
回复此人
撩心 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 在尝试了很多不成功的事情之后，我发现为tf.nn.ctc_loss的sequence_length参数提供了一个不正确的参数。它应设置为'输入序列的长度'但我已将其设置为'输出序列的长度（标签 - 字符数）' </p> <P> 更多细节可以在这个问题的选定答案的评论中找到 - <a href="https://stackoverflow.com/questions/43422949/ctc-loss-invalidargumenterror-sequence-lengthb-time"> CTC Loss InvalidArgumentError：sequence_length（b）＆lt; = time </A> </p> <P> 此外，如果有一个GPU，最好使用百度的CTC GPU实现（ <a href="https://github.com/baidu-research/warp-ctc" rel="nofollow noreferrer"> https://github.com/baidu-research/warp-ctc </A> ）因为它可以加快培训速度。 </p> </DIV>

编辑
1#
回复此人
圈圈红 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 问题是你在LSTM中提供原始图像，因此它很难提取任何有用的信息。 CRNN论文首先使用一系列卷积层从图像中提取特征，然后将这些特征输入LSTM。 </p> </DIV>

编辑

登录后才能参与评论