使用TensorFlow进行文本识别和检测


NetworkAttachedStorage
2025-01-01 07:06:52 (2月前)
  1. 我正在努力


文本
</跨度>

承认
</跨度>
项目。
我使用TensorFlow构建了一个分类器来预测数字,但我想实现一个更复杂的算法

文本
</跨度>

承认
</跨度>
通过使用

文本
</跨度>
本地化和

文本
</跨度>
分段(分隔每个字符)但我没有找到算法的那些部分的实现。

那么,你知道一些使用TensorFlow的算法/实现/提示吗?

2 条回复
  1. 0# 誓言 | 2019-08-31 10-32



    要对页面上的元素进行分组,例如文本和图像的段落,您可以使用某些聚类算法和/或具有某些阈值的blob检测。



    您可以使用Radon变换识别线条并检测扫描页面的偏斜。



    我认为对于字符分离,你将不得不搞乱字体。一些多项式匹配/拟合或其他东西。 (现在这是一个非常疯狂的猜测,不要把它当回事)。
    但类似的方法可以让你让角色脱离线并在同一步骤中识别它。



    至于识别,一旦你有了一个角色,就会有一个很好的三角技巧,比较角色的角度和存储在数据库中的角度。
    手写也很棒。



    我不是页面分割如何正常工作的专家,但似乎我正在成为一个。刚刚开展一个包含它的项目。
    所以给我一个月,我就能告诉你更多。 :d



    无论如何,你应该去阅读Tesseract代码,看看HP和Google是如何做到的。它应该给你很好的想法。



    祝好运!


登录 后才能参与评论