开源 OCR [已关闭]

2022-09-03 02:28:06

我正在寻找一个在Linux上运行的开源OCR库。我需要它来为PNG和PDF工作。大多数情况下,我想从java或ruby接口这个库。任何想法,如果有什么可用?

问候。


答案 1

Tesseract是一个非常好的OCR引擎:https://github.com/tesseract-ocr/tesseract

该项目由HP Labs启动,现在由Google继续并由Google赞助(用于Google Books!它是在Apache许可证下发布的,并且可以在Linux上运行。它使用Tiff或PNG文件;对于 PDF,您需要转换为这些格式之一。我想没有绑定,所以你应该调用这个软件作为一个子程序...


答案 2

楔形文字是免费的,做得很好。你可以把它作为一个子程序调用,但是据我所知,没有语言绑定。它不会直接读取PDF,但您可以轻松地将扫描图像序列的PDF分开,以将其提供给楔形文字。还有一些脚本可以将图像和文本重新组合回可搜索的PDF。


推荐