几款开源的OCR识别项目，收藏备用

源码分享 2023-03-22 12:03 780 0

随着科技的发展，OCR场景随处可见，很多APP也集成如身份证识别，银行卡识别的功能，包括微信都支持截图文件中的文字提取。现在，各大厂商均有提供各种场景的OCR识别的API。但是，有时候我们也想自己来折腾一下。这时候，就可以借助一些主流开源框架来快速达到我们的目的。

OCR引擎

tesseract

Tesseract，一款由HP实验室开发由Google维护的开源OCR引擎，开源，免费，支持多语言，多平台;

https://github.com/tesseract-ocr/tesseract.git

tesseract.js

js版本的Tesseract OCR,支持一百多种语言,使用也是非常简单，可以用npm安装，也可以直接在页面引用js

https://github.com/naptha/tesseract.js.git

PaddleOCR

PaddleOCR是百度开源一套OCR,旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。

https://github.com/PaddlePaddle/PaddleOCR.git

EasyOCR

EasyOCR是用Python编写基于Tesseract的OCR识别库，用于图像识别输出文本，目前支持80多种语言。

https://github.com/JaidedAI/EasyOCR.git

mmocr

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱，专注于文本检测，文本识别以及相应的下游任务，如关键信息提取。

https://github.com/open-mmlab/mmocr.git

simple-ocr-opencv

基于opencv 和numpy开源的OCR识别引擎

https://github.com/goncalopp/simple-ocr-opencv.git

OCR工具

OCRmyPDF

OCRmyPDF是基于tesseract-ocr开发、训练的文字识别提取的开源项目

https://github.com/ocrmypdf/OCRmyPDF.git

Umi-OCR

基于 PaddleOCR 实现的一款开源的文字识别工具，

一般开源项目，识别率肯定没有商用的那么高，只有通过训练自己的字库来提高识别率。文字识别场景，有时候就会涉及到图片处理，这里又会关联到其它强大的图像处理开源项目，如：OpenCV。这些项目中，PaddleOCR相对来说会更符合我们常见的业务场景，也支持我们自己去训练。

常见的开源许可证介绍，程序员必看

分享十个可视图表库，助你轻松制作精美可视化大屏

博客评论

还没有人评论，赶紧抢个沙发~

发表评论

说明：请文明发言，共建和谐网络，您的个人信息不会被公开显示。

闲言碎语

天没降什么大任于我，照样苦我心智，劳我筋骨。

扫码分享

分类

PHP （120）

Python （115）

Mysql （114）

运维安全（147）

源码分享（91）

疑难杂症（157）

程序人生（64）

其他（151）

AI （24）

最新博客

MySQL中实现大数据量的快速插入

你敢相信？这8项AI技术已经实现……

Python在AI虚拟教学视频开发中的核心技术与前景展望

AI包办79%代码，程序员饭碗不保！前端开发要凉，人类只配改Bug？

医疗AI历史性突破！DeepMind诊断系统获FDA认证，人类对抗癌症与老年痴呆迎来“超级助手“

90%的AI产品发布，为什么惨败如垃圾！

Trae 宝藏功能实测：从 Mcp 搭建天气系统，到 AI 重塑 Excel 数据处理

10天做出AI面试“外挂”，狂揽多个大厂Offer！这名21岁学生已被哥大正式开除……

2025 年三月三大网络攻击事件盘点

AI 生成的代码真的安全吗？

赞赏支持

如果觉得博客文章对您有帮助，异或土豪有钱任性，可以通过以下扫码向我捐助。也可以动动手指，帮我分享和传播。您的肯定，是我不懈努力的动力！感谢各位亲~