图片中文字提取出来（图片提取文字操作方法）

小多多 • 2021年12月13日下午8:12 • 杂谈

在我们办公时，是不是经常遇到图片内容转文字的需求？

你是用什么工具解决的呢？是手机自带拍照转文字功能？还是使用 QQ 里面的工具？

今天我们就为大家介绍一款 GitHub 用户 ianzhao05 刚发布的小工具——textshot，只需要截屏就能实时生成文字。读者也可以通过此项目大致了解如何对图像中的文本进行识别。

部分代码展示

如何安装

安装 Python 3；

复制 TextShot 库，并使用跳转命令 cd 进入该库；

（可选项）创建一个虚拟环境，例如使用 python -m venv .venv ；

使用 pip install -r requirements.txt 安装所需的软件包；

安装 Google 的 Tesseract OCR 引擎，并通过将目录添加到系统路径来确保可以从命令行访问 tesseract。

这个实用小工具的开发也离不开谷歌经典 OCR 开源项目 Tesseract。

Tessract 的使用

Tesseract 是目前最好的用于机器打印字符识别的开源 OCR 工具。20 世纪 80 年代由 Hewlett Packard 开发，2005 年开源，自 2006 年起由谷歌赞助开发。该工具在受控条件下也能很好地运行，但是如果存在大量噪声或者图像输入 Tesseract 前未经恰当处理，则性能较差。

Tesseract OCR 引擎于 20 世纪 80 年代出现，更新迭代至今，它已经包括内置的深度学习模型，变成了十分稳健的 OCR 工具。而 Tesseract 和 OpenCV 的 EAST 检测器是一个很棒的组合，感兴趣的读者可参考机器之心报道。

Tesseract 支持 Unicode（UTF-8）字符集，可以识别超过 100 种语言，还包含多种输出支持，比如纯文本、PDF、TSV 等。但是为了得到更好的 OCR 结果，还必须提升提供给 Tesseract 的图像的质量。

值得注意的是，在执行实际的 OCR 之前，Tesseract 会在内部执行多种不同的图像处理操作（使用 Leptonica 库）。通常情况下表现不错，但在一些特定的情况下的效果却不够好，导致准确度显著下降。在将图像传递给 Tesseract 之前，可以尝试以下图像处理技术，但具体使用哪些技术取决于使用者想要读取的图像：

反转图像

重新缩放

二值化

移除噪声

旋转/调整倾斜角度

移除边缘

所有这些操作都可以使用 OpenCV 或通过 Python 使用 numpy 实现。

Tesseract (v4) 最新版本支持基于深度学习的 OCR，准确率显著提高。底层的 OCR 引擎使用的是一种循环神经网络（RNN）——LSTM 网络。

中文 OCR 项目

中文 OCR，像身份证识别、火车票识别都是常规操作，它也可以实现更炫酷的功能，例如翻译笔在书本上滑动一行，自动获取完整的图像，并识别与翻译中文。

目前比较常用的中文 OCR 开源项目是 chineseocr，它基于 YOLO V3 与 CRNN 实现中文自然场景文字检测及识别，目前该项目已经有 2.5K 的 Star 量。

而机器之心之前介绍过另一个开源的中文 OCR 项目，基于 chineseocr 做出改进，是一个超轻量级的中文字符识别项目。详情可参考：实测超轻量中文OCR开源项目，总模型仅17M

该项目表示，相比 chineseocr，chineseocr_lite 采用了轻量级的主干网络 PSENet，轻量级的 CRNN 模型和行文本方向分类网络 AngleNet。尽管要实现多种能力，但 chineseocr_lite 总体模型只有 17M。目前 chineseocr_lite 支持任意方向文字检测，在识别时会自动判断文本方向。如下图所示机器之心实测效果示例：

小多多创始人

0 0

杂谈

电缆上市公司有哪些，电缆上市公司名单

2021年电缆概念股有： 1、宝胜股份：从近五年ROE来看，近五年ROE均值为5.1%，最高为2016年的11.03%。行业最大、最具竞争力的网络渠道，主要从事电线电缆开发与制…

海淘直接
2022年7月19日
清理器哪个好用（手机内存清理神器）

和 windows 系统一样垃圾清理也是 Android 系统无法挣脱的魔咒！只要手机使用时间一长，各种缓存数据和卸载应用所遗留的垃圾文件就越积越多，如果不及时清理，不仅占用储存空…

小多多
杂谈 2021年12月13日
微信抢红包工具哪个好（最新版微信抢红包神器）

用微信抢红包一斤成为了大家茶余饭后的一项热门娱乐活动，不过很多时候，我们工作中便无法抽身抢红包了。那么，微信如何才能够实现自动抢红包呢？想要让微信进行自动抢红包，那么“神助攻”是…

小多多
杂谈 2021年12月13日
手机屏一定要换原装吗？有什么差别有必要吗？

跟大家讲个故事，大家就当段子听就可以。这不是部分大学已经放假了么。恰好这段时间也不太适合出门玩，这两天就天天在家用手机打联盟，你就想吧，都打一千多场了，几乎就等于在家抱着手机不撒…

季候
2022年4月8日 • 杂谈
微信视频号直播相关流程(微信视频号直播怎么推广流量)

继内测视频号直播功能之后，微信近日又有了新动作。12月7日，有媒体发布消息称，微信视频号小商店正式接入魔筷cps带货系统。借助此系统，微信视频号主播可以直接在视频号绑定的小商店中选…

小多多
2021年12月13日 • 杂谈
win10设置我的电脑在桌面显示（在桌面设置我的电脑详细步骤）

Win10系统桌面此电脑不见了怎么办？有用户重装了Win10系统之后，桌面只有一个回收站图标，没有此电脑，该如何恢复呢？下面就给大家分享Win10系统桌面添加我的电脑的方法。解决…

小多多
杂谈 2021年12月13日
ps2模拟器按键设置（玩电脑游戏的小窍门）

接触模拟器已经有十余年，用模拟器玩游戏，成了长大后找回童年回忆的不二选择。从最早的FC模拟器到最钟爱的MD模拟，还有为了回忆当初让自己丧心病狂版痴迷的红警而不断研究的PS模拟器。 …

小多多
2021年12月13日 • 杂谈
联想b450参数配置（联想e450上市价格）

我们知道，传统的品牌主机机并不支持改装升级，因为这将会失去享受各项售后服务的资格。这让很多对DIY升级改装突然产生兴趣的朋友，只能默默打消这个念头。而且可能会因为其机箱的局限性，升…

小多多
2021年12月13日 • 杂谈
飞利浦榨汁机使用教程(philips榨汁机怎么用)

飞利浦榨汁机怎么用？飞利浦榨汁机食谱大家知道多少？一杯果汁可能会延长人类寿命，下面小编为大家介绍的是飞利浦牌子榨汁机的使用方法以及食谱推荐，希望对大家有所帮助哦。 5、在使用水果榨…

小多多
杂谈 2021年12月13日
mac如何格式化u盘（恢复U盘数据方法）

我们都知道，U盘格式化操作会造成数据丢失，相信很多伙伴都不会轻易将U盘进行格式化。但是，在日常使用U盘期间，难免会遇到意外或一些难题，导致我们不得不将U盘格式化。格式化后数据怎么恢…

小多多
杂谈 2021年12月13日
mybatis存储过程写法(mybatis调用存储过程详解)

简述本文主要介绍MyBatis框架工作原理及流程。 MyBatis介绍 MyBatis是一款优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所…

小多多
杂谈 2021年12月13日
摔跤手能打几个普通人

摔跤手能打几个普通人这需要看摔跤手本人的技术,个人体质和身体状况来综合决定,而且还要考虑一些外在因素。比如厉害的摔跤手可以撂倒5到6个普通人,当然这种没有具体的数据,都要根据实际情…

季候
杂谈 2022年4月6日
杂谈

饿了么:坚决不从事“二选一”行为（饿了么回应美团垄断事件）

财经网科技10月9日讯，据财联社消息，饿了么发布公告称，饿了么关注到国家市场监督管理总局对美团滥用市场支配地位的垄断行为作出处罚。饿了么坚决支持国家市场监督管理总局等相关行政部门对…

小多多
2021年12月13日
狮子女要虐才会喜欢你，追狮子女千万别跪舔

都知道狮子女是比较霸气的一个星座女，她对于没有什么挑战的事物没什么好奇心，反而会对那种难于攻克的人或者物有极强的征服欲。这就是为什么我们说狮子女要虐才会喜欢你，追狮子女千万别跪舔的…

季候
杂谈 2022年4月6日
墨水屏和液晶屏的区别(墨水屏平板推荐)

我是一个文字工作者，每天准时上下班，陪伴我的就是一台电脑和LCD显示器，虽然刚开始工作的时候，整个身体还是能适应，并且觉得很愉快，但是每天这样子在液晶显示屏前一直盯着看，越来越受不…

小多多
2021年12月13日 • 杂谈

发表回复

登录后才能评论

图片中文字提取出来（图片提取文字操作方法）

相关推荐

发表回复