目录
写在前面
文字 OCR 识别软件也可以说是必备的软件之一了,对于一些图片里的文字再也不用手动去打了。电脑端支持 OCR 识别的软件可真不少,比较知名的有 Adobe Acrobat DC、Abbyy 等等。
小众一些的有像天若 OCR 一样的这一类国产小软件,甚至说再低级一些,QQ 都可以算作一款 OCR 软件。
今天给大家分享一款基于 PaddleOCR 的离线 OCR 模块,可以免费使用的开源离线 OCR 识别小软件——Umi-OCR。
Umi-OCR,免费可离线使用的OCR识别软件
适用于 Win10 x64 平台的离线OCR软件。批量导入本地图片 / 读取剪贴板,识别图片中的文本,输出到软件面板或本地 .txt / .md 文件。
- 免费:本项目所有代码开源,完全免费。
- 方便:解压即用,无需安装。不需要网络。
- 高效:OCR识别引擎是C++编译的 PaddleOCR-json (PP-OCRv2.6 cpu_avx_mkl),比前代提速20%。只要电脑性能足够且支持mkldnn,通常能比在线OCR服务更快。
- 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对非常规字形(手写、艺术字、小字、方向不正、杂乱背景等)也有不错的识别率。可设置忽略区域进一步提高精准性。支持载入自己训练的模型以适应任务需求。
首先说说兼容性,Win7 不建议使用 Umi-OCR,大概率是无法使用,推荐 Win10 以上系统。

软件不大,解压之后,运行主程序,界面也比较简单,只有简单的几个按钮。
点击「浏览」按钮导入或者直接拖入需要识别的图片,图片格式支持 jpg、png、bmp 等常见格式,图片支持批量导入。
然后点击「开始任务」,软件将会识别所有已导入图片的文字信息,等待进度条走完,识别结果会显示在「识别内容」选项卡中。
与此同时,Umi-OCR 还会自动在桌面上生成一份带有识别结果的 txt 文本文档。

点击「复制文字」按钮可以全部复制下识别到的内容,如果只需要复制部分文字,可以用鼠标选择之后通过快捷键「CTRL+C」进行复制。
其实,许多时候,我们通过 OCR 识别图片上的文字,往往并不需要全部识别所有区域,比如某个截图上的水印文字就会很大程度上干扰识别结果。
Umi-OCR 支持自定义设置忽略图片中的某处区域,以便实现更精准的识别。
操作方式是先进入设置,然后「添加区域」,将需要忽略或者识别的区域进行重点框选,点击「完成」之后,设置就会生效。


设置一次,对所有图片全部起作用,如果不再需要先前设置的忽略区域,直接清空即可!
除了识别图片文件,对于已经复制到剪贴板的图片,Umi-OCR 也能识别。
「识别内容」选项卡下的「剪贴板读取」也即是对应的剪贴板识别功能。

软件默认仅支持识别简体中文和英文项目,如果需要识别其它语言,还需要单独导入多国语言识别扩展包才能使用。
多国语言识别扩展包包括的语言有繁体中文、日文、韩文、法文和德文,导入方式是将扩展包文件拷贝到软件目录。
写在最后
Umi-OCR 是一款适用于Win10/11 x64 平台的免费、离线 OCR 文字识别工具,基于 PaddleOCR,支持批量导入、读取剪贴板,可排除图片中水印区域,提取干净的文本。
当然Ocr工具也很多,Umi-OCR 这个软件可以离线识别,所以永远不怕和谐。
Umi-OCR 全新 V2 版本更加不错了,完全免费,开源,可批量的离线 OCR 软件,非常推荐使用。
相关文件下载
Umi-OCR.v2.0.1+Umi-OCR 拓展包下载地址
Umi-OCR 开源地址:https://github.com/hiroi-sora/Umi-OCR
最近更新:2024年3月19日
注:本站统一解压密码为www.ittel.cn
不能作为服务使用太可惜