OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。
Celebrating the two-year anniversary of this project and reaching 20k stars!
两年前,有个人试图寻找一个免费的、无需注册、开箱即用、支持批量处理且不限制数量的OCR软件。可惜,当时没有软件满足他的需求。于是,他一拍脑袋,花了几个日夜,自己写了个软件原型。那就是 Umi-OCR v1.0 。
没想到这个项目还挺受大家欢迎,于是他就一直维护更新下去。在用户的建议下,Umi 的功能越来越丰富,有了截图,现代化UI,二维码,PDF识别,HTTP接口……从1k行代码的小demo,历经两年迭代,到如今20k行;Umi 逐渐变成一个较为成熟完整的项目。
未来,Umi 会继续完善现有功能、开发新的功能。受限于作者的业余时间和精力,项目更新的速度可能不会很快,还请给予耐心。本项目始终在稳步前进,历史上大多数Issues反馈和请求,最终都落到了实处。
(下一步,我将对软件底层的插件机制做出较大的调整和重构,以便为表格识别、图片翻译、原生Linux支持 等大型功能铺平道路。)
感谢各位用户、开发者、翻译者的支持。感谢我自己的坚持。
—— by hiroi-sora
--path
允许传入多个图片或文件夹。👉命令行手册
--output
, --output_append
, --clip
。整页强制OCR
模式下,提高小尺寸页面的渲染精度。Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
Copy the UmiOCR-data/.settings
from the old version of the software to the same location in the new version.
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition
.
更多下载途径: 蓝奏云 | SourceForge
Celebrating the two-year anniversary of this project and reaching 20k stars!
两年前,有个人试图寻找一个免费的、无需注册、开箱即用、支持批量处理且不限制数量的OCR软件。可惜,当时没有软件满足他的需求。于是,他一拍脑袋,花了几个日夜,自己写了个软件原型。那就是 Umi-OCR v1.0 。
没想到这个项目还挺受大家欢迎,于是他就一直维护更新下去。在用户的建议下,Umi 的功能越来越丰富,有了截图,现代化UI,二维码,PDF识别,HTTP接口……从1k行代码的小demo,历经两年迭代,到如今20k+行;Umi 逐渐变成一个较为成熟完整的项目。
未来,Umi 会继续完善现有功能、开发新的功能。受限于作者的业余时间和精力,项目更新的速度可能不会很快,还请给予耐心。本项目始终在稳步前进,历史上大多数Issues反馈和请求,最终都落到了实处。
(下一步,我将对软件底层的插件机制做出较大的调整和重构,以便为表格识别、图片翻译、原生Linux支持 等大型功能铺平道路。)
感谢各位用户、开发者、翻译者的支持。感谢我自己的坚持。
—— by hiroi-sora
Windows7
及 核心数<=2的CPU
无法进行文档识别的Bug。--path
允许传入多个图片或文件夹。👉命令行手册
--output
, --output_append
, --clip
。整页强制OCR
模式下,提高小尺寸页面的渲染精度。Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
Copy the UmiOCR-data/.settings
from the old version of the software to the same location in the new version.
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错 0xc0000142
、[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (129MB)
SHA256: 53e144b07c3ddfc1038e16926912de75c8212840c84cd56713f9e93ecc22e753
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97.1MB)
SHA256: 09f10d04bd1915ad67a76e57e54adad781a295e8bbf64c7a3e7207f056cafee6
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
Visit the Umi-OCR_Plugins to download more OCR plugins and acquire additional features such as Offline Mathematical Formula Recognition
.
更多下载途径: 蓝奏云 | SourceForge | Scoop
pdf, epub, mobi
等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。文档识别可能在Win7、或极低配电脑(如双核CPU)中出现异常,如无法识别PDF文件。已在 v2.1.1 版本中修复。
QMLSCENE_DEVICE
的影响。 (#270)We warmly invite translators to join us in our project's localization efforts! You can review existing translations or contribute new ones. Please visit the online platform Weblate at: https://hosted.weblate.org/engage/umi-ocr/
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
pdf, epub, mobi
等多种格式的文档,对扫描件进行OCR或提取原有文本。可输出为 双层可搜索PDF 。文档识别可能在Win7、或极低配电脑(如双核CPU)中出现异常,如无法识别PDF文件。已在 v2.1.1 版本中修复。
QMLSCENE_DEVICE
的影响。 (#270)We warmly invite translators to join us in our project's localization efforts! You can review existing translations or contribute new ones. Please visit the online platform Weblate at: https://hosted.weblate.org/engage/umi-ocr/
Umi-OCR v2 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0.7z.exe (128MB)
SHA256: 5349728289f353a25b5f570fe11795bb60d80c1df419bcc9977899b6c1c723a6
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0.7z.exe (97MB)
SHA256: 6460148b3b8fcdfb447ed8984a9c2fa232ca0cd156d8352f47d1841b2e3614ac
前往 Umi-OCR_插件仓库 ,下载更多OCR插件,获取离线数学公式识别
等附加功能。
v2.1.0 alpha
大版本前的测试版经过一段时间的 爆肝 高强度开发,“批量PDF文档识别”功能已基本完成。不过,仍有一些繁琐的辅助功能没写完,仍有一些代码待优化。这些将在v2.1.0正式版中完善。
考虑到有不少用户急需批量文档识别,故提前发布测试版。大家可以用自己的文件来检测这个新功能的稳定性与兼容性。
我要摸鱼一段时间,休息一下。祝用户朋友们,新年快乐~🎉🎉🎉
如果您擅长简体中文
和另外一门语言,可参与本项目翻译,或校对当前翻译!
在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/
v2.1.0
主要更新pdf, xps, epub, mobi, fb2, cbz
格式的文件,识别图片或提取原有文字。支持生成可搜索双层PDF。与测试版PDF识别相关的问题,可以在 Issue #333 中提出。
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0_alpha_1.7z.exe (128MB)
SHA256: a654aef09ca4f8ea71d5d498de79140f206786915b473134753503da3a5c01b9
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0_alpha_1.7z.exe (97MB)
SHA256: 61d3fb8ac95af0d63b45829104dfa8e2cfa141f1bc6386cbf15b217ffb0995ab
v2.1.0 alpha
大版本前的测试版经过一段时间的 爆肝 高强度开发,“批量PDF文档识别”功能已基本完成。不过,仍有一些繁琐的辅助功能没写完,仍有一些代码待优化。这些将在v2.1.0正式版中完善。
考虑到有不少用户急需批量文档识别,故提前发布测试版。大家可以用自己的文件来检测这个新功能的稳定性与兼容性。
我要摸鱼一段时间,休息一下。祝用户朋友们,新年快乐~🎉🎉🎉
如果您擅长简体中文
和另外一门语言,可参与本项目翻译,或校对当前翻译!
在线翻译平台: https://hosted.weblate.org/engage/umi-ocr/
v2.1.0
主要更新pdf, xps, epub, mobi, fb2, cbz
格式的文件,识别图片或提取原有文字。支持生成可搜索双层PDF。与测试版PDF识别相关的问题,可以在 Issue #333 中提出。
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.1.0_alpha_1.7z.exe (128MB)
SHA256: a654aef09ca4f8ea71d5d498de79140f206786915b473134753503da3a5c01b9
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.1.0_alpha_1.7z.exe (97MB)
SHA256: 61d3fb8ac95af0d63b45829104dfa8e2cfa141f1bc6386cbf15b217ffb0995ab
v2.0.2
日常修Bug,小迭代版本。开启/关闭
默认显示状态。 (#264)txt 单独文件
时,将应用指定路径
参数。 (#269)段落合并-多行-代码段
去除结尾多余换行符。 (#292)段落合并参数不存在
的误报。DefaultTips
不生效。预告:批量文档识别功能(支持PDF、epub、mobi等文件)正在火热开发中,将于下个大版本 v2.1.0 中发布。预计一个月左右推出。
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.2.7z.exe (118.5MB)
SHA256: 28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.2.7z.exe (86.5MB)
SHA256: fbca7e0f6fa8b560a15548d5a6fe4549a13a428eeee3b2aa68b508a0094c9ea8
v2.0.2
日常修Bug,小迭代版本。开启/关闭
默认显示状态。 (#264)txt 单独文件
时,将应用指定路径
参数。 (#269)段落合并-多行-代码段
去除结尾多余换行符。 (#292)段落合并参数不存在
的误报。DefaultTips
不生效。预告:批量文档识别功能(支持PDF、epub、mobi等文件)正在火热开发中,将于下个大版本 v2.1.0 中发布。预计一个月左右推出。
v2.0.x 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.2.7z.exe (118.5MB)
SHA256: 28875194a3c78d2d88ad7f2cb44a4da4a1976e372b84e7dd5864dddf220eba63
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.2.7z.exe (86.5MB)
SHA256: fbca7e0f6fa8b560a15548d5a6fe4549a13a428eeee3b2aa68b508a0094c9ea8
v2.0.1
更新内容:-->
和-->>
,将结果输出到文件。见命令行使用手册。v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f
测试中,详见这里 。
v2.0.1
更新内容:-->
和-->>
,将结果输出到文件。见命令行使用手册。v2.0.0 用户升级时,将旧版软件的UmiOCR-data/.settings
拷贝到新版相同位置即可。
不同版本仅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系统,附带多国语言识别库。
.7z.exe
为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。
(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)
重要提示:如果执行OCR时报错[Error] OCR init fail
,大概率是CPU不兼容Paddle,请换用Rapid版本。
Umi-OCR_Paddle_v2.0.1.7z.exe (118MB)
SHA256: cb51be5c37f69ef6a4a5288c591051d240cf233929daff233a6e957c5eea600d
(速度稍慢,内存占用低,适合低配机器,兼容性好)
Umi-OCR_Rapid_v2.0.1.7z.exe (86MB)
SHA256: b2e316ff3386ae9b62d45aefa5bc4a7e23319a61f64c4d3ccf37dee4d5af666f
测试中,详见这里 。