一个多语言支持、易使用的 OCR 项目。An easy-to-use OCR project with multilingual support.
AgentOCR 是一个基于 PaddleOCR 和 ONNXRuntime 项目开发的一个使用简单、调用方便的 OCR 项目
本项目目前包含如下子项目:
中英文
[[[26.0, 37.0], [301.0, 39.0], [301.0, 72.0], [25.0, 70.0]], ['纯臻营养护发素', 0.971377968788147]]
[[[27.0, 82.0], [172.0, 82.0], [172.0, 103.0], [27.0, 103.0]], ['产品信息/参数', 0.9922086596488953]]
[[[28.0, 113.0], [330.0, 113.0], [330.0, 133.0], [28.0, 133.0]], ['45元/每公斤,100公斤起订)', 0.9619097709655762]]
[[[25.0, 143.0], [283.0, 144.0], [283.0, 164.0], [25.0, 163.0]], ['每瓶22元,1000瓶起订)', 0.9908633828163147]]
[[[24.0, 177.0], [301.0, 176.0], [301.0, 195.0], [24.0, 196.0]], ['【品牌】:代加工方式/OEMODM', 0.9834667444229126]]
[[[26.0, 210.0], [232.0, 210.0], [232.0, 227.0], [26.0, 227.0]], ['【品名】:纯臻营养护发素', 0.9786152243614197]]
[[[24.0, 239.0], [241.0, 237.0], [241.0, 257.0], [25.0, 259.0]], ['【产品编号】:YM-X-3011', 0.9821851849555969]]
[[[415.0, 241.0], [429.0, 241.0], [429.0, 300.0], [415.0, 300.0]], ['DMOEM', 0.8878258466720581]]
[[[25.0, 272.0], [180.0, 270.0], [180.0, 288.0], [25.0, 289.0]], ['【净含量】:220ml', 0.9954416155815125]]
[[[26.0, 304.0], [251.0, 304.0], [251.0, 320.0], [26.0, 320.0]], ['【适用人群】:适合所有肤质', 0.9606326818466187]]
[[[25.0, 334.0], [342.0, 335.0], [342.0, 352.0], [25.0, 351.0]], ['【主要成分】:鲸蜡硬脂醇、燕麦-葡聚', 0.9720807671546936]]
[[[27.0, 367.0], [279.0, 367.0], [279.0, 381.0], [27.0, 381.0]], ['糖、椰油酰胺内基甜菜碱、泛醇', 0.8544049859046936]]
[[[368.0, 370.0], [474.0, 370.0], [474.0, 384.0], [368.0, 384.0]], ['(成品包材)', 0.9908912777900696]]
[[[27.0, 398.0], [360.0, 398.0], [360.0, 412.0], [27.0, 412.0]], ['(主要功能】:可紧致头发磷层,从而达到', 0.9463475942611694]]
[[[28.0, 431.0], [369.0, 431.0], [369.0, 444.0], [28.0, 444.0]], ['即时持久改善头发光泽的效果,给十燥的头', 0.9470974802970886]]
[[[28.0, 460.0], [135.0, 460.0], [135.0, 477.0], [28.0, 477.0]], ['发足够的滋养', 0.997718095779419]]
韩文:
[[[400.0, 518.0], [502.0, 513.0], [504.0, 550.0], [402.0, 555.0]], ['오야야', 0.7852867245674133]]
[[[156.0, 576.0], [760.0, 559.0], [761.0, 594.0], [157.0, 610.0]], ['내가 잔깐 좋아하는 사람이 생겨서 혼과 공공', 0.8225479125976562]]
[[[203.0, 636.0], [718.0, 625.0], [718.0, 662.0], [203.0, 672.0]], ['않다가 죽어어릴것안 같아서 여기를 한다', 0.8644148707389832]]
[[[178.0, 691.0], [709.0, 683.0], [709.0, 717.0], [178.0, 724.0]], ['눈 앞이 아른아른 거리는 잘 생긴 얼굴 자꾸', 0.8839521408081055]]
[[[225.0, 739.0], [658.0, 738.0], [658.0, 770.0], [225.0, 771.0]], ['귀에 냄도는 크의 측촉한 옥소리 예', 0.8728228211402893]]
Python Package:
快速安装:
# 安装 AgentOCR
$ pip install agentocr
# 根据设备平台安装合适版本的 ONNXRuntime
# CPU 版本(推荐非 win10 系统,无 CUDA 支持的设备安装)
$ pip install onnxruntime
# GPU 版本(推荐有 CUDA 支持的设备安装)
$ pip install onnxruntime-gpu
# DirectML 版本(推荐 win10 系统的设备安装,可实现通用的显卡加速)
$ pip install onnxruntime-directml
# 更多版本的安装详情请参考 ONNXRuntime 官网
简单调用:
# 导入 OCRSystem 模块
from agentocr import OCRSystem
# 初始化 OCR 模型
ocr = OCRSystem(config='ch')
# 使用模型对图像进行 OCR 识别
results = ocr.ocr('test.jpg')
服务器部署:
启动 AgentOCR Server 服务
$ agentocr server
Python 调用
import cv2
import json
import base64
import requests
# 图片 Base64 编码
def cv2_to_base64(image):
data = cv2.imencode('.jpg', image)[1]
image_base64 = base64.b64encode(data.tobytes()).decode('UTF-8')
return image_base64
# 读取图片
image = cv2.imread('test.jpg')
image_base64 = cv2_to_base64(image)
# 构建请求数据
data = {
'image': image_base64
}
# 发送请求
url = "http://127.0.0.1:5000/ocr"
r = requests.post(url=url, data=json.dumps(data))
# 打印预测结果
print(r.json())
Jupyter Notebook:【快速使用】
更多安装使用细节请参考:【Package 使用指南】
多语言模型配置:
语言 | 缩写 | 检测模型 | 分类模型 | 识别模型 |
简体中文 | ch | ch_mul_m_det / ch_mul_s_det / ch_mul_v2_c_det(default) | ch_mul_m_cls(default) | ch_m_rec / ch_s_rec / ch_v2_c_rec(default) |
繁体中文 | cht | cht_m_rec(default) | ||
英文 | en | en_mul_m_det(default) | en_m_rec(default) | |
法文 | fr | fr_m_rec(default) | ||
德文 | ger | ger_m_rec(default) | ||
韩文 | kr | kr_m_rec(default) | ||
日文 | jp | jp_m_rec(default) | ||
卡纳达文 | ka | ka_m_rec(default) | ||
泰卢固文 | te | te_m_rec(default) | ||
泰米尔文 | ta | ta_m_rec(default) | ||
拉丁文 | la | la_m_rec(default) | ||
西里尔文 | cy | cy_m_rec(default) | ||
梵文 | de | de_m_rec(default) |
更多功能正在持续开发中,敬请期待:
PaddleOCR 识别模型字典优化
PaddleOCR v2 模型支持
中国车牌检测识别系统
PaddleOCR Structure 模型支持
GUI 图形界面
PaddleOCR -> ONNX 模型转换部署工具
多平台的可执行标注软件
Email : [email protected]
QQ Group : 1005109853