对任何文字图片来源进行预处理结合tesseract-ocr进行识别,主要模块有纸张边缘查找,四角定位,仿射变换,二值化,模糊处理,摩尔纹处理,噪点过滤,图片exif,jfif信息处理,表格线删除,图片阴影处理,傅里叶图片矫正处理等等。。本程序依赖于与图片exif,jfif信息进行分类处理,传入时需带有信息
The image processing main program has three parameters.[original image][target image][debug parameter] Debugging parameters:
--resizeout to scale down the image.
--debug program debug mode.
Debug and output parameters are optional
You need to install opencv2.4or3.4 and spdlog
command:./imagebase testimg.jpg
Test Image 1:
result:
Test Image 2:
result: