CGmatt的gravatar头像
CGmatt 2018-06-05 19:49:26

Java做OCR识别文字,汉字为什么百分之五十几乎乱码?

在学校很近的时间老师安排了一个OCR项目,也就是最近这一个月,用Java做OCR识别文字,汉字有百分之五十几乎乱码。截图忘记了截取,还有大神闲余时间上传个Demo吗,去下载钻研。狠心舍下牛币了~~~

请教下有没有类似的情况和解决方案

所有回答列表(4)
armedhh的gravatar头像
armedhh  LV6 2018年6月7日

你调用的是哪个OCR的SDK?

CGmatt的gravatar头像
CGmatt  LV9 2018年6月20日

谷歌开源tesseract-ocr。感觉一般,识别率就这样了

Ares_xue的gravatar头像
Ares_xue  LV6 2018年7月13日

谷歌开源的tesseract-ocr默认识别率很低的,正确的打开方式是进行神经训练(可以是机器或者人工,人工训练后的识别率一般就可以在90%以上了)

ps:吐个槽,做ocr识别为什么不用python而要用java

liu281337084的gravatar头像
liu281337084  LV2 2019年12月24日

开源的ocr识别,确实很次

顶部 客服 微信二维码 底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友