智能发票识别系统 Requirements tomcat服务器 eclipse mysql数据库 redis数据库 Function 自动归类识别机打发票中的发票信息 用户手动绘制用于识别的发票模板和识别区域 查看等待识别发票的任务缓冲队列 可视化发票识别算法的过程,动态展示当前识别的区域和结果 管理员可对系统平台内的用户、用户组进行权限编辑管理 单位负责人可修改使用系统平台的单位信息 个人设置可查看个人信息和权限 Details 前端 Jquery + bootstrap搭建前端框架,处理前端逻辑和展示,负责MVC架构中的View视图层 前后端通过websocket和ajax通信,ajax主要用于按钮等控件的事件处理函数中的请求,websocket用于后端主动向前端推送消息 JSP控制cookies和session,在页面跳转时记录会话用户态,并可通过前端可视化界面对用户权限(用户权限分为继承的用户组权限和个人权限)进行编辑 识别算法的可视化通过websocket实现,算法端将每个区域的识别结果通过后台服务器逐次转送给前端,前端在onmessage回调函数中处理信息并在可视化窗口的canvas画布中显示出来 通过画布的getImageData和putImageData获取图片的像素点,并制造模糊效果,对比突出当前的识别区域 Js + canvas实现用户动态画图的效果,可以在canvas画布中框出自定义的识别区域和填写区域信息 后端 Spring MVC + Spring + JDBC搭建后端框架,Controller负责接收请求,Service负责主要业务逻辑,Dao负责数据库访问 算法端用C++编写,java后端通过多线程+socket+TCP与算法端通讯,利用对象锁完成线程调度 利用redis实现缓冲队列以及模板操作调度队列 利用spring-websocket与前端进行全双工通信 使用shiro作为安全管理框架,通过其内置session实现安全登录,使用shiro注解完成权限管理。 算法端 使用Bag of Words + CNN完成票据分类,根据分类结果查询并获取相应的发票模板。 使用SIFT特征匹配和配准思路完成票据对齐 根据模板中信息区域坐标截取ROI,因为票据可能存在套打情况,故还使用了约束式ROI搜索算法对信息区域进行重定位。 对每个ROI进行去噪、去印章、去直线等预处理操作,并使用形态学处理得到目标文本信息的连通体的最小外接矩形,并将此区域送入OCR模块。 使用搭建好的基于深度学习的卷积神经网络进行文字识别,识别结果组装成协议格式,返回给后台。
2021-03-10 18:03:31 12.33MB java 发票识别 文字识别
图片、pdf自动识别文件
2021-02-23 12:02:14 18.05MB ocr
1
因为精力有限我准备的训练字库较少,你可以在压缩包train文件夹添加字库 。压缩包里面有个read me.txt里面有详细步骤。
2021-02-02 17:03:31 167KB MATLAB 文字识别 文字切割
python ocr识别文字识别图片百度ai.doc
2021-01-28 16:06:41 13KB python 文字识别 ai
1
C# 写的手写识别代码,功能很强大,本来以为只能识别单个的文字,这个代码可以识别一整行的文字。无论怎么写,都能识别。当然,要是能看懂的字才行。对文字识别的有兴趣的同学,可以下来看看,很不错。调用的Windows的文字库。所以,自己写代码很方便的
2020-01-18 03:40:52 432KB 手写识别 文字识别 人工智能
1
针对工作时识别图片上的文字,省时省力避免了一个个文字输入的窘境,
2020-01-03 11:26:55 1.86MB 识别文字
1
第一、支持语言:中英文、法语、俄语、葡萄牙、俄语、德语、韩语、日语这些需要更多的还可以加; 第二、PDF拆图:可以将多个PDF拆成图,分组存放指定文件夹、便于按文件夹批量导入图片等; 第三、图片压缩:图片太大影响识别,所以我们做了一个图片压缩的工具,可以将图片的范围控制在可识别范围;
2020-01-03 11:17:13 272KB 批量图片转文字
1
Java OCR 图像智能字符识别-文字识别Demo。能够识别中文
2019-12-24 03:08:27 49.04MB 文字识别
1
实现方法本人在至少5台不同类型的电脑测试无误。字体配好后,识别率为100%。具体流程见调用流程.docx
2019-12-21 22:07:11 6.49MB 大漠插件 c#
1
利用霍夫变换直线,检测出名片边界,计算倾斜角,对其校正,然后利用开源ocr库,对文字识别。
2019-12-21 21:59:41 11.21MB 文字识别
1