针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。
2022-03-21 18:11:01 589KB 论文研究
1
手写OCR 该项目试图创建用于识别照片中手写文字的软件(也适用于捷克语)。 它使用计算机视觉和机器学习。 并针对该问题尝试了不同的方法。 它最初是一个学校项目,我有机会在Intel ISEF 2018上进行了介绍。 程序结构 识别过程分为4个步骤。 初始输入是带有文字的页面照片。 检测页面并清除背景 单词的检测和分离 单词标准化 字符的分离和识别(单词的识别) 包含所有步骤的主文件是或 。 文件命名分步表示-机器学习模型的名称。 入门 1.克隆存储库 git clone https://github.com/Breta01/handwriting-ocr.git 下载仓库后,您必须下载数
2022-03-05 16:44:48 36.22MB python opencv machine-learning ocr
1
HandwritingTextRecognition-Pytorch:具有Pytorch和CTC丢失的手写文本识别
2021-11-17 10:11:48 442KB Python
1
基于高阶相关聚类的脱机手写文本行分割.pdf
2021-08-20 01:23:35 395KB 聚类 算法 数据结构 参考文献
Handwritten Text Recognition (HTR) system implemented with TensorFlow.
2021-05-15 16:02:55 18.16MB Python开发-机器学习
1
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。对210幅图片、2 563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。
1
针对维吾尔文手写体文本中行分割问题,本文基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,本文方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。
1