首页 >> 假山石

汉字识别软件OCR的应用二酒类电脑配件筛选设备电气柜轴流风扇Kf

文章来源:百辉机械网  |  2023-03-16

汉字识别软件OCR的应用二

1.图像处理模块

图像处理模块主要具有文稿扫描、图像缩放、图像旋转等功能。通过扫描仪输入后,文稿形成图像文件,图整形机像处理模块可对图像进行放大,去除污点和划痕,如果图像旋转不正,可以手工或自动旋转图像,目的是为文字识别创造更好的条件,使识别率更高。

2.版面划分模块

版面划分模块主要包括版面划分、更改划分,即对版面的理解、字切分、归一化等,可选择自动或手动如RTM和热成型两种版面划分方式。目的是告诉OCR软件将同一版面的文章、表格等分开,以便于分别处理,并按照怎样的顺序进行识别。

3.文字识别模块

文字识别模块是OCR软件的核心部分,简单的文字识别过程示意图,如下图所示。文字识别模块主要对输入的汉字进行“阅读”,但不能一目多行,必须逐行切割,对于汉字通常也是一个字一个字地辨认,即单字识别,再进行归一化。文字识别模块通过对不同样本汉字的特征进行提取,完成识别,自动查找可疑字,具有前后联想等功能。成型品的曲翘量降到了0.5mm以下

扫描输入的原稿→行切割→字切割→归化→识别特征提取→单字识别------┐

└-→预分类特征提取→特征库(字典)→输出原稿

4.文字模块

文字模块主要对OCR识别后的文字进行修改、,如系统识别认为有误,则文字会以醒目的红色或蓝色显示,并提供相似的文字供选择,选择器供输出等。

OCR软件的使用方法

基于电动机的特性 OCR软件的种类虽然很多,但其使用方法大同小异。首先要对文稿进行扫描,然后进行OCR识别。OCR软件的使用方法如下:

1.文稿扫描

为了利用OCR软件进行文字识别,可直接在OCR软件中扫描文稿。运行OCR软件后,会出现OCR软件界面。如使用中晶尚书OCR,就会出现如图3所示的视窗。

将要扫描的文稿放在扫描仪的玻璃面上,使要扫描的一面朝向扫描仪的玻璃面并让文稿的上端朝下,与标尺边缘对齐,再将扫描仪盖上,即可准备扫描。点击视窗中的“扫描”键,即可进入扫描驱动软件进行扫描,有关扫描方法这里不再赘述。但应注意的是:分辨力可设置在200~400dpi,对于文本文档,调整亮度适中很关键。扫描后的文档图像出现在OCR软件视窗中,如图4所示。

2.OCR识别

为了便于操作,可从菜单中选择选项,各种图标出现在视窗的左边,请参见图4。

为了更好使用,首先从上到下介绍画面左边的图标:

“放大”工具:用于放大图像;“缩小”工具:用于缩小图像;“设定识别区卷材域”工具:用于设定识别区域;“设定识别顺序”工具:用于设定识别顺序;“删除识别区域”工具:用于删除识别区域;“擦除图像杂点”工具:用于擦除图像中的某一区域;“旋转图像”工具:用于将图像旋转90°、180°或270°;“倾斜校正”工具:用于手动图像倾斜校正。

OCR识别的一般步骤:

(1)文稿扫描后,刚开始出现在视窗中的要识别的文字画面很小,首先选择“放大”工具,对画面进行适当放大,以使画面看得更清楚。必要时还可以选择“缩小”工具,将画面适当缩小。

(2)如果画面需要旋转90°、180°或270°,可使用“旋转图像”工具旋转图像。如果文字画面倾斜,可选择“倾斜校正”工具,将画面调正。

(3)识别时选择“设定识别区域”工具,在文字画面上框出要识别的区域,这时也可根据画面情况框出多个区域。如果所框区域有误,则可使用“删除识别区域”工具,删除所选识别区域。

(4)为了提高识别率,如果所选识别区有杂点或有不能识别的图像,则可选择“擦除图像杂点”工具,将杂点一点一点地擦除。如果需要成片地擦除,则可选择“擦拭图像块”工具。

(5)点击“识别”图标,则OCR显示正在进行文字切分,然后转入“正在识别”画面,将识别的文字逐步显示出来,再转入如图5所示起重工具的“文稿校对”窗口。

许多OCR软件都具有文字修改功能,被识别出可能有错误的文字,用比较鲜明的颜色显示出来,并且可以进行修改。

(6)将识别后的文件存储成文本(TXT)文件或Word的RTF文件。

口腔溃疡变大了是怎么回事
口腔溃疡的创面敷什么好
糖尿病眼病是什么原因造成的
过敏性荨麻疹能治好吗