搜索
您的当前位置:首页正文

基于图像处理的字符识别方法研究

2022-05-06 来源:步旅网
・教学实践探索・

DOI:10.16534/j.cnki.cn13-9000/g.2016.1641

基于图像处理的字符识别方法研究

山西大学商务学院信息中心  李彦飞

摘 要:伴随经济全球化、网络化时代的到来,当今人类社会发生了巨大的变化,人类社会已经跨入了信息时代,信     息产业的迅速发展改变了我们传统的信息交流模式。传统的靠邮政书信来进行信息通信的时代已经离我们远     去了,伴随的是利用网络进行交流,随着经济的快速发展、社会的不断进步,加速了信息传播的途径和方式,     而计算机的出现为现代信息时代的发展提供了便利和有效的处理手段。与此同时,伴随着信息技术的跨越式     迅猛发展,与此相伴的一些问题也相应地显露出来,例如,计算机数据处理和高速的网络传输与低速的网络     传输之间发展不协调的矛盾。在传统的办公方式上,多数信息是用文字或图像的形式借助纸质媒介记录下来,     但在当今信息化时代,如何把文字和图像转化为信息,提高文字与图像的识别率成为当今计算机科学界研究     的方向。因此通过对计算机图像处理及字符识别方法的浅析来研究基于图像处理的字符识别方法。关键词:图像处理 字符识别 印刷术体 手写体文章编号:ISSN2095-6711/Z01-2016-08-0163

一、图像处理技术的发展简析

计算机图像处理(Digital Image Processing)通常称之为数字图像处理,它具体是指图像信号转换成数字信号并利用计算机对其教学处理的过程。早在二十世纪五十年代就出现了数字图像处理这种计算机技术,当时的计算机技术水平与现在的计算机水平相比相对落后许多,但是人们开始利用计算机来对图像和图像信息进行处理。直到二十世纪六十年代初期,数字图像处理才作为一门大学科被社会广泛关注。早期的数字图像处理是以改善图像质量为目的,此技术以人为对象及改善人的视觉效果为目的。通常的在数字图像处理应用中,输入的是质量较差的图像而输出的是质量较高改善后的图像,图像增强、图像复原、图像压缩、图像编码等技术成为数字图像处理中常用的主要方法。1964年他们对航天探测器徘徊者7号传回的几千张月球照片利用了数字图像处理技术,利用此技术成功绘制出了月球表面地形图。1972年英国EMI公司工程师豪斯菲儿德发明了X射线被我们通常所说的CT英文名字为Computer Tomography被应用到各个行业,尤其在医学上应用最广。

二、字符识别研究现状分析

早在二十世纪五十年代的欧美出现了文字识别这个概念,1955年出现了印刷体数字(OCR)产品,在此后的不久转向了手写体英文和数字识别模式。IBM公司最早研究汉字识别系统,

并最早在1966年发表了一篇关于汉字识别的文章报道,应用板块匹配法识别上千个印刷体汉字,至此在全世界范围内兴起了汉字识别研究的热潮,揭开了汉字识别研究的帷幕。而最早在二十世纪七十年代中期的日本开始对手写汉字识别的研究。到目前为止,据不完全统计,对汉字识别研究的国家主要集中在亚洲,中、日、台、美、加等国家或地区。其中日本在该领域成效最好,最具代表性的所属日本东芝公司制造的手写印刷体汉字识别实验装置可识别两千多个汉字及其符合,还有日本NTT通信实验室推出的手写汉字识别实验装置,其最大的功能就是能够识别JIS等三千多个字符。日本经过多年对汉字识别的研究在手写汉字识别技术领域已经达到了世界领先水平。二十世纪八十年代开始相关汉字识别研究的文章相继在学术期刊中出现。

从汉字识别研究的纵向发展来看,我国手写汉字识别方面的研究一直处于发展和完善阶段,并逐步向汉字识别实用方向发展。目前,关于手写体汉字识别方面的研究重点集中在软件研制和方法实验方面,但在硬件专业设备的研究领域几经还处于空白状态。虽然印刷体汉字识别效率很高,但由于技术及设

备等多方面的因素原因,要想把该技术普遍推广还需要在提高算法的稳定性和抗干扰性方面做更多的研究。到目前为止已经过了几十年的汉字字符研究在特征提取、预处理、匹配及其处理等一些关键的环节距到实际应用这一步还有一段路要走。

三、数字字符识别技术的重要特点

1.印刷体字符识别技术的特点。印刷体的形状变法较小,不像手写体的变法巨大、随意。手写体因人而异每个人的写字风格都相差甚远,难寻规律,为此,识别起来难度就相对增大了许多。印刷体字符的字体种类较多,且新的字体还不断增加更新当中,就同一种字体的字符之间、笔画的粗细装饰、笔画的长短、位置等方面存在着较大的差异。

2.手写体字符识别的重点特征。手写体字符识别是模仿人工神经网络的原理,对手写体字符进行系统分析识别。

通常我们的书写,表现得比较单一,笔画的线条比较简单,但是线条不规律时长、时短,体现不规则,所以对于人们用肉眼都很难识别,对于机器来说就更难识别。研究手写体的字符识别系统是当前的一个具有较高难度的挑战。

四、图像处理技术

图像处理(Image processing)又被称之为影像处理,是指应用计算机对图像进行分析、加工以达到理想的图像效果的技术。图像处理技术一般包括图像的压缩,图像的增强和复原,匹配、描述和识别三个部分。

1.图像预处理。当前图像的格式较多,如有:BMP格式、PCX格式、GIF格式、JPG格式等。其中BMP格式是当今应用最广的一种格式。图像样本在其生成时,由于摄像头聚焦过程中技术问题带来的画面模糊、字符的新旧等诸多原因影响,导致采集的字符图像质量不高,甚至无法看清,如果不解决这一问题将直接影响使用的结果。在这种情况下,在识别之前,要进行必要的预处理操作,以期改善画面的质量,提高图像的分辨率。

2.图像的压缩。由于利用数字化的技术,一幅图像的数据相对来说比较大,如果不通过处理将很难用电脑或其他设备显示处理,打印比较困难。一般来说一幅普通的图像通常为500×500或者是1000×1000个像素组成的格式,对于一些动态的图像而言其所含的数据量就更巨大,为此图像压缩技术对于图像的处理与应用、存储和传输来说都十分有意义。通常图像压缩有两种形式,一种是无损压缩算法,另一种是有损压缩法。

3.增强复原。通常来说图像增强复原技术是为了改进图像的质量,一般的做法是增加对比度、增强照片的清晰度、增强

・163・

当代教育实践与教学研究

图像的亮度、去掉照片的模糊,修正几何畸变等方式,来增强图像的效果,使图像达到更加理想的效果。在现实的图像处理过程中常用的图像增强方法主要有以下四种:

(1)灰度等级直方图处理,该技术就是使处理后的图像在相关的灰度区域内体现出更强的画面对比度;使人的视觉不至于感觉疲劳和不清晰的感觉,让人耳目一新。

(2)干扰抑制图像处理,该技术是指通过低通滤波、多图像平均的技术手段使重叠的图像效果得以抑制换图像一新的效果。

(3)边缘锐化,该技术是指通过高通滤波技术使图像的边缘轮廓不至于模糊不清从而达到增强轮廓线的效果。

(4)伪彩色处理,将黑白图像转换为彩色图像,从而使人们易于分析和检测图像包含的信息。

图像复原技术是指在现有的图像中,通过计算机对图像进行估计原图的真实情况对现有图像进行技术处理的过程。图像复原技术可以使残缺的图像或照片通过该技术还原图像的本来情况。

五、结束语

二十一世纪是一个经济全球化、网络现代化、充满信息的时代,图像成为我们人类感知世界、认知世界的视觉基础,是人类向外界获取信息、表达信息和传递信息的重要载体和有效手段。数字图像处理技术自其诞生之日起到现在其发展历史也并不长是一种新兴的科技学科。数字图像处理技术源于二十世纪二十年代,当时通过海底电缆从英国伦敦到美国纽约传输了一幅照片,采用了数字压缩技术。图像的处理为如今的字符识别研究打下了坚实的基础,也为人类计算机信息化的时代的发展提供动力源泉。随着科技的迅猛发展,人类文明的不断提高,(上接第162页)

wealth,fame and so on.

该句中chase of material 为中式英语,此句建议改为people always focus on material pursue。

(8)名词错误

例1:Only in this way can we make more progress.

此句中名词单复数错误,progress应改为progresses。

例2:In my opinions,as a new ear of young people, we live with increasingly weather's around us.

此句固定用法错误,应将in one's opinions改为in one's opinion。

(9)形容词错误

例1:Compared with TV soap operas, sport events, and video games, classical literary works are old fashioned.该句中形容词误用,此处old fashioned建议改为out of date。

例2:May they have some good ancient traditions, but we will be not good.该句中搭配错误,建议将第二个good改为well。

三、教学策略

在本文实验研究中,通过对贵州理工学院非英语专业大学生英语写作过程中的常见错误这一实验结果的分析,启发了笔者对大学英语写作教学这门课程的反思以及思考在今后的教学中相应采取什么样的教学策略:

1.应改变传统“满堂灌”的教学方式,写作教学还是应该以学生为主体,让学生多加练习,学生在运用中才能更好地反馈其不足之处。通过练习,学生才能将所掌握的语言知识逐步转化为运用能力。

2.辅以语料库教学,使学生在写作练习中拓宽英语语言知识。传统写作教学受时间、人力、资源等多方面的限制,学生得以练习的机会较少且受知识水平的限制,学生不可能自主探究所有的语言现象,语料库在一定程度上弥补了这一不足。

在计算机信息化时代的带领下我们的生活将会更加便利。全面建成小康社会和实现中华民族伟大复兴的中国梦将不再是梦。参考文献:

[1]程 浩.基于虚拟仪器的字符图像识别系统研究[D].河北农业大学,2006

[2]钱 稷.基于图像处理的字符识别系统研究[D].河北农业大学,2007

[3]黄自力.场景文字定位方法研究及实现[D].电子科技大学 ,2014

[4]黄 佳.基于自然笔画拆分的手写文字识别方法[D].哈尔滨工业大学,2014

[5]戴 威.联机手写智能计算系统的研究[D].华北电力大学,2015

[6]张卫东.深度信念网络及其在手写字体识别中的应用[D].成都理工大学,2015

[7]谢建斌.基于书写过程计算结构的汉字书写自动教学[D].湘潭大学,2015

[8]李晓鑫.嵌入式平台下场景图片中文字定位与识别的实现[D].内蒙古大学,2015

[9]张靖娅.钢板点阵喷印字符识别方法研究[D].沈阳理工大学 ,2015

[10]孙向南.基于特征融合的笔迹鉴别技术研究[D].西安建筑科技大学,2015

作者简介:李彦飞(1980—),男,山西武乡人,山西大学商务学院信息中心,主要研究方向:实验实训管理、图像字符识别、多媒体教学

3.教学过程中努力引导学生加强自主学习能力,课下多扩充词汇量。词汇量是写作的基本条件,如果没有一定单词量的积累,学生无法完成一篇流畅易懂的文章。

4.积极为学生创设英语运用的语境,使学生学会灵活变换英语表达方式,即用不同的单词、短语和句子结构来表达同一个含义,摆脱以往作文练习过程中句子结构过于简单、行文单一、内容单调等不足。

四、总结

通过在线语料库对学生所提交的172篇作文出现的语言错误进行分析,笔者发现大学英语写作中学生的语言错误比较严重,句子不规范、动词错误、名词错误和中式英语等错误频率较高。这样的错误分析不仅有助于教师了解学习者第二语言的掌握程度及学习策略,而且有助于了解学习者共有的特点,对促进大学英语写作教学具有重要意义。此外,这种基于语料库的数据驱动学习为学生提供真实的学习环境和有效的探索语言的手段,大大提高了学生的学习自主性,从而改进写作教学的效果。参考文献:

[1]何 影.语料库在大学英语写作教研中的应用评析[J].黑龙江教育学院学报,2014

[2]叶翠英.语料库在大学英语写作教学中的应用研究[J].长春师范大学学报(人文社会科学版),2014

[3]张 英,雷 蕾.中国大学生语料库辅助外语写作态度调查[J].当代外语研究,2015

[4]刘 彬,戈玲玲,李广伟.基于语料库的大学英语写作教学平台建设及其模式研究[J].湖南第一师范学院学报,2013作者简介:吉胜芬(1987—),女,汉族,贵州遵义人,贵州理工学院大学外语教学部讲师,硕士研究生,主要从事英美现当代文学研究和英语教学;禄颖(1965—),女,彝族,贵州威宁人,贵州民族大学外国语学院副教授,主要从事英语教学研究

・164・

因篇幅问题不能全部显示,请点此查看更多更全内容

Top