起点作文网

识别技术范例(3篇)

时间: 2025-09-01 栏目:办公范文

识别技术范文

关键词:语音识别应用领域热点难点

中图分类号:TN912文献标识码:A文章编号:1007-3973(2010)03-062-02

1应用领域

如今,一些语音识别的应用已经应用到实际生活中,如IBM的Viavoice、Microsoft的SpeechSDK、Dragon公司的DragonDictate系统等。语音识别的应用领域非常广泛,几乎涉及到日常生活的方方面面。如语音拨号系统、、家庭服务、订票系统、声控智能玩具、医疗服务、银行服务、听写机、计算机控制、工业控制、语音通信系统等。预计在不远的将来,语音识别技术将在工业、家电、通信、、医疗、家庭服务等各个领域深刻改变人类现有的日常生活方式。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。

2发展历史

语音识别的研究工作开始于50年代,Bell实验室实现了第一个可识别十个英文数字的语音识别系统―Audry系统。但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。60年代,提出了动态规划(DP)和线性预测分析技术(LP),其中后者较好地解决了语音信号产生模型的问题,极大地促进了语音识别的发展。70年代,动态时间归正技术(DTW)解决了语音特征不等长匹配问题,对特定人孤立词语音识别十分有效,在语音识别领域取得了突破。在此期间还提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

80年代语音识别研究进一步深入,HMM模型和人工神经网络(ANN)在语音识别中成功应用。1988年,FULEEKai等用VQ/I-IMM方法实现了997个词汇的非特定人连续语音识别系统SPHINX。这是世界上第1个高性能的非特定人、大词汇量、连续语音识别系统。人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,并以此确定了统计方法和模型在语音识别和语言处理中的主流地位。使得借助人工智能中的启发式搜索和语音模型自身的特点,高效、快捷的算法使得建立实时的连续语音识别系统成为可能。

90年代,人们开始进一步研究语音识别与自然语言处理的结合,逐步发展到基于自然口语识别和理解的人机对话系统。人工神经元网络(ANN)也开始应用于语音识别,它和HMM模型建立的语音识别系统性能相当,在很多系统中还被结合在一起使用以提高识别率及系统的鲁棒性。小波分析也开始用于特征提取,但目前性能不理想,其研究还在进一步深入中。

现在语音识别系统已经开始从实验室走向实用,出现了比较成熟的已推向市场的产品。许多发达国家如美国、日本、韩国以及IBM、Apple、Microsoft、AT&T等著名公司都为语音识别系统的实用化开发研究投以巨资。

3研究的热点与难点

目前语音识别领域的研究热点包括:稳健语音识别(识别的鲁棒性)、语音输入设备研究、声学HMM模型的细化、说话人自适应技术、大词汇量关键词识别、高效的识别(搜索)算法研究、可信度评测算法研究、ANN的应用、语言模型及深层次的自然语言理解。

目前研究的难点主要表现在:(1)语音识别系统的适应性差。主要体现在对环境依赖性强。(2)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,必须寻找新的信号分析处理方法。(3)如何把语言学、生理学、心理学方面知识量化、建模并有效用于语音识别,目前也是一个难点。(4)由于我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等方面的认识还很不清楚,这必将阻碍语音识别的进一步发展。

4语音识别系统

一个典型的语音识别系统如图所示:

输入的语言信号首先要进行反混叠滤波、采样、A/D转换等过程进行数字化,之后要进行预处理,包括预加重、加窗和分帧、端点检测等。我们称之为对语音信号进行预处理。

语音信号的特征参数主要有:短时能量En,反映语音振幅或能量随着时间缓慢变化的规律;短时平均过零率Zn,对于离散信号来讲,简单的说就是样本改变符号的次数,可以粗略分辨清音和浊音;短时自相关函数;经过FFT或LPC运算得到的功率谱,再经过对数运算和傅里叶反变换以后得到的倒谱参数;根据人耳听觉特性变换的美尔(MEL);线性预测系数等。通常识别参数可选择上面的某一种或几种的组合。

语音识别是语音识别系统最核心的部分。包括语音的声学模型(训练学习)与模式匹配(识别算法)以及相应的语言模型与语言处理2大部分。声学模型用于参数匹配,通常在模型训练阶段按照一定的准则,由用语音特征参数表征的大量已知模式中通过学习算法来获取代表该模式本质特征的模型参数而产生。在识别(模式匹配)时将输入的语音特征同声学模型(模式)根据一定准则进行匹配与比较,使未知模式与模型库中的某一个模型获得最佳匹配以得到最佳的识别结果。语言模型一般指在匹配搜索时用于字词和路径约束的语言规则,它包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理则可以进行语法、语义分析。

声学模型是语音识别系统中最关键的一部分。目前最常用也最有效的几种声学识别模型包括动态时间归整模型(DTW)、隐马尔可夫模型(HMM)和人工神经网络模型(ANN)等。

DTW是较早的一种模式匹配和模型训练技术,它把整个单词作为识别单元,在训练阶段将词汇表中每个词的特征矢量序列作为模板存入模板库,在识别阶段将待识别语音的特征矢量序列依次与库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。DTW应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在小词汇量、孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已逐渐被HMM和ANN模型替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。HMM很好的模拟了人得语言过程,目前应用十分广泛。HMM模型的模型参数包括HMM拓扑结构(状态数目N、状态之间的转移方向等)、每个状态可以观察到的符号数M(符号集合O)、状态转移概率A及描述观察符号统计特性的一组随机函数,包括观察符号的概率分布B和初始状态概率分布,因此一个HMM模型可以由{N,M,A,B,}来确定,对词汇表中的每一个词都要建立相应的HMM模型。

模型参数得到后可以用Viterbi算法来确定与观察序列对应的最佳的状态序列。建好模型后,在识别阶段就是要计算每个模型产生观察符号序列的输出概率,输出概率最大的模型所表示的词就是我们的识别结果。这个过程计算量很大,有人提出了前向-后向算法,大大减少了计算量,已经被广泛采用,关于它们的各种改进方法也被大量提出。

ANN在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统,是由结点互连组成的计算网络,模拟了人类大脑神经元活动的基本原理,具有自学习能力、记忆、联想、推理、概括能力和快速并行实现的特点,同时还具备自组织、自适应的功能。这些能力是HMM模型不具备的,可用于处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,允许样品有较大的缺损、畸变,因此对于噪声环境下非特定人的语音识别问题来说是一种很好的解决方案。目前大部分应用神经网络的语音识别系统都采用了BP网并取得了较好的识别效果。

将ANN与HMM结合分别利用各自优点进行识别将是今后的一条研究途径。二者结合的混合语音识别方法的研究开始于上世纪90年代,目前已有一些方法将ANN辅助HMM进行计算和学习概率参数。

语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram模型基于这样一种假设:第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料库中统计N个词同时出现的次数得到。常用的是二元的Bi-Gram和三元的Tri-Gram。

5总结

尽管语音识别技术已经取得了长足的进步,而语音识别系统也层出不穷,不断的改变人类现有的生活方式,但其比较成功的应用也只是在某些特定的领域,谈不上大规模广泛的应用。只有建立从声学、语音学到语言学的知识为基础、以信息论、模式识别数理统计和人工智能为主要实现手段的语音处理机制,把整个语音识别过程从系统工程的高度进行分析构建,才有可能获得能与人类相比的高性能的、完整的计算机语音识别系统。

参考文献:

[1]易克初,田斌.付强.语音信号处理[M].国防工业出版社,2000.

[2]胡航.语音信号处理[M].哈尔滨工业大学出版社,2000.

[3]赵力.语音信号处理[M].机械工业出版社,2003.

识别技术范文篇2

关键字:车牌识别,模版匹配,神经网络,小波变换

Abstract:Withthedevelopmentofsocietyprogress,Licenseplaterecognitionhasgraduallybecomethedevelopmentofintelligenttransportationsystemanimportantpart,alsoisthechargingsystemtopreventanimportantmeansofcheating,butalsohighspeedsystemautomaticchargingsystemmustsolvethekeyproblem,themainpurposeistoextractimageautomaticlicenseplateimage,segmentationcharacterimage,realizeonlicenseinformationrecognitionandmatching.Itisnotonlyacomputervisionandpatternrecognitiontechnologyimportantresearchtopic,butalsointelligenttrafficmanagementoneofthekeytechnologies.Atpresent,thehomeandabroadhavedevotedtotheresearchofthisaspect,suchastemplatematching,neuralnetwork,wavelettransformandsoon,haveachievedgoodresults.

Keywords:Licenseplaterecognition,templatematching,neuralnetwork,wavelettransform

中图分类号:U412.36+6文献标识码:A文章编号:

1引言

随着高速公路系统新技术的高速发展,车牌识别技术已经成为交通应用方面的重要组成部分,切社会对其的应用也十分广泛,它不但在高速,隧道,桥梁等方面被广泛应用,而且也逐渐的被应用于小区,停车场等方面,也在电子警察和违章拍照方面做出较大贡献,介于车牌识别技术的广泛应用,越来越过的国家也都致力于对其的研究,同时也提出了一些较好的办法。但是,单方面而言其流程大概一致,关键差别在于前端采集系统图像的精度,和后端的算法处理。

2车牌识别系统的介绍

汽车牌照自动识别系统是智能交通系统的重要组成部分,是高科技的公路交通监控管理系统的主要功能模块之一。它在传统的交通监控技术的基础上,引入了数字摄像技术和计算机信息管理技术,采用先进的图像处理、模式识别和人工智能技术,通过对车辆图像的采集和处理,获得车辆的数字化信息,从而达到更高的智能化管理水平。它运用车牌是车辆身份的唯一标识的思想概念来智能识别和统计车辆,涉及图像的捕捉、处理、理解和记录等技术。其中车牌识别又可以依据针对的方向不同可以分为车辆图片识别,和视频车牌号识别,其中车辆图片识别主要针对单张图片进行抓拍处理,识别图片中的车牌号码,而视频车牌号识别则主要应用于高速公路收费,交通治安,闯红灯系统,小区或是停车场的监控系统中,两项程序都可以清晰的捕捉图像,并适用于win98,2000,XP,等系统,适用较为方便快捷,下图是车牌识别系统流程。

图1车牌识别系统流程

Fig1Licenseplaterecognitionsystemprocess

3图像字符分割

在车牌识别的整个过程中,为了达到字符识别的目标从提取的车牌图像中分割出字符的工作室必不可少的,阀值分割,目标与背景区别,车牌字符倾斜校正,单个字符切割以及字符的归一化都是图像字符分割的主要工作。

车牌图像阀值分割:阀值分割主要是基于像素的一种图像分割方法,主要目的是选择一个合适的灰度值T将图像所有的灰度值相比较,大于T和小于T的分别归类,在识别系统中图像经过预处理,质量有所提高,且背景干扰不严重我们通常使用最大类间方差法(Otsu法)进行分割其方法原理如下:

设数字图像的灰度级(G=1,2,…,L)处在灰度级i的所有像素用i表示,总的像素N可表示为:

设Pi表示图像中灰度级为i出现的概率,且定义为:

,

将图像中的像素按灰度级用阀值T划分为两类C0和C1,则两类出现的概率分布为:

有时,由于存在一些背景的干扰,用Otsu方法求得的阀值进行分割不能最好的起到保留车牌字符的效果所以根据调差发现对于车牌的定位,当在1.02~1.20时的分割效果比较好。

4结论

该技术已经越来越多的被应用在不同的场合,越来越体现出该技术在高速公路监控等系统中的重要地位,也是国内为很多公司都致力于这项技术的原因,目前对于车牌识别技术仍存在诸多问题,如:预处理过程中产生的误差,车牌定位及字符的分割及识别,没有用到车牌原有的颜色特征,都需要在研究的过程中进一步的加以改进。

识别技术范文

摘要:人脸识别技术是当今模式识别和人工智能领域的一个重要研究方向,对于维护国家安全和社会稳定、打击各类犯罪活动具有十分重大的意义。本文介绍了人脸识别技术的概念、发展历史及常用人脸识别方法。并探讨了人脸识别面临的难题,最后对人脸识别未来的发展和应用做一个简要的展望。

关键词:人脸识别;数字图像处理;特征脸

引言:人脸是人类视觉交互中最重要的模式,人脸识别技术(FRT)是模式识别和人工智能领域的一个前沿课题。在新兴的信息安全应用领域,人脸识别技术提供了一种更为安全可靠易用的身份鉴别手段,从而提升整个网络信息系统的安全性能。

1人脸识别技术概述

人脸识别技术就是通过计算机提取人脸的特征,并根据这些特征进行身份验证的一种技术。人脸与人体的其他生物特征一样与生俱来,它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。同其他生物特征识别技术相比,人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性.科技情报开发与经济,2008,18(21):155-157.

    【办公范文】栏目
  • 上一篇:财务风险控制的概念范例(3篇)
  • 下一篇:高等教育基本属性范例(3篇)
  • 相关文章

    推荐文章

    相关栏目