欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    基于 SPCE061A 的语音识别系统设计.doc

    • 资源ID:3625394       资源大小:148KB        全文页数:5页
    • 资源格式: DOC        下载积分:2
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要2
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于 SPCE061A 的语音识别系统设计.doc

    精品论文基于 SPCE061A 的语音识别系统设计魏韬,黄晓放 武汉理工大学信息工程学院,湖北武汉(430070) E-mail:B0207204137163.com摘要:语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技 术。语音识别是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。介绍一种基于具有 DSP(数字信号处理器)功能的凌阳单片机 SPCE061A 的语音识别系统设计,它能完成针 对特定发音人的若干命令(特定的孤立词)的语音识别。本设计在具体实践时,在系统软件和硬件设计上强调简单实用的特点,简化系统结构,增强控制能力。 关键词:语音识别;SPCE061A;特定发音人1. 引言语音识别根据实际需要和应用场合的不同,可以分为孤立词识别和连续语音识别、特定 人识别和非特定人识别 1-2。语音识别追求的主要指标为高识别率、实时性和大词汇量;而 对于一个语音识别系统,还应考虑软硬件设计简单、价格低廉、外围控制灵活、人机交互便 捷等特点。现在应用于语音识别的芯片主要为 DSP(数字信号处理器)芯片,如 TI 公司的 TMS320 系列。然而,将 DSP 芯片用于小型语音识别系统中,其不足之处是很明显的3:引 脚多,价格贵,使用繁琐;控制功能弱,常需要与单片机或 FPGA(现场可编程门阵列)结 合,来实现人机交互;常需要外接 A/D 转换芯片;引脚为 3.3 V;与单片机、FPGA、Flash 存储器等连接时,要考虑电平匹配。这些将使整个系统结构庞大,设计繁琐。本设计采用具 有 DSP 功能并内置声音 A/D 转换器的凌阳单片机 SPCE061A,融合控制和 DSP 功能,使系 统大大简化4。现在语音特征的提取和识别方法很多,如隐马尔可夫法对非特定人连续语音 有很高的识别率1,但过程繁琐。本设计用线性预测系数等方法进行频谱分析,找出语音的 特征参数作为未知模式,接着与预先存储的标准模式进行比较,当输入的未知模式与标准模 式的特征相一致时,便被机器识别,产生识别结果输出。2. 语音识别原理语音识别电路基本结构如图 1 所示:图 1 语音识别电路基本结构语音识别分为特定发音人识别(Speaker Dependent)和非特定发音人识别(SpeakerIndependent)两种方式。 特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而- 5 -其他人的语音命令识别准确率较低或不识别。非特定发音人识别:是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。例 子程序就是采用特定发音人识别方式。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“词条”或“样板”。所谓 建立词库,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。识别过程首先要滤除输入语音信号的噪音和进行预加重处理,提升高频分量,然后用线 性预测系数等方法进行频谱分析,找出语音的特征参数作为未知模式,接着与预先存储的标 准模式进行比较,当输入的未知模式与标准模式的特征相一致时,便被机器识别,产生识别 结果输出。如果输入的语音与标准模式的特征完全一致固然好,但是语音含有不确定因素, 完全一致的条件往往不存在,事实上没有人能以绝对相同的语调把一个词说两遍,因此,预 先制定好计算输入语音的特征模式与各特征模式的类似程度,或距离度的算法规则固化在 ROM 中,把该距离最小,即最类似的模式作为识别相应语音的手段。当然,影响识别率的 因素还有一些,如连续发音(如英语)与断续发音(如汉语)的不同(二者区别在于单词间 隔有 200ms 以上的空隙时间)5。本设计程序采用特定人识别方式,将训练的标准样板存于内部 RAM 中(掉电丢失),每次上电复位后都要进行训练,用户可以扩展一块 FLASH,将训练的标准样板存于 FLASH, 这样就不需要在每次上电复位后再次训练。3. 硬件电路凌阳 16 位单片机 SPEC061 在片内硬件结构和指令系统上都非常适用于语音信号处理, 其主要的特点为:快速,多中断;多个 A/D 转换器,特别是具有内置传声放大器与自动增 益控制功能的单通道声道 A/D 转换器;具有音频输出功能的双通道 10 位 D/A 转换器。指令 系统增添了 DSP 功能,在不太复杂的数字信号处理应用上非常便利,还比专用的 DSP 芯片 便宜得多。本设计的硬件结构是以凌阳单片机 SPCE061A 为核心、外围扩展相应功能硬件构成。 硬件电路比较简单,MIC 选用驻极体电容话筒,这种话筒具有灵敏度高、无方向性、重量 轻、体积小、频率响应宽、保真度好等优点,驻极体话筒的偏压由 SPCE061A 的 VMIC 管 脚提供5。整个系统的硬件结构框图如图 2 所示。4. 程序设计图 2 特定人语音识别硬件连接图程序包括三部分:训练样本、识别和语音提示。由于语音样本是存在内部 RAM 中,掉电将丢失,所以在每次上电复位时都必须重新训 练,训练过程主要是靠调用库函数 BSR_Train 来完成,为了防止误命令,每条语音命令训练2 遍,只有 2 次命令相同时才成功,BSR_Train 函数有 8 种可能的返回值:0-训练成功;-1-没有检测到命令;-2-需要再训练一次,每条命令训练 2 次,第一次训练成功则返回-2;-3-环境太吵;-4-存储器满;-5-两次命令不一样;-6-命令序号超出范围;-7-命令已存在; 训练成功则训练下一条,否则继续训练。 语音识别程序包括识别程序和中断服务程序。识别程序完成选取词库、初始化 A/D 和定时器 TimerA、识别运算及识别结果处理,流程如图 3。中断服务程序定时读取 A/D 转换结果, 并存入缓冲区,A/D 的输入为 MIC 通道的语音信号。语音识别和放音分时复用 TimerA FIQ中断,由标志位判断是语音识别处理还是放音处理。中断服务程序的流程图如图 4 所示:初始化A/D、定时器TimerA,FIQ中断调BSR_GetResult ()函数N函数返回 值 >0?Y识别结果处理图 3 特定人语音识别主流程图寄存器入栈TimerA FIQN中断?Y识别语音识别还放音 是放音?读取A/D结果 存入缓冲区从播放队列读取 数据送D/A转换寄存器出栈返回图 4 特定人语音识别中断流程图识别程序如下:BSR_InitRecognizer(BSR_MIC);/初始化识别器,包括 AGC、ADC、TimerAFIQ 中断while(1)res=BSR_GetResult();/主识别函数,识别成功则结果为语音命令的顺序号if(res>0)/结果>0,表明识别成功,相应处理中断服务程序如下:_FIQ:PUSHR1,R4 TO SP/寄存器入栈R1=P_INT_Ctrl/读中断标志位R1&=0x2000JZFIQ_ret/不是 TimerA FIQ 中断R1=_glsStopRecog JNZ TimerA_is_S480TimerA_is_Recognize:/TimerA FIQ 为语音识别服务call_BSR_FIQ_Routine/语音识别服务函数JMP FIQ_retTimerA_is_S480:/TimerA FIQ 为放音服务CALL F_FIQ_Service_SACM_S480;/放音服务函数FIQ_ret: R1=0xa800;P_INT_Clear=R1;/清中断标志POPR1,R4FROM SP;/寄存器出栈reti;5. 结束语本设计采用性价比较高的凌阳单片机 SPCE061A 作语音识别处理器,硬件电路简单, 控制灵活,人机交互好;选用适合特定发音人孤立词识别的语音特征和识别方法,处理速度 快,识别率高,可完成实时语音识别的需要。同时,设计中还特别注意开放性和推广性,使 用者可以根据自己的需要改变应答反应(包括语音输出和控制输出),经多个模拟试验能满足 特定的需求。参考文献1 胡航. 语音信号处理M. 哈尔滨:哈尔滨工业大学出版,2000.2 王炳锡,屈丹. 实用语音识别基础M. 北京:国防工业出版社,2005.3 俞斌.一种基于 DSP 的中文语音合成系统设计EB/OL. http:/www.icembed.com/info-14028.2007-02-08. 4 董晓宁,张萌. 基于凌阳单片机的语音识别系统设计J.电子工程师,2008,Vol34,No2:18-21.5 罗亚非. 凌阳十六位单片机应用基础M. 北京:北京航天航空大学出版社,2005.Design of Speech Recognition System Based on SPCE061AWeitao, HuangxiaofangDepartment of Information engineering Wuhan University of Technology, HuBei wuhan (430063)AbstractThe Speech Recognition is a technology, which make the machine change the speech signals intohomologous text or order by recognition and comprehend. The speech recognition is a cross-subject, and it is becoming to the key-technology of human-computer interface in information technology. This paper introduces the design of speech recognition system based on the Lingyang single chip SPCE061A with DSP function, which can accomplish the speech recognition for several orders, namely isolated words, and for special speaker speech. In the practical process, it stresses simple and practical characteristics in the software and hardware design, simplifies the system structure and strengthens the control capacity.Keywords: speech recognition; SPCE061A; special speaker speech

    注意事项

    本文(基于 SPCE061A 的语音识别系统设计.doc)为本站会员(李主任)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开