基于 SPCE061A 的语音识别系统设计.doc
《基于 SPCE061A 的语音识别系统设计.doc》由会员分享,可在线阅读,更多相关《基于 SPCE061A 的语音识别系统设计.doc(5页珍藏版)》请在三一文库上搜索。
1、精品论文基于 SPCE061A 的语音识别系统设计魏韬,黄晓放 武汉理工大学信息工程学院,湖北武汉(430070) E-mail:B摘要:语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技 术。语音识别是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。介绍一种基于具有 DSP(数字信号处理器)功能的凌阳单片机 SPCE061A 的语音识别系统设计,它能完成针 对特定发音人的若干命令(特定的孤立词)的语音识别。本设计在具体实践时,在系统软件和硬件设计上强调简单实用的特点,简化系统结构,增强控制能力。 关键词:语音识别;SPCE061A;特定发音人1. 引言语音识别根据
2、实际需要和应用场合的不同,可以分为孤立词识别和连续语音识别、特定 人识别和非特定人识别 1-2。语音识别追求的主要指标为高识别率、实时性和大词汇量;而 对于一个语音识别系统,还应考虑软硬件设计简单、价格低廉、外围控制灵活、人机交互便 捷等特点。现在应用于语音识别的芯片主要为 DSP(数字信号处理器)芯片,如 TI 公司的 TMS320 系列。然而,将 DSP 芯片用于小型语音识别系统中,其不足之处是很明显的3:引 脚多,价格贵,使用繁琐;控制功能弱,常需要与单片机或 FPGA(现场可编程门阵列)结 合,来实现人机交互;常需要外接 A/D 转换芯片;引脚为 3.3 V;与单片机、FPGA、Fla
3、sh 存储器等连接时,要考虑电平匹配。这些将使整个系统结构庞大,设计繁琐。本设计采用具 有 DSP 功能并内置声音 A/D 转换器的凌阳单片机 SPCE061A,融合控制和 DSP 功能,使系 统大大简化4。现在语音特征的提取和识别方法很多,如隐马尔可夫法对非特定人连续语音 有很高的识别率1,但过程繁琐。本设计用线性预测系数等方法进行频谱分析,找出语音的 特征参数作为未知模式,接着与预先存储的标准模式进行比较,当输入的未知模式与标准模 式的特征相一致时,便被机器识别,产生识别结果输出。2. 语音识别原理语音识别电路基本结构如图 1 所示:图 1 语音识别电路基本结构语音识别分为特定发音人识别(
4、Speaker Dependent)和非特定发音人识别(SpeakerIndependent)两种方式。 特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较高,而- 5 -其他人的语音命令识别准确率较低或不识别。非特定发音人识别:是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音样板的提取非常重要。例 子程序就是采用特定发音人识别方式。我们将标准模式的存储空间称之为“词库”,而把标准模式称之为“词条”或“样板”。所谓 建立词库,就是将待识别的命令进行频谱分析,提取特征参数作为识别的标准模式。识别过程首先要滤除输入语音信号的噪音和进行预加重处理
5、,提升高频分量,然后用线 性预测系数等方法进行频谱分析,找出语音的特征参数作为未知模式,接着与预先存储的标 准模式进行比较,当输入的未知模式与标准模式的特征相一致时,便被机器识别,产生识别 结果输出。如果输入的语音与标准模式的特征完全一致固然好,但是语音含有不确定因素, 完全一致的条件往往不存在,事实上没有人能以绝对相同的语调把一个词说两遍,因此,预 先制定好计算输入语音的特征模式与各特征模式的类似程度,或距离度的算法规则固化在 ROM 中,把该距离最小,即最类似的模式作为识别相应语音的手段。当然,影响识别率的 因素还有一些,如连续发音(如英语)与断续发音(如汉语)的不同(二者区别在于单词间
6、隔有 200ms 以上的空隙时间)5。本设计程序采用特定人识别方式,将训练的标准样板存于内部 RAM 中(掉电丢失),每次上电复位后都要进行训练,用户可以扩展一块 FLASH,将训练的标准样板存于 FLASH, 这样就不需要在每次上电复位后再次训练。3. 硬件电路凌阳 16 位单片机 SPEC061 在片内硬件结构和指令系统上都非常适用于语音信号处理, 其主要的特点为:快速,多中断;多个 A/D 转换器,特别是具有内置传声放大器与自动增 益控制功能的单通道声道 A/D 转换器;具有音频输出功能的双通道 10 位 D/A 转换器。指令 系统增添了 DSP 功能,在不太复杂的数字信号处理应用上非常
7、便利,还比专用的 DSP 芯片 便宜得多。本设计的硬件结构是以凌阳单片机 SPCE061A 为核心、外围扩展相应功能硬件构成。 硬件电路比较简单,MIC 选用驻极体电容话筒,这种话筒具有灵敏度高、无方向性、重量 轻、体积小、频率响应宽、保真度好等优点,驻极体话筒的偏压由 SPCE061A 的 VMIC 管 脚提供5。整个系统的硬件结构框图如图 2 所示。4. 程序设计图 2 特定人语音识别硬件连接图程序包括三部分:训练样本、识别和语音提示。由于语音样本是存在内部 RAM 中,掉电将丢失,所以在每次上电复位时都必须重新训 练,训练过程主要是靠调用库函数 BSR_Train 来完成,为了防止误命令
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SPCE061A 的语音识别系统设计 语音 识别 系统 设计
链接地址:https://www.31doc.com/p-3625394.html