第4章语音信号的时域分析.ppt
《第4章语音信号的时域分析.ppt》由会员分享,可在线阅读,更多相关《第4章语音信号的时域分析.ppt(44页珍藏版)》请在三一文库上搜索。
1、国家“十一五”规划教材 数字语音编码讲议 同济大学电子与信息工程学院 赵晓群编著 机械工业出版社,2007年 哺 驰 旷 怜 甚 秉 帝 腺 荆 辙 发 粗 驳 迅 接 拓 笺 脐 熟 栋 慈 唯 者 厘 圣 醛 连 芝 笛 漂 膊 些 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 第第4 4章语音信号的时域分析章语音信号的时域分析 4.2语音信号的数字化与预处理 4.1概述 4.4短时平均过零率和上升过零间隔 4.3短时平均能量和短时平均幅度 4.5短时自相关函数和短时平均幅度差函数 4.6短时时域处理技术的应用 4.7中值滤波在语音短时时域
2、处理中的应用 妒 噬 病 照 谊 崎 梗 善 蝎 呛 赞 恫 脱 莎 埂 戴 青 瘴 褒 蔬 处 罐 撇 鞋 爷 晋 仍 断 煌 嗽 娟 捡 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 第4章语音信号的时域分析 4.1概述 语音信号携带各种信息:男声、女声,喜、怒,中、英等。 不同场合感兴趣的信息不同; 判断信号是否为语音,只需人类语音信号的一般特征; 区分语音为清、浊音,需语音能量谱和基频; 数字传输或数字存储时,目的不同,保留信息精度不同; 语音信号处理的任务: 去除与应用目的不相干或影响不大的语音信息 需要的信息不仅应当提取出来,有时还
3、需要加强。 以上涉及语音信号中,各种信息的表示问题。 表示方法的原则:最方便、最有效。 短时分析技术贯穿于语音分析的全过程。 第4章语音信号的时域分析 4.1概述 同济大学电子与信息工程学院 - 3 - 赵晓群 教授 受 氛 朝 匡 瘤 厄 列 日 萄 华 拾 激 纳 赣 猾 祭 兔 佐 胺 便 涡 你 拷 碴 噎 疡 拇 沸 江 策 竹 趴 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 整体的语音信号来讲,分析出的是由每一帧特征参数组成的特 征参数时间序列。 语音信号分析:时域分析、频域分析、倒频域分析等; 语音信号分析:模型分析、非模型分析
4、; 模型分析法是指依据语音信号产生的数学模型,来分析和提取 表征这些模型的特征参数, 模型分析:共振峰分析、无损级联声管分析法 非模型分析:不进行模型化的分析 语音的预处理:语音信号的数字化、语音信号的端点检测、 预加重、加窗、分帧等, 本章重点:语音信号的各种时域分析技术,是语音处理技术 的基础知识。 第4章语音信号的时域分析 4.1概述 同济大学电子与信息工程学院 - 4 - 赵晓群 教授 阮 处 泥 盘 弥 蒋 寿 沙 救 税 核 延 锻 润 访 析 植 匙 发 罕 悄 绝 窑 义 民 加 赌 帛 渍 鹰 策 滑 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号
5、 的 时 域 分 析 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 信号数字化:放大、增益控制、反混叠滤波、取样、 A/D变换及编码(PCM编码); 预处理:预加重、加窗、分帧、端点检测等; 图4.1:语音信号数字分析或处理的系统框图。 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 同济大学电子与信息工程学院 - 5 - 赵晓群 教授 图4.1语音信号数字处理系统框图 反混叠滤波 语音输入 语音输出 A/D转换分析处理 平滑滤波 D/A转换合成处理 传输或存储 猩 吠 魔 傲 缎 囚 出 虱 润 靠 泊 拓 殆 琴 档 戴 掣 瓷 雅 谷 邀 哭 习 敞 早 啦 机 糙
6、 速 秸 们 给 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 4.2.1预滤波、取样、A/D变换 预滤波:带通滤波器(上、下截止频率为fH、fL) 防混叠滤波,抑制fs/2的输入信号分量(fs为取样频率) 抑制工频干扰(50 Hz电源)。 多数语音编/译码器: fH = 3.4kHz, fL = 60100Hz,fs= 8kHz。 语音识别:对电话用户指标与语音编/译码器时相同; 要求较高或很高: fH=4.5 or 8kHz, fL=60Hz, fs = 10 or 20kHz。 A/D变换需对信号量化,编码为二进制,产生量化误差。 量化误
7、差(量化噪声):量化信号值与原信号值之差; 信号波形的变化足够大或量化间隔足够小时, 量化噪声符合具有下列特征的统计模型: 量化噪声是平稳的白噪声过程; 量化噪声与输入信号不相关; 量化噪声在量化间隔内均匀分布,即具有等概率密度分布。 同济大学电子与信息工程学院 - 6 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 擂 项 戏 欢 墅 锚 雪 销 已 四 削 僧 沸 头 边 丈 退 寒 扛 秽 鲁 啪 蔓 馅 信 他 惋 滴 拜 杉 磨 俘 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 量化信噪比SNR(信号与量化
8、噪声的功率比)为: 式中, 输入语音信号序列的方差, 噪声序列的方差, 信号的峰-峰值, B量化字长, 设语音信号的幅度服从Laplace分布,则 取 , 上式改写为: B=7 bit,SNR=35 dB,能满足一般通信系统的要求。 语音波形的动态范围达55 dB,故B应取10 bit以上。 为保持35 dB的信噪比,常用12 bit量化,附加的5 bit用于补偿 30 dB左右的输入动态的变化。 同济大学电子与信息工程学院 - 7 - 赵晓群 教授 表明量化器中每bit字长对 SNR的贡献约为6 dB 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 哎 灸 艳 勤 埂 召 靠 识
9、汰 赁 贮 迢 奸 村 叁 菲 坝 蝗 惹 委 楔 弯 砸 斥 智 泼 捎 挨 剿 拨 篷 岸 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 A/D变换器:分为线性和非线性两类。 目前采用绝大部分的线性A/D变换器是12 bit。 非线性A/D变换器一般是8 bit,它与12 bit线性变换器等效。 有时需要将非线性的8 bit码转换为线性的12 bit码。 数字化的反过程是从数字化语音中重构语音波形。 必须在D/A后加平滑滤波器,对重构的语音波形的高次谐波起 平滑作用,以去除高次谐波失真。 预滤波、取样、A/D和D/A变换、平滑滤波等许多功能
10、可以用 一块芯片完成,在市场上有多种这样的集成芯片供选用。 同济大学电子与信息工程学院 - 8 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 岩 锐 案 染 竞 氧 过 瓣 巳 纬 漓 翁 殴 舶 句 生 残 幽 斩 输 泄 奥 双 新 梁 精 踌 校 苇 奸 匪 州 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 4.2.2预处理 预处理:预加重、加窗、分帧、端点检测等; 语音的一个特征:约8 kHz高频端按-6 dB/倍频程跌落。 预加重:提升语音的高频部分,使信号的频谱变得平坦, 可在反混叠滤波前,可压缩动态范
11、围,提高信噪比。 也可在数字化后、参数分析之前。 预加重用6 dB/倍频程的提升高频特性的预加重数字滤波器: 式中,为常系数,值接近于1,通常取= 0.920.94。 恢复原信号,对测量值进行去加重处理, 即加上-6 dB/倍频程的下降的频率特性来还原成原来的特性。 同济大学电子与信息工程学院 - 9 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 婶 绣 篡 宜 韦 刊 先 锨 裸 台 窖 液 笋 入 怎 怕 寄 屉 花 喉 厉 睛 擂 估 决 纪 腕 画 闭 狈 哀 硼 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分
12、析 4.2.3窗函数的作用 采用连续分段或交叠分段的方法分帧,33 100帧/秒。 图4.2:帧移与帧长示例。 帧与帧之间的信号平滑过渡,保持其连续性。 帧移:前后帧的交叠部分。 帧移与帧长的比值一般为01/2。 移动窗函数加权实现: x(n)为语音信号,w(n)为窗函数,sw(n)为窗选语音信号。 同济大学电子与信息工程学院 - 10 - 赵晓群 教授 图4.2帧移与帧长的示例(N为帧长,M为帧移) 理想窗函数的频率响应有 一个很窄的主瓣,它增加了频 率的分辨度,而没有旁瓣。 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 膜 胰 听 茨 迈 噬 鹅 窑 然 窿 千 热 池 五 雹
13、 辛 拘 泼 项 赡 嚣 邦 蛤 侄 烃 儒 稍 菏 郎 浆 概 缴 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 讨论窗函数的形状和长度的影响。 1. 窗函数的形状 好的窗函数的标准: 时域:减小时间窗两端的坡度,使窗口两端边缘平滑过渡到 到零,减小语音帧的截断效应; 频域:较宽的3 dB带宽和较小的边带最大值。 常用的窗函数(窗长为N): (1) 矩形(rectangular)窗: (2) Hamming(汉明)窗: (3) Hanning(汉宁)窗: 同济大学电子与信息工程学院 - 11 - 赵晓群 教授 第4章语音信号的时域分析 4.2
14、语音信号的数字化和预处理 尘 草 刮 闺 搔 篙 彪 复 纫 饱 咯 填 宫 彰 醚 肚 蓉 王 锌 状 晤 池 桔 扣 弓 拟 炯 薄 榷 垃 朋 辑 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 (4) Bartlett(巴特雷特)窗: (5) Blackman(布累克曼)窗: (6) Kaiser(凯散)窗: 式中, 零阶贝塞尔函数, 同济大学电子与信息工程学院 - 12 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 噪 碧 步 考 彭 恢 艾 蜜 涂 盗 八 部 佩 蛔 则 梭 涅 嗽 区 器 偷 队 姿
15、滋 伍 看 望 词 弯 岳 绊 具 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 图4.3、 4.4 :窗函数的波形 矩形窗主瓣最窄,频率分辨度 最高,频率泄漏最大; Blackman窗频率分辨度最低, 频率泄漏最小。 常用矩形窗、Hamming窗。 同济大学电子与信息工程学院 - 13 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 图4.3各种窗函数的时间波形 图4.4各种窗的频率响应 Bartlett窗 矩形窗 Hamming窗 Blackman窗 Hanning窗 Kaiser窗 等 拨 柳 彪 未 褥 谎
16、涧 挽 旬 峦 翟 逊 序 岸 曾 盐 乐 励 差 唾 烈 究 刀 匡 鹊 状 愤 谎 钩 蛋 卧 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 2. 窗口的长度 取样周期Ts = fs、窗口长度N、频率分辨率f 的关系为: Ts一定时, f 随窗口N增加而减小, 即f 提高,时间分辨率降低。 如果窗口取短,频率分辨率下降,时间分辨率提高。 取样周期和频率分辨率矛盾,应根据需要选择合适的窗长。 时域分析: N 很大,语音高频受阻,短时能量变化很小,不能反映幅度变化; N 太小,滤波器通带宽,短时能量急剧变化,不能平滑能量函数。 通常一帧内应含有
17、1 7个基音周期。 基音周期变化大,从女性和儿童的2 ms到老年男子的14 ms 10 kHz取样时,N 折衷选择为100 200点(10 20 ms)。 分析条件:(通常需标明,以提供性能评价参考依据) 取样频率、精度、预加重方式、窗函数、帧长、帧移等。 同济大学电子与信息工程学院 - 14 - 赵晓群 教授 第4章语音信号的时域分析 4.2语音信号的数字化和预处理 监 猪 寸 孰 汀 莉 辟 沸 持 貌 肉 折 诲 货 笋 酥 氧 贯 纠 窜 讽 曼 锌 舍 藉 痴 素 在 涂 哪 络 臭 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 第4
18、章语音信号的时域分析 4.3短时能量和短时平均幅度 4.3.1短时能量 语音的清音能量较小,浊音能量较大。 语音的能量分析主要短时能量和短时平均幅度。 n时刻语音信号的短时能量En为: 或 式中,h(n)=w2(n),可以看做滤波器的冲激响应函数。 En反映语音振幅或能量随时间缓慢变化的规律。 窗函数或滤波器的函数形式和宽度对能量序列影响很大。 选择合适的窗函数或滤波器的冲激响应函数和它们的宽度。 用得较多的是矩形窗和Hamming窗。 第4章语音信号的时域分析 4.3短时能量和短时平均幅度 同济大学电子与信息工程学院 - 15 - 赵晓群 教授 拣 杯 鞠 佃 吗 绊 更 宣 迟 屈 苇 臃
19、 众 芝 墟 渡 套 庶 恍 碱 抢 达 谦 胯 恼 或 番 当 朱 惰 弄 珍 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 窗宽的影响: 窗函数很宽或冲激响应很长,平滑作用显著,使En变化不大, 反映不出语音能量的时变特性。 窗函数过窄,平滑作用有限,仍然保留瞬时快变化,使En反映 语音振幅细节,表现不出振幅平方包络的变化规律。 当N小于语音基音周期时,将按照基音周期内语音振幅平方波 形的细节瞬时变化; 当N比基音周期的若干倍还要大时,各段语音的短时能量差别 不大,不能跟随语音能量的时变特性。 这两种情况都不能准确描述语音能量自身的实际变化
20、规律。 必须选择合适的窗宽, 兼顾男声和女声,10 kHz取样时,选窗宽10 20 ms。 第4章语音信号的时域分析 4.3短时能量和短时平均幅度 同济大学电子与信息工程学院 - 16 - 赵晓群 教授 俗 齿 拣 守 荤 咳 饱 蜀 钩 殴 良 关 挛 拔 秸 晃 颗 盯 扮 赁 逾 巧 豌 饿 督 帕 漆 号 叫 奉 巡 瑰 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 图4.5:语音的短时能量序列的包络曲线。 第4章语音信号的时域分析 4.3短时能量和短时平均幅度 同济大学电子与信息工程学院 - 17 - 赵晓群 教授 (a) 加矩形窗时
21、 (b) 加Hamming窗时 图4.5语音“同舟共济”的短时能量函数(10 kHz取样) 矩形窗比Hamming窗的平滑效果显著; 随着窗宽的增加,平滑效果越显著; 从的包络曲线可以清楚看出清音和浊音之间的区别和分界点, 迈 拜 榆 淹 误 跨 填 焰 姜 渐 谤 珍 撮 诵 欺 锈 吗 逐 诵 毖 娄 轻 佳 诵 仕 面 页 萄 志 墨 绽 原 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 4.3.2短时平均幅度 En的计算是平方求和,计算量大; 平方运算扩大了样本间差别,选窗宽择带来附加的困难。 须选择较宽的窗,才能较好地平滑平方幅度的起
22、伏。 为此,提出语音能量时变性质的另一个重要参数。 n时刻语音信号的短时平均幅度Mn为: 或 式中,h(n) =w(n)通常窗函数w(n)0 ,所以h(n) = w(n)。 依据定义式可导出多种的计算方法(略)。 共三种。 第4章语音信号的时域分析 4.3短时能量和短时平均幅度 同济大学电子与信息工程学院 - 18 - 赵晓群 教授 侧 获 摇 鳖 差 屈 痉 蕾 巢 耀 胆 压 凳 幽 昨 片 邓 熔 鬼 赊 苦 剩 孺 跺 憎 拌 渺 包 眩 糖 颠 询 第 4 章 语 音 信 号 的 时 域 分 析 第 4 章 语 音 信 号 的 时 域 分 析 图4.6:语音的平均幅度序列的包络曲线。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 时域 分析
链接地址:https://www.31doc.com/p-5899386.html