基频的后处理
创始人
2024-05-28 20:31:14
0

基频归一化

基频为什么要归一化?为了消除人际随机差异,提取恒定参数,在语际变异中找到共性。

引言

声调的主要载体就是基频。但是对声调的感知会因人而异,例如某个听感上的高升调,不同的调查人员可能会分别描写成 [24]、[25]、[35]。他们可能都对,因为声调描写中的这种不确定性实际上反映了两个基本事实:其一,不同的发音人可能有发音差别(甚至同一个人说两次都不一样);二,描写工具(五度制)本身并未对这些差异有精确定义。
但是,另一方面,这个语言信号,不管男女老少谁说,也不管是尖叫乱喊还是一字一顿,在听者耳中的语言内容是一样的。这说明在感知层面有不变的范畴存在,这种感知范畴有可能用作音韵学层面的对立特征。

归一化的主要目的就是消除人际随机差异,提取恒定参数,即滤掉个人特性,获得具有语言学意义的信息。
个人各自的归一化的物理含义就是以本人的频域作为坐标,以显示本人的各个声调在此空间中的分布。

基频归一化的作用:

  • 把对声调的感觉描绘建立在标准化的定量描写的基础上。
  • 减录音时的发音风格(正式、随意、紧张)差异。

方法

归一化一般有两个步骤,一是在坐标上作平移,一是压缩或扩大频域。基本公式如下:

在这里插入图片描述
线性法:z-score,频域分数,频域比例,
对数法:对数半音差比,对数z-score、对数频域比例

基频平滑

目前声调识别有很多方法,但一般都基于基音的轮廓信息。基音是指声带震动的基频,它是随着时间和发音高低而不断变化的。基音变化的不同轨迹也就是我们所说的声调。因此声调识别是以提取基音为基础的。在提取基音的过程中,无论采用哪一种方法提取的基音频率轨迹与真实的基音频率轨迹都不可能完全吻合。
实际情况是,大部分段落吻合,而在一些局部段落或区域中有一个或几个基频估值偏离甚至远离正常轨迹,这种情况我们称为基音轨迹产生了若干错误点,或称基频野点。这些错误点主要包括倍频点、半频点和随机错误点。为了去除这些野点,就需要对基频曲线做平滑处理。

常见方法:线性平滑、中值平滑、线性插值方法

相关内容

热门资讯

村口走来了一老一小两个人,老人... 村口走来了一老一小两个人,老人牵着小孩,小孩搀扶着老人,续写?村口的道路弯曲而宽阔,阳光洒在老人和小...
小猴子下山的故事寓意告诉我们什... 小猴子下山的故事寓意告诉我们什么道理,小猴子下山的故事寓意 做事应该1.小猴子下山的故事告诉人们人有...
为什么大家都说余华<兄弟... 为什么大家都说余华<兄弟>下写D不好呢?就是因为那些情节的描写么?我觉得没什么啊~写的又不是很深,都...
有一本网络小说的男主角叫李木,... 有一本网络小说的男主角叫李木,问一下书名和作者奇迹上面搜索 《侠客李木的一生》,仙侠类型,有点武侠的...
大学生创业开干洗店怎么样 加盟... 现在创业的很多,而大学生创业更是多,毕竟国家也在支持大学生创业,甚至还有大学生创业零利息贷款,这都是...
干洗加盟店年轻人创业的首选项目... 渠道建设全营销干洗加盟行业的年轻人如何赢得创业的首选项目呢?对于大学生来说,走出象牙塔的年轻人来说,...
适合山区的创业项目有哪些 适合...   适合山区的创业项目——新高山葡萄该品种为高山葡萄变异株中选育出来的新株系。目前农村种植什么最收益...
很多公司不要35岁以上的员工,... 很多公司不要35岁以上的员工,这是为什么?为了公司的效率考虑,一般人35岁以后精力跟不上公司的发展节...
100万钓具招商创业致富项目 ... 一、特色农家乐致富的好项目,伴随着生活水平的提高与交通条件的改善,郊区游越来越受到城市人的青睐,以“...
湖南千傲渔具有限公司让您轻松创... 钓具领域所显示的创业空间很巨大,市场备受关注和喜欢的品牌也有不少,投资者都想掌握好的创业项目,干一番...