实验语音学常用软件入门•Praat辅音格局

技术

290

2023-11-23

tips:<info> 声明

本文“操作步骤”部分内容基于软件“Praat汉化修改版4.5”（Paul Boersma & David weenink 开发，贝先明和向柠修改）相关课程的教学内容，其余内容为笔者构思、撰写与引用。本文仅用于个人学习交流目的，不可用于商业用途。如有任何侵权行为，或本文中的任何内容侵犯了原软件作者的版权，请在第一时间告知作者，我将立即采取措施解决。本文采用CC BY-NC-SA 4.0许可协议。你可自由分享、演绎，但需署名、非商业使用，并以相同许可协议分享演绎作品。

理论基础

辅音的语图特征

辅音的发音方法和声源的性质密切相关，方法的不同只不过是三种声源(浊音、紊音、瞬音)的不同或组合方式的不同。三种声源在语图上表现为三种截然不同的纹样:

1.冲直条

瞬音在语图上的表现。瞬音是突然爆发成声，一发即逝的，时间一般只有10毫秒左右，在语图上表现为一条细窄的垂直尖线条。

2.乱纹

紊音在语图上的表现。紊音是摩擦成声、可以延续的噪音段，在语图上表现为一片杂乱的竖线纹样。

3.横杠

浊音在语图上的表现。发浊音时声带颤动，产生周期波，在语图上表现为横杠。

辅音的语图细节还有很多，从而可以分析更详细的音值类型，本文在此不作过多扩展，有意向可拓展阅读。

塞音的声学参量

塞音本身的声学参量主要有两个。

一是塞音的闭塞段，即发音时塞音除阻之前的持阻阶段，此时声道完全关闭，从听觉上说是无声的，在语图上表现为空白段（GAP），或称无声段。
二是塞音发音时声带的振动情况。塞音发音时声带可以在除阻之前开始振动，还可以在除阻时开始振动，也可以在除阻之后一段时间才开始振动。声带相对于塞音除阻振动的早晚在声学分析上用嗓音起始时间（voice onset time，VOT） 来表示。除阻的时间点为 0，在此点之前为负值，之后为正值。

嗓音起始时间”(Voice Onsct Time)，简称VOT。 嗓音起始时间主要是指塞音除阻和声带颤动之间的时间关系，它能比较精确地说明塞音的清浊和送气的情况，可以用下图说明。图中将除阻的时间点设为0，0之前的时间为负值，0之后的时间为正值，时间以毫秒(ms)计算。发音器官在0前两条线靠拢，表示发音器官的主动部分和固定部分形成阻碍，是发音的持阻阶段；0后两条线分开，表示除阻之后阻碍完全解除。图下部的五条线代表VOT的五种情况，直线部分表示声带未颤动，波形线部分表示声带颤动。

“(1)全浊音”和“(2)半浊音”都是除阻以前的一段时间声带就开始颤动，VOT<0;

“(3)不送气清音”是除阻时声带立即颤动，VOT=0;

“(4)弱送气清音”和“(5)强送气清音”都是除阻以后的一段时间声带才开始颤动，VOT>0。

假定某一塞音在除阻之前50毫秒声带就开始颤动，VOT=-50ms，那么它就是浊塞音；在除阻时或除阻刚结束不久声带就开始颤动，VOT=0或略大于0，那么它就是不送气清塞音；在除阻之后50毫秒声带才开始颤动，VOT=50ms，就是送气清塞音。浊音和送气的程度又可根据VOT的大小分为全浊、半浊和弱送气、强送气。
不同语言或方言的浊音起始时间有一定的差异，甚至个人之间也会有一些区别。英语的浊塞音比法语的VOT起点迟，接近于半浊音甚至不送气清塞音;苏州话单音节浊塞音“清音浊流”的VOT实际上是正值并不是真正的浊音。汉语不送气清塞音VOT起点迟，数值大，英语略早一些，俄语起点更早，数值最小。这些区别可以说明各语言的不送气清塞音并不完全相同，从语图上是可以比较准确地测量出来的。
——林焘王理嘉, 语音学教程（增订版）, 2013

闭塞段是塞音的重要声学特征，正是因为有了闭塞段才有塞音的名称。嗓音起始时间是指塞音除阻爆发跟声带开始振动二者之间的相对时间关系。浊音起始时间对于区分不同类别的塞音是一项有效的参量。

擦音的声学参量

擦音靠摩擦的方法发音，一般都具有较长的时长。和短暂的塞音相比，擦音的频谱能够相对容易地考察到。

Praat汉化版选取了频谱重心(center of gravity)、分散程度(dispersion)两个参量进行考察。

频谱重心(center of gravity，COG)：用于描述声音的频率分布情况。频谱重心反映了声音的频率分布集中程度，可以用来区分不同的语音或声音。
在擦音中，擦音的产生涉及到空气流经过狭窄的通道，产生噪声。擦音的频谱重心可以提供有关噪声分布的信息。具体来说，擦音频谱重心越高，表示高频分量的能量占主导地位，擦音听起来就越尖锐。反之，频谱重心较低可能意味着擦音中包含更多的低频分量，听起来可能更加圆润。
分散程度(dispersion，DIS)：是描述声音频谱特征的另一个参数。它用于衡量擦音声音中频率分量的分散程度或集中程度。分散程度反映了声音中不同频率成分的分布，即这些频率成分在频谱中是分散开还是集中在一起。
在擦音中，分散程度通常指的是擦音频谱中各频率分量的离散程度。如果频率分量分散开，分散程度就较高；如果频率分量集中在某个区域，分散程度就较低。

塞擦音的声学参量

一般认为，塞擦音同时具有塞音和擦音的声学特征，所以对于塞擦音的声学参量，也是现将其分为“塞”的方面和“擦”的方面分别提取，从塞擦音的时长性质、摩擦段状态两大方面来提取塞擦音的声学参数。

空白段（GAP）
摩擦段时长( duration of friction，DOF)
频谱重心(center of gravity，COG)
分散程度(dispersion，DIS)

对塞擦音的声学分析是从其“塞”和“擦”两个部分进行的，分别得到了塞擦音时长对比和摩擦状态两个格局图。事实上塞擦音作为一个整体，应该将两个格局图整合起来进行考察。由于无声闭塞段与有声摩擦段、谱重心与分散程度往往呈现不同程度的反比关系 ( 参看冯隆，1985; 石锋，1990; 冉启斌，2005) ，因此我们使用求比值的方法将无声闭塞段与有声摩擦段数据整合为塞擦音时长性质指数; 将谱重心与分散程度数据整合为摩擦性质指数。这两种指数的具体整合方法如下:

塞擦音时长性质指数( Duration Index，DI) : DI = DOF / GAP

塞擦音摩擦性质指数( Friction Index，FI): FI = COG / DIS

上述公式的意思是说，对于塞擦音的时长性质，以有声摩擦段 (DOF)与无闭塞段(GAP)之比作为时长性质指数(DI) ; 对于塞擦音的摩擦段性质，以谱重心(COG) 与分散程度 (DIS) 之比作为摩擦性质指数(FI) 。
对于 DI 指数而言，比值越大表明有声摩擦段越长，无声闭塞段越短; 比值越小表明有声摩擦段越短，无声闭塞段越长。对于FI指数而言，比值越大表明谱重心越高，分散程度越小; 比值越小表明谱重心越低，分散程度越大。
———— 冉启斌. 北京话塞擦音的声学格局分析[J]. 中国语文, 2017(4): 459-467+511-512.

简言之，在操作上，塞擦音格局需要提取四个参数，通过四个参数算出两个指标。

实验材料与工具

录音材料：因为塞音和塞擦音的测量指标涉及gap段，所以在目标塞音字之前前需要加入音节，形成二字组。擦音则只测量单字音频即可。
Praat汉化修改版4.5（Paul Boersma & David weenink）开发，贝先明和向柠(2020)修改）

操作步骤-塞音格局

提取数据（GAP、VOT）

打开 praat 软件，点击 打开→从文件读入…，将音频文件读入（可一次读入多个文件），选中某个文件，点击右侧 查看与编辑，之后会弹出语图页面。
选取无声段，即前一个音节结尾到冲直条（清塞音）。点击 语图→测量塞音时长，在弹出框输入音标即可：
弹出窗口要求选择VOT区间，即从冲直条开始至元音开始处。
弹出数据框，第一列为音标，第二列为无声段时长，第三列为VOT时长。注意：该弹出框不需要进行编辑或保存操作，文件已经自动保存在文件安装目录下的 data 文件夹中的stop.txt 文件。因该文件是自动生成及追加写入，建议每次完成一组实验后另存为必要的命名和位置后对该文件进行清除，否则stop.txt文件里的实验数据会和之前的相混
重复上述步骤，提取完毕所有塞音数据。

绘制塞音格局图

点击 praat→塞音时长统计与画图。
参数讲解： there are voiced stops：如果测量的塞音里有浊塞音，则需要勾选此项。
图表横纵坐标为VOT和GAP（归一化后0-100）。

操作步骤-擦音格局

提取数据（COG、DIS）

打开 praat 软件，点击 打开→从文件读入…，将音频文件读入（可一次读入多个文件），选中某个文件，点击右侧 查看与编辑，之后会弹出语图页面。
点击擦音部分的中点处，点击 语图→Bei 测量辅音能量分布模式。
弹出框如下：
主要参数介绍：
draw：在提取数据的同时进行绘图，如果勾选，则点击继续之后会弹出坐标图。
dot：提供了三种数据采点模式。在本次采集中，我们采取的标准是点击擦音部分的中点，不涉及选段，默认 fixed_timestep即可。
弹出框中，第一列为输入的辅音名称，第二列是谱重心，第三列是离散度，第四列是用hz表示的谱重心。
注意：该弹出框不需要进行编辑或保存操作，文件已经自动保存在文件安装目录下的 data 文件夹中的 energyDistribution.txt文件。因该文件是自动生成及追加写入，建议每次完成一组实验后另存为必要的命名和位置后对该文件进行清除，否则 energyDistribution.txt文件里的实验数据会和之前的相混。如果前面勾选了 draw，则会弹出坐标图，横坐标是离散度，纵坐标是谱重心。
重复上述步骤，提取完毕所有擦音数据。

绘制擦音格局图

点击 praat→辅音→Bei 能量分布模式统计与画图，
点击 确定，读取data文件夹下的 energyDistribution.txt文件。
弹出框为基础的描述性数据，坐标图横纵坐标分别为离散度和谱重心（归一化后）。
同时，在软件目录下的data文件夹里也出现了相关的图表，可自行粘贴进论文里。

操作步骤-塞擦音格局

提取数据（GAP、VOT、COG、DIS）

打开 praat 软件，点击 打开→从文件读入…，将音频文件读入（可一次读入多个文件），选中某个文件，点击右侧 查看与编辑，之后会弹出语图页面。
选取无声段后，点击 语图→Bei 测量塞擦音时长与能量分布模式，输入音标即可。
弹出窗口要求选择摩擦段区间，即冲直条结束处至元音开始处。
弹出数据框，第一列为音标，第二列为空白段时长（GAP），第三列为摩擦段时长（DOF），第四列为擦音段谱重心（COG），第五列为擦音段离散度（DIS），第六列也是为擦音段离散度（赫兹单位），最后两列分别是时长和摩擦指数（DI & FI）。
注意：该弹出框不需要进行编辑或保存操作，文件已经自动保存在文件安装目录下的 data 文件夹中的 affricate.txt文件。

塞擦音空白段时长摩擦段时长谱重心离散度谱重心（Hz）时长指数摩擦指数

z 0.075 0.065 6.73 8.21 11959 0.87 0.82
重复上述步骤，提取完毕所有塞擦音数据。