您的位置 首页 kreess

閑聊 VOT、韻律和音系

VOT, Voice Onset Time, 又叫“發聲起始時間”,是語音學裡一個非常重要的概念。VOT 從聲學角度描述瞭傳統語文學/語言學對於所謂清濁的區分(以下為方便打

VOT, Voice Onset Time, 又叫“發聲起始時間”,是語音學裡一個非常重要的概念。VOT 從聲學角度描述瞭傳統語文學/語言學對於所謂清濁的區分(以下為方便打字,我都使用VOT)。其定義非常簡單,就是聲帶震動起始時間與口腔除阻時間的差。

VOT = T_{voice}-T_{release}

如果 VOT 是負值,那麼聲帶先於口腔除阻,意味著輔音成阻過程中有聲帶震動產生的低頻能量。如果 VOT 是正值但小於 20ms 的話,人的聽覺系統會將聲帶震動起始和除阻識別為同時事件,成阻其間沒有低頻能量,除阻瞬間聲帶震動產生周期震動。如果 VOT 是正值但大於20ms的話,人類的聽覺系統會將除阻和震動識別為一先一後兩個事件,口腔除阻前後都沒有聲帶震動產生的能量。這個關系大致可以描述為下圖[1]:

VOT 為負值的話反應在聽覺上就是所謂的帶聲輔音,或濁音,如果 VOT 為正的話就是不帶聲輔音,或清音。VOT 如果長至20ms以上被描述為不僅不帶聲而且還送氣。

這種從聲學和物理角度給出的關於傳統所謂音系清濁的定義會給人一種錯覺,好像人類語言對於口腔成阻和聲帶震動的“語言架構上”的安排隻有這三種可能性。可正如我之前在這篇回答(什麼是實驗語音學?其與語音學、語言學以及應用語言學的關系是怎樣的?)裡提到的一樣,即使在上面三個范疇內部,不同語言也會對 VOT 有不同的安排,甚至會出現有些語言音系上的所謂送氣音與別的語言的所謂不送氣音 VOT 相當的情況。

影響 VOT 值的不僅僅是各語言不同的音系,或“語音語法知識”[2]。眾所周知,語言雖然是一個具有靜態結構且相對穩定的復雜系統,但是落實到話語層面,這些相對穩態的結構是需要被我們的調音器官(調音器官包括口腔內各器官和手勢)執行並且輸出成語音或手勢(手語)信號的。調音器官的具體執行落實到生理或物理層面會受到諸多因素影響,這些因素也影響 VOT 。

在這篇文章裡我想帶大傢簡單瞭解一下哪些語言上的因素會左右實際觀測到的 VOT 值。


1. 韻律

語言學上所說的韻律 (prosody) 並不隻包括聲調、語調、音高等超音段 (suprasegmental) 特征。超音段特征隻是韻律實現的一個方面,韻律還包括瞭短句的構成 (phrasing) 這類結構性特征。因為人的生理結構限制,說話過程中需要調整呼吸,所以語言單位的產出計劃 (speech planning) 必須進行一定程度的切分。有時候這種切分就帶有不僅僅是生理意義,而是語言意義。比如我之前在想法裡問過怎麼區分:(2times3)^22times3^2 。如果考慮我們隻有下面這個音段序列的話,

區分就隻能通過在哪裡插入一個暫停來體現:

這樣的暫停的不同安排會導致語音產出細節上非常大的變化。下圖顯示的是我自己用普通話讀上面這兩個句子產生的頻譜圖和基頻圖。

可以看出不僅僅暫停變換瞭位置,兩個模式下音節“二”和“三”的產出模式也非常不一樣。在“二乘以三,的平方”中,“二”大概是 195 ms,“三”是大約 378ms。而在“二,乘以三的平方”中,“二”達到瞭 278ms,而“三”變成瞭 285 ms。“二”和“三”各自增減瞭大約 90ms 的時長。

暫停在聲調模式上也有一定影響。“二”的四聲在“二乘以三,的平方”中隻下降到瞭大概 125hz 附近,在“二,乘以三的平方”中下降到瞭100hz出頭,而他們的起始點都是差不多的頻率。“三”的一聲在下圖中略帶拱形,而在上圖中則非常平。

在漢語這樣音高 (pitch) 的聲調 (tone) 功能比語調 (intonation) 功能顯著的語言中,這樣的韻律邊界的調整可能主要依賴於插入暫停來實現。而在英語這樣語調顯著的語言中韻律邊界還可以通過各種各樣的語調來區分[3]:

圖中展示的是下面兩個句子的區別:

當暫停在 threatens 後插入時,邊界調 (boundary tone) H% 粘合在瞭 threatens 詞尾,當暫停出現在 children 後時,邊界調粘合在 children 詞尾。

韻律不僅僅是關於在哪裡插入邊界(暫停),還包括哪些句中要素比別的要素更加凸顯的問題 (prominence)。比如,

當焦點在 James 上時,核心音高 (nuclear pitch) H*出現在 James 上。而當 school 成為焦點時,H* 就出現在 school 上:

音系學的一個分支語調音系學 (intonational phonology) 就是研究人們說話的時候是怎樣對一段長語音流進行切割,這樣的切割安排與其他的語言要素比如句法和音系等等有什麼聯系的學問。一般而言從語言結構角度來說,音系學認為韻律主要有兩個功能:

  1. 分界功能 delimitative function
  2. 凸顯功能 culminative function[4]

分界功能即剛才提到的在什麼地方劃分怎樣的合適的邊界。不同的邊界的“強度 (strength)”也會不一樣,比如英語中一般認為可以劃分三個層次的邊界:語調短語邊界 (intonational phrase boundary),中間短語邊界 (intermediate phrase boundary) 和韻律詞邊界 (prosodic word boundary)。這樣一來我們就可以從韻律角度將 When danger threatens your children, call the police 分拆成下面這樣的結構[5]:

在這個韻律層級的最底層是音段,依次往上是音節、韻律詞、中間短語和語調短語。

凸顯功能就決定在每個這樣的韻律短語,或韻律域中,哪個語言單位比其他語言單位在韻律層面更突顯。反映在上面這幅圖中就是,哪個詞獲得 L+H* 這個核心音高。在第一個語調短語 (IP) 中是 danger,在第二個 IP 中是 police。

2. 韻律與VOT

那麼接下來我們要問的問題就是,這個性質和 VOT 有什麼關系呢?語音學傢通過研究發現韻律邊界對處於韻律邊界附近的語音單位的產出模式有著微小但又顯著的影響,比如邊界前的音節普遍會被拉長[6][7]。

那 VOT 會怎樣隨著韻律結構的不同而變化呢?一個顯而易見但卻不一定正確的猜想是“VOT在韻律邊界會被拉長”。這個答案對又不對。對是因為 VOT 隨著韻律邊界的強度的增長而變長確實是重復觀察到的現象。比如韓語的送氣音的 VOT 在其他條件不變的情況下,就很明顯的隨著韻律邊界的強度提升而變長[8]。

Ui 代表發話起始位置,IPi 代表語調短語起始位置,APi 表示音高短語起始位置,Wi表示詞首,Si 代表音節首,韻律邊界強度從左到右遞減。

英語中也觀察到瞭類似現象[9]:

Ui 代表發話起始,Um代表發話中部

但是,這隻針對清送氣音而言。清不送氣或者濁音的 VOT 所受到的影響很小。比如在英語的 /sC/ 復輔音序列中,研究發現在 sC 前方的韻律邊界強度對輔音 C 的 VOT 並沒有什麼影響[10]:

IP 是詞調短語,Wd 是詞

這有可能是因為清不送氣音在詞首出現時 VOT 出現的天花板效應。一方面英語的音系上的濁音在詞首清化瞭,所以 VOT 必須大於0。而另一方面 VOT 又不能很長,因為長 VOT 區段還有清送氣音占著,如果繼續增長的話詞首的送氣對立就消失瞭,會導致音系信息丟失。

有趣的是,荷蘭語中的清音甚至還呈現出相反的性質:隨著韻律邊界強度的上聲 VOT 值反而下降[11]:

y 軸上每格代表 25ms

看起來雖然荷蘭語和英語一樣在詞首都隻區分清送氣和不送氣,但是清送氣音的語音性質卻相當不一樣。所以 Cho 在論文中認為這是因為荷蘭語中這個清送氣音帶的語音特征是 [-spread glottis],而英語中則是 [+spread glottis] 的緣故。因為一個取值為負,一個取值為正,所以在輔音處在強韻律位置時強化的方向是相反的。

更加有趣的是,不論在剛才的英語還是荷蘭語的數據中都出現瞭韻律邊界和凸顯度之間有趣的交互作用。比如在英語數據中,Cho 和 McQueen 發現,如果輔音前緊跟著韻律邊界而不是s(即s#C),並且單詞本身並沒有接受核心音高 (nuclear pitch accent,參見剛才 James went to school 的例子) 的話,韻律邊界強度越高則 VOT 也越長:

比較第三組柱和其他三組,特別是第四組。白色是詞調短語邊界,深色是詞邊界

上圖中左邊兩組數據顯示當音節被核心音高所標記的時候,韻律邊界的強度對 VOT 是沒有影響的。當核心音高消失以後,邊界首位的 C 的 VOT 隨著強度上升而上升,而緊跟在邊界首位的 s 後邊的 C 卻 VOT 隨著強度上聲而下降。

荷蘭語中也呈現出非常類似的效應。即邊界強度效應隻在目標音節不被詞重音標記時才顯現出來:

BG = bigger phrase,SM = smaller phrase,WD = word。y 軸上每格代表 5ms

那是什麼原因導致的這一行為呢?語音學傢猜測這是因為 VOT 的擴張應該是有一個上限的,而韻律的分界功能和凸顯功能就會在這裡呈現此消彼長的競爭性關系:如果 VOT 隨著凸顯功能(重音或者核心音高)變化的話,那麼就沒有多少空間再留給邊界強化功能發揮作用瞭。是另外一種天花板效應。

從調音的角度來看,VOT 其實攜帶的是元音的一部分信息。我在這篇回答裡寫過如何看待音節首末位不同的調音動作的時間組織:

元音的調音動作與輔音的調音動作在音節首是幾乎同時發生的,並不因為聲門的狀態而改變。可是因為VOT的存在,元音調音動作的一部分可能並沒有完全反映到周期性樂音音信號上。所以從調音語音學角度來說,對清輔音而言,與其說 VOT 是輔音的性質,倒不如說它是和元音的調音同時發生的事件。因此韻律的凸顯功能在進行韻律強化時延長元音的同時也延長瞭與元音的調音同時進行的 VOT,也就是聲門打開這個動作。而強化不是無休止地加進各種可能要素進行擴張,於是形成瞭天花板效應。如果韻律的凸顯功能強化瞭 VOT 的話,韻律的分界功能就沒有操作空間瞭。


VOT 可以說是語音學中最基礎的幾個概念之一瞭,語音學傢已經對其進行瞭將近 60 年研究。可正如我們在上面看到的,從理論角度出發,可以說 VOT 的本質還並不是完全清楚。對於一個小小的參數的深入研究依然可以給我們帶來許許多多有關語言和語言結構到底是什麼的有趣的觀察和思考。

參考

  1. ^https://www.researchgate.net/publication/317958353_Learning_and_teaching_of_foreign_language_pronunciation_in_multilingual_settings_A_questionnaire_study_with_teachers_of_English_French_Italian_and_Spanish/figures?lo=1
  2. ^Kingston, J., & Diehl, R. L. (1994). Phonetic knowledge. Language, 70(3), 419-454.
  3. ^Cho, T. (2016). Prosodic boundary strengthening in the phonetics–prosody interface. Language and Linguistics Compass, 10(3), 120-141.
  4. ^國內有翻譯作“達頂性”。我覺得這個詞雖然是基於 culminative 這個詞的詞匯義翻譯,但是用於描述韻律結構有點不明所以,所以私譯為“凸顯”。
  5. ^同註 3
  6. ^Gussenhoven, C., & Rietveld, A. C. (1992). Intonation contours, prosodic structure and preboundary lengthening. Journal of Phonetics, 20(3), 283-303.
  7. ^Berkovits, R. (1993). Utterance-final lengthening and the duration of final-stop closures. Journal of Phonetics, 21(4), 479-489.
  8. ^T. Cho and P. A. Keating, “Articulatory and acoustic studies on domain-initial strengthening in Korean,” Journal of Phonetics, vol. 29, no. 2, pp. 155–190, 2001, doi: 10.1006/jpho.2001.0131.
  9. ^T. Cho and P. Keating, “Effects of initial position versus prominence in English,” Journal of Phonetics, vol. 37, no. 4, pp. 466–485, Oct. 2009, doi: 10.1016/j.wocn.2009.08.001.
  10. ^T. Cho, Y. Lee, and S. Kim, “Prosodic strengthening on the /s/-stop cluster and the phonetic implementation of an allophonic rule in English,” Journal of Phonetics, vol. 46, no. 1, pp. 128–146, Sep. 2014, doi: 10.1016/j.wocn.2014.06.003.
  11. ^T. Cho and J. M. McQueen, “Prosodic influences on consonant production in Dutch: Effects of prosodic boundaries, phrasal accent and lexical stress,” Journal of Phonetics, vol. 33, no. 2, pp. 121–157, 2005, doi: 10.1016/j.wocn.2005.01.001.

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部