關(guān)于語言清晰度(可理解性)的深入洞察(三)
來源:同創(chuàng)音頻 編輯:ZZZ 2024-06-26 08:52:38 加入收藏
在上一期中,我們深入探討了語音頻譜、共振峰以及影響語言清晰度的關(guān)鍵因素。本期,我們將聚焦聲場對語言清晰度的影響,并為大家總結(jié)麥克風(fēng)放置的實用規(guī)則。
關(guān)于聲場對語言清晰度的影響
在探討聲場對語言清晰度的影響時,一個關(guān)鍵的觀察點是聲音的指向性,即聲音在不同方向上傳播的強度和特性。通過精心設(shè)計的實驗和測量,我們可以觀察到聲場中的諸多細(xì)節(jié),這些細(xì)節(jié)對于理解如何捕捉和傳達(dá)清晰的語言至關(guān)重要。
當(dāng)發(fā)言人發(fā)言時,其聲音不僅受到周圍聲場環(huán)境的影響,還受到人的頭部和身體的影響。這種影響在多個維度上展現(xiàn),包括指向性、距離與方向、以及頭部和胸部的反射等。
下面是人類說話者在垂直和水平平面上的極坐標(biāo)圖。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
首先,值得注意的是,當(dāng)我們繪制出人類說話者在垂直和水平平面上的極坐標(biāo)圖時,可以發(fā)現(xiàn)一個明顯的現(xiàn)象:電平在經(jīng)過A加權(quán)后,男性和女性在正面和背面之間的差值大約為7dB。這意味著聲音在直接面對的方向上最為強烈,而在背后則相對較弱。
然而,這一數(shù)據(jù)并沒有揭示出關(guān)于頻率相關(guān)性的全部信息。事實上,高頻聲音在背面的衰減比低頻聲音更為顯著。這一發(fā)現(xiàn)對于麥克風(fēng)的選擇和放置位置具有指導(dǎo)意義,因為它意味著為了捕捉更多的高頻細(xì)節(jié),麥克風(fēng)需要更加靠近說話者的正面。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
從上圖可以看出,方向性從大約1kHz及以上增加。將這一事實與1kHz以上頻率的重要性相結(jié)合,很明顯,當(dāng)在人前面而不是在人后面拾音時,可以獲得更高的可懂度。
(參考: Chu, W.T.; Warnock, A.A.C.: Detailed Directivity of Sound Fields Around Human Talkers.)
此外,在垂直面上,我們注意到一個有趣的細(xì)節(jié):與其他方向相比,330°方向(大致指向胸部區(qū)域)的水平面更高。這并非偶然,而是由于聲音從胸部反射出來所導(dǎo)致的。這種反射不僅增強了該方向上的聲音強度,還可能對頻譜產(chǎn)生一定的影響,尤其是在低頻部分。
距離與方向
由于并非所有麥克風(fēng)都放置在距離講話者1米的地方,因此了解當(dāng)我們靠近聲源時會發(fā)生什么是很有趣的。
下圖顯示了在給定方向上1米處記錄的語音頻譜的偏差。角度(+45度、0度和-45度)在垂直平面內(nèi)。這些結(jié)果是10個談話者的平均值。
三個圖中的每條線分別顯示了80厘米、40厘米、20厘米和10厘米處的偏差。
如果在改變方向和距離時頻譜沒有變化,所有曲線都將是直線,但隨著我們離談話者越來越近,偏差會增加。
下圖顯示了從軸向平面向上45°的測量位置。與這里的偏差是微妙的。而不那么依賴于距離。
下圖顯示了當(dāng)我們在軸向平面下方45°的測量位置。身體對聲音的反射對的影響是巨大的。
下圖顯示了在軸向上偏差在一定程度上介于其他兩個之間,這意味著語音的頻譜隨著到麥克風(fēng)的距離而變化。
(參考: Brixen, Eddy B.: Near field registration of the human voice: Spectral changes due to positions. AES Convention 104, Amsterdam, the Netherlands. Preprint 4728)
研究表明,聲音在垂直和水平平面上都表現(xiàn)出明顯的指向性,其中高頻聲音的指向性尤為顯著。這意味著在麥克風(fēng)拾音時,麥克風(fēng)的位置和方向?qū)φZ音清晰度至關(guān)重要。此外,隨著我們與聲源的距離變化,語音的頻譜也會發(fā)生變化,這進一步強調(diào)了麥克風(fēng)放置的重要性。
對于頭部和胸部的反射,研究同樣揭示了它們對語音頻譜的顯著影響。領(lǐng)夾式麥克風(fēng)或頭戴式麥克風(fēng)雖然提供了行動自由,但也可能導(dǎo)致記錄的頻譜與自然感知的頻譜存在差異。因此,在選擇和放置麥克風(fēng)時,我們需要考慮這些因素對語音清晰度的影響。
頭部和胸部
在廣播和現(xiàn)場聲音應(yīng)用中,首選的麥克風(fēng)通常是領(lǐng)夾式麥克風(fēng)(胸部佩戴)或頭戴式麥克風(fēng)(頭戴),這允許用戶有更多的行動自由。人們應(yīng)該意識到這樣一個事實,即將麥克風(fēng)放置在如此短的距離處會導(dǎo)致記錄的頻譜不同于在正常收聽距離處感知到的自然和中性頻譜。這種差異遠(yuǎn)遠(yuǎn)不能忽略。
以下是五條曲線,解釋了將麥克風(fēng)放置在身體或頭部時語音頻譜的變化。所有曲線均基于測量值,平均為10人(見參考文獻)。
上曲線(胸部)量化了在胸部采集的語音頻譜與在軸上1米處采集的同一個人的語音頻譜的不同方式。當(dāng)將麥克風(fēng)放在胸部時,關(guān)鍵2-4 kHz范圍內(nèi)的頻率會顯著降低。
第二條曲線(頸部)顯示了麥克風(fēng)離下巴更近時的偏差。這一立場非常適用于廣播,因為如果記者或受訪者穿著t恤、運動衫等或外套,這是放置領(lǐng)夾式麥克風(fēng)的唯一實用方法。在戶外使用時,麥克風(fēng)可以披著毛皮或戴在圍巾后面。在任何情況下:輔音頻率都會大幅降低。
前額曲線表明,將麥克風(fēng)放在前額上是對頻譜干擾最小的位置。這個位置非常適合舞臺和電影,但不適合新聞。
耳朵曲線顯示了在這個位置較高頻率的逐漸衰減。將麥克風(fēng)放置在耳朵處可以很方便;然而,它需要補償以保持語音可懂度。
將麥克風(fēng)放在臉頰(耳機)時,與大多數(shù)其他位置相比,2-4 kHz的范圍更好。然而,仍然需要在最高頻率下提升。DPA耳機具有內(nèi)置升降裝置。
需要注意的是,與胸部姿勢相比,“微笑的角落”(臉頰處)的語音水平高出約10 dB。
從曲線中可以看出,在800Hz附近存在上升的一般趨勢,這可以被認(rèn)為是補償?shù)?。然而,最顯著的偏差是導(dǎo)致語音可懂度降低的衰減。這一定要時刻注意!
(參考: Brixen, Eddy B.: Spectral degradation of speech captured by miniature microphones mounted on Persons’ heads and chests. AES Convention no. 100, Copenhagen, Denmark. Preprint 4284.)
麥克風(fēng)的放置規(guī)則
基于上述分析,我們?yōu)辂溈孙L(fēng)的選擇和放置制定了以下規(guī)則:
人聲手持麥克風(fēng)應(yīng)位于口腔前方,角度為±30°,并盡量保持軸向?qū)R。
領(lǐng)夾式/胸部佩戴式麥克風(fēng)應(yīng)使用預(yù)均衡或后期均衡來補償在胸部位置處缺失的3-4kHz頻率范圍。
頭戴麥克風(fēng)相對中性,但可能仍需對高頻進行適當(dāng)補償。
講臺麥克風(fēng)應(yīng)具有指向性,并指向講話者的嘴部,以減少環(huán)境噪音的影響。
在多揚聲器環(huán)境中,應(yīng)選擇定向麥克風(fēng),并確保每個揚聲器的麥克風(fēng)能夠?qū)⑵渌麚P聲器的聲音衰減至少10 dB。
結(jié)語與展望
至此,關(guān)于語言清晰度(可理解性)的深入洞察系列已告一段落。我們希望通過這一系列文章,為大家提供了對語音產(chǎn)生、傳播和接收過程中影響語言清晰度的因素的全面理解。
然而,音頻技術(shù)的探索永無止境。在未來,我們將繼續(xù)關(guān)注音頻技術(shù)的最新發(fā)展,并為大家?guī)砀嚓P(guān)于音頻原理、前沿技術(shù)及其應(yīng)用場景的探討。讓我們共同期待音頻技術(shù)為我們帶來的更多可能!
評論comment