耳鳴是一種常見的臨床癥狀。研究表明,分形音可有效治療耳鳴,但目前的分形音多基于固定的音符庫結合分形算法映射而成,其頻率單一,很難與患者進行個性化適配。臨床研究證實,自然聲為常用的耳鳴匹配聲,對調節消極情緒、減輕耳鳴的煩擾程度有良好的效果。因此,本文提出了一種基于迭代函數系統(IFS)的個性化耳鳴康復自然音合成方法。該方法以個性化構造的自然音音頻庫為基礎,通過 IFS 分形算法映射合成康復音。實驗表明,此方法合成的康復音符合耳鳴治療聲基本要求,且可通過控制音頻庫的生成使康復聲適配患者的耳鳴聲,對耳鳴治療具有一定的參考價值。
引用本文: 蔡麗, 何培宇, 陳杰梅. 一種基于迭代函數系統的個性化耳鳴康復自然音合成方法. 生物醫學工程學雜志, 2018, 35(4): 631-636. doi: 10.7507/1001-5515.201705012 復制
引言
耳鳴指不由外界聲音引起的聽覺感知,其病因復雜,發病機制尚不清楚。相關資料顯示,耳鳴發病率為 10%~15%,對患者的身心常造成極大傷害[1-2]。因此,對耳鳴康復方法的探索仍具有十分重要的意義。
耳鳴的聲音治療是一種非藥物方法,其簡便、有效且無副作用,是目前公認有效的耳鳴治療方法[3]。聲音療法分為掩蔽療法和習服療法。掩蔽療法提供與患者耳鳴頻率相近、響度相同或稍高于耳鳴響度的聲音作為掩蔽聲源(如自然聲),通過抑制中樞神經興奮來達到抑制耳鳴的效果[4];習服療法常以分形音樂作為背景聲,使患者習慣和適應耳鳴,通過緩解由耳鳴帶來的負面情緒來達到減輕耳鳴癥狀的效果[5]。研究表明,重復的聲音會喚醒記憶,無法達到預期的減壓放松效果[1, 5],而將分形圖形的隨機性和自相似性運用到康復音合成中正好可彌補這一缺陷[6-8]。丹麥唯聽助聽器中的“禪”音和文獻[9-10]的分形音樂都利用分形技術映射合成。調查發現,不管是“禪”音還是文獻[9-10]中的分形音樂都是基于樂器數字接口(Musical Instrument Digital Interface,MIDI)中固定的中音區音符所合成,因此存在頻率單一和節奏單調的問題。文獻[10]雖然在加入分解和弦后解決了音調突變的問題使分形音樂更加流暢,但由于音庫本身的缺陷,仍無法達到與患者的個性化匹配,無法進行針對性治療。
臨床研究證實,自然聲是多數耳鳴患者的掩蔽聲源,可打破耳鳴與不良情緒之間的惡性循環鏈,在一定程度上減輕耳鳴的煩擾程度[4, 11]。因此本文將自然聲作為基礎音,結合分形理論,提出了一種基于迭代函數系統(iterative function system,IFS)的個性化耳鳴康復自然音合成的新方法。該方法以個性化選取的自然音片段代替常規音符,以基于自然音片段發展而成的自然音庫代替以往固定的音符庫,再結合 IFS 分形圖像的層次特征進行映射,最終合成分形自然音。該方法以保證相似但不重復為出發點,配合自然音的良好掩蔽特性使得合成康復音與患者更加適配,以期達到針對性緩解耳鳴癥狀的目的,對耳鳴的臨床治療具有一定的借鑒意義。
1 耳鳴康復音合成原理
本文通過控制個性化自然音音庫的生成和 IFS 分形序列來合成耳鳴康復音,其總體思路為:
(1)提供不同的自然音片段進行試聽選優,篩選合適片段作為個性化基礎自然音;
(2)基于音頻的韻律變換方法,對選取的個性化基礎自然音片段從音色、音調、響度和速度四個維度上進行韻律變換處理。在各變換算法的單獨或聯合作用下將基礎自然音片段發展成自然音音頻庫,并對庫內音頻按相關性進行編號處理;
(3)為滿足治療聲相似不重復的要求,選取經 IFS 系統產生的分形序列進行線性處理,在映射規則的控制下最終合成耳鳴康復音。
通過控制 IFS 序列及其長度可使合成的分形自然音具有可控時長相似不重復特性。基礎自然音的選取過程和映射音庫的產生過程與患者本身緊密關聯,保證了合成的康復音滿足個體需求。其流程如圖 1 所示。

2 個性化自然音音頻庫的生成
2.1 基礎自然音選取
自然音音頻庫由基礎自然音發展而成。為實現個性化,基礎自然音片段的選取應該基于患者的意愿和要求。其選取過程為:首先提供給患者不同的自然音片段(流水聲、風聲、鳥叫聲、蟬鳴聲等)進行試聽,然后從耳鳴聲匹配度、可接受度、喜歡程度三個層面去評分,最后篩選出綜合評分最高(或評分前三)的自然音片段作為基礎音。
2.2 韻律變換
耳鳴的聲治療常需保證長達半小時甚至更長時間的治療聲連續刺激[1, 5]。若僅用所選基礎自然音進行映射合成,產生的康復音必定單調重復。因此本文從響度、速度、音調和音色四個韻律維度上對所選基礎音進行變換,將其發展成具有豐富韻律的自然音庫。四種變換方法如下:
(1)響度變換:即音頻幅度的調節。
(2)速度變換:本文采用重疊疊加算法[12]進行音頻速度變換。
(3)音調變換:本文采用 Hilbert-Huang 變換與 AM-FM 相結合的方式進行音調的調節,其實質是共振峰的搬移[13]。
(4)音色均衡:本文基于均衡技術[14]進行音色調節。音頻均衡技術中,頻帶的劃分最為關鍵,為更好地建立治療聲與耳鳴患者的聯系,本文將 Mel 頻率應用于頻帶劃分。Mel 頻率是基于人耳耳蝸和基底膜特性所提出的頻率標度。人耳聽覺系統對物理頻率的感知具有對數特征,而對 Mel 頻率具有線性特征。Mel 頻率與物理頻率的關系為:
![]() |
其中,f 為物理頻率,
為 Mel 頻率。完成對 Mel 頻段的劃分一般分為三步:① 根據最大物理頻率計算 Mel 最大頻率;② 根據劃分頻帶個數計算 Mel 頻帶間隔;③ 求得各 Mel 頻段中心頻率。

圖 2 為本文由 Mel 頻率設計的帶通濾波器組。濾波器組各中心頻率呈對數遞增,恰好符合人耳聽覺系統對于物理頻率感知的對數分布特性。用圖示濾波器組將音頻信號劃分為各路子帶信號,根據均衡原理在可控范圍內對各頻帶信號進行增益(或衰減)調節,即可得到音色均衡后的音頻信號。
音頻庫由基礎音發展而成,庫內各音頻片段間具有一定自相似特征,這保證了基于該音庫映射合成的康復音具有豐富的韻律但又不產生大的突變。韻律變換時,患者可根據個人需要,控制音頻庫內音頻的頻率成分,以達到個性化匹配的目的。
2.3 自然音音頻庫的編號處理
為避免映射合成的分形自然音存在較大突變、音頻不流暢的問題,這里對自然音音頻庫進行編號處理。首先,依次求取自然音音頻庫內各音頻片段(假設為 x)與基礎自然音(假設為 y)的互相關系數:
![]() |
其中
為信號 x 的平均值,
為信號 y 的平均值。
接著,挑選出相關系數在[0.3,0.8]的音頻片段作為有效片段,并按相關程度由強自弱進行編號。將相關性在 0.3 以下和 0.8 以上的音頻片段予以舍棄,從而在一定程度上避免映射合成的音頻產生突變和重復性過高的問題。互相關系數與相關程度的定義如表 1 所示。

3 基于個性化自然音音庫和 IFS 算法合成分形自然音
研究表明,將分形技術用于音樂譜曲可使合成的音樂具有可預測而又不單調、隨機而又統一的分形特征,此特征正好符合耳鳴康復音的要求[6-8]。基于此,本文選取 IFS 分形算法[15]生成的分形序列作為映射序列來控制康復音的合成。
圖 3 即為本文的治療聲映射合成過程:① 將原始 IFS 序列經線性方法處理獲得整數分形序列;② 以整數分形序列的最大值最小值的差值作為區間跨度,并將其劃分為與音頻庫內音頻數量相同的區間得到編號區間;③ 判定分形序列值對應的區間,映射音頻庫內對應編號的音頻以合成分形自然音。

4 仿真分析及試聽分析
本文通過 1/f 波動和分形維度分析合成治療音的整體相似不重復特性,通過對比實驗分析合成治療音個性化匹配的特征,通過耳鳴模型[16]刺激效果分析合成治療音對耳鳴的治療作用,最后通過試聽分析對合成治療音進行主觀檢驗。
4.1 1/f 波動分析
1/f 波動在局部呈無序狀態但在宏觀上卻存在相關性,這種波動可使人感到舒適,大多數音樂和舒適的聲音均符合 1/f 波動[16-17]。功率譜
是信號時間相關性的一個重要量度,表示信號在頻率 f 處均方根的變化,其關系為:
![]() |
其中 β 為標準指數,當 β 在[0.5,1.5]范圍內時,可將信號看作是 1/f 波動。
本文 IFS 分形序列控制康復自然音的最終映射合成,分形序列的波動特性直接決定音頻的整體特性。將 IFS 產生的分形序列和經線性處理后用于映射合成的序列均進行 1/f 波動分析。如圖 4 所示,圖中橫、縱軸分別為頻率和功率譜的對數值。

由圖 4 可知,IFS 迭代系統產生的分形序列和映射所用序列的功率譜擬合曲線斜率分別為–0.938 1(即β = 0.938 1)和–0.937 8(即β = 0.937 8),均符合 1/f 波動特性,說明線性處理過程并不破壞分形序列的波動特性。該結果表明,合成的康復音具有整體的穩定性,可使人感到舒適和放松[16-17]。
4.2 分形維度分析
分形維度表征了分形在幾何變換下的標度無關性,可體現局部與整體的相似特征。合成自然音的分形維度特征可由相鄰自然音片段編號差 i 及其出現的頻率 Fi 來表示。當 i 與 Fi 滿足關系式:
![]() |
即當
與
存在以–D 為斜率的線性關系時表示合成自然音具有分形的自相似特性[8-9]。表 2 為對一段時長為 20 min 的合成自然音進行的相關統計,圖 5 表示 i 與
的對數域擬合關系。


由表 2 可知,相同音頻片段連續出現次數(i = 0)較少,同時音頻編號差較大的情況(i > 10)也較少出現,說明音頻無大量的重復性和明顯突變性。由 圖 5 可知,
與
為近似線性關系,說明音頻具有整體的自相似特性。
4.3 合成音頻對比分析
用文獻[10]方法合成 IFS 分形音樂,并將其由 MIDI 格式轉化為 wav 格式;用本文方法,以流水聲為基礎音構造流水聲音頻庫,合成分形流水聲 1;對該流水聲音頻庫進行個性化處理(增加 2~5 kHz 頻段音頻比例),以相同的分形序列映射合成分形流水聲 2。對合成的音頻分別進行頻譜分析,如圖 6 所示。

圖 6 中,分形流水聲 1 頻率集中在 2 kHz 內;相較于分形流水聲 1,分形流水聲 2 頻譜中 2~5 kHz 的頻率成分相應增加,這與個性化調整的預期效果相一致。據此,患者可根據自身需求構造對應自然音音頻庫來合成治療音,以實現個性化適配。由于音庫的限制,文獻[10]方法合成的 IFS 分形音樂頻率集中在 1 kHz 內,其頻率成分單一,很難進行個性化適配。
為進一步體現本文合成康復音的特點,這里選取鳥叫聲和蟬鳴聲分別合成分形鳥叫聲和分形蟬鳴聲,其頻譜對比如圖 7 所示。由圖可知,選取不同的基礎自然音,所得的合成分形自然音呈現不同的頻率特性:分形蟬鳴聲頻率較為集中,對于耳鳴聲頻率特性明顯的患者具有良好的適配效果;分形鳥叫聲頻譜較寬,正好適用于耳鳴聲頻率豐富難辨的患者。

4.4 耳鳴模型刺激分析
為驗證合成耳鳴治療音能在一定程度上抑制耳鳴,這里基于文獻[18]提出的一種自適應耳鳴模型進行了聲音刺激分析,該模型可有效模擬耳鳴的產生及聲音療法對耳鳴的抑制作用。實驗假設第三條聽覺通路損傷(即耳鳴聲頻段為 5.15~6.05 kHz)。實驗時長為 80 s,在第 20~60 s 輸入上述分形蟬鳴聲(頻率集中在 4~6 kHz)和 IFS 分形音樂(頻率集中在 1 kHz 內)分別刺激模型,仿真結果如圖 8 所示。

對比兩幅圖可以發現,在加入分形蟬鳴聲后,由于其頻率范圍處在耳鳴聲頻段范圍內,經過一段時間刺激,耳鳴自發信號得到抑制,模型輸出功率逐漸減弱;60 s 時撤去刺激信號,輸出功率逐漸上升,耳鳴癥狀復發。而加入 IFS 分形音樂后,由于其頻率不在耳鳴聲頻段范圍內,無法抑制耳鳴自發信號,因此模型輸出功率維持不變。
4.5 試聽分析
前面進行了詳細的仿真分析,在理論上論證了治療音的各項特性。本節通過試聽實驗對合成治療音進行主觀評價。需要說明的是,試聽實驗是對合成治療音聽覺效果(重復度、突變度和舒緩度)的主觀檢驗,因不涉及治療效果的評價,故選取聽力狀況良好的正常人進行試聽。該試聽僅作為對本文合成治療音的初步聽覺效果分析,在臨床中還需要根據耳鳴患者的具體情況調節相關參數以達到治療目的。
試聽人員共 45 名(男 20 名,女 25 名),均為年齡 18~25 歲的在校學生。試聽人員在相對安靜的環境中進行試聽。試聽設備為 Lenovo 小新潮 7000 電腦播放器。試聽音頻為本文基于 3 種不同的自然界聲音(流水聲、鳥叫聲、風聲)合成的 3 種分形自然音片段,分別為 frag1、frag2 和 frag3。每段音頻的試聽時長為 3 min,每次試聽時 frag1、frag2 和 frag3 輪流播放,每段音頻試聽間隔為 1 min。每位試聽人員共進行一輪試聽,試聽結束即刻依據完全不重復、相似不重復、重復、流暢及舒緩五項要素對 frag1、frag2 和 frag3 分別進行評判。評判過程為:針對每一種音頻片段每位試聽人員從各要素中選擇出最符合該音頻特性的要素,五項要素中完全不重復、相似不重復和重復只能選其一,舒緩和流暢這兩項可同時選擇、同時不選或選擇其一。試聽統計結果如表 3 所示。

分析表 3,分別約 77.8%、66.7% 和 64.4% 的試聽人員認為 frag1、frag2 和 frag3 具有相似不重復特性,該結果表明大部分試聽者認為合成治療音是相似但不重復的,這與仿真實驗所述的特征相吻合;分別約 75.6%、68.9%、80.0% 的試聽人員認為 frag1、frag2 和 frag3 舒緩悅耳;分別約 66.7%、62.2% 和 66.7% 的試聽者認為 frag1、frag2 和 frag3 前后流暢無明顯突變。上述試聽結果說明本文合成的治療音具有整體相似不重復性,且聲音流暢舒緩無明顯突變,有助于聽者放松心情。
5 結論
本文提出了一種基于 IFS 的個性化耳鳴康復自然音合成方法。IFS 系統產生的分形序列具有隨機性和可預測性的平衡,保證了合成治療音整體的相似但不重復特性;自然音天然的舒適性和豐富性增加了合成治療音的舒緩性,可使聽者放松;基礎自然音的選取和自然音庫的構造過程與患者緊密相關,具有個性化適配的特性。仿真實驗驗證了合成治療音的個性化匹配的效果、整體的 1/f 波動特性、分形特性和對耳鳴模型的抑制效果。因此,本文提出的康復音合成方法對運用聲音療法治療耳鳴具有一定借鑒意義。
引言
耳鳴指不由外界聲音引起的聽覺感知,其病因復雜,發病機制尚不清楚。相關資料顯示,耳鳴發病率為 10%~15%,對患者的身心常造成極大傷害[1-2]。因此,對耳鳴康復方法的探索仍具有十分重要的意義。
耳鳴的聲音治療是一種非藥物方法,其簡便、有效且無副作用,是目前公認有效的耳鳴治療方法[3]。聲音療法分為掩蔽療法和習服療法。掩蔽療法提供與患者耳鳴頻率相近、響度相同或稍高于耳鳴響度的聲音作為掩蔽聲源(如自然聲),通過抑制中樞神經興奮來達到抑制耳鳴的效果[4];習服療法常以分形音樂作為背景聲,使患者習慣和適應耳鳴,通過緩解由耳鳴帶來的負面情緒來達到減輕耳鳴癥狀的效果[5]。研究表明,重復的聲音會喚醒記憶,無法達到預期的減壓放松效果[1, 5],而將分形圖形的隨機性和自相似性運用到康復音合成中正好可彌補這一缺陷[6-8]。丹麥唯聽助聽器中的“禪”音和文獻[9-10]的分形音樂都利用分形技術映射合成。調查發現,不管是“禪”音還是文獻[9-10]中的分形音樂都是基于樂器數字接口(Musical Instrument Digital Interface,MIDI)中固定的中音區音符所合成,因此存在頻率單一和節奏單調的問題。文獻[10]雖然在加入分解和弦后解決了音調突變的問題使分形音樂更加流暢,但由于音庫本身的缺陷,仍無法達到與患者的個性化匹配,無法進行針對性治療。
臨床研究證實,自然聲是多數耳鳴患者的掩蔽聲源,可打破耳鳴與不良情緒之間的惡性循環鏈,在一定程度上減輕耳鳴的煩擾程度[4, 11]。因此本文將自然聲作為基礎音,結合分形理論,提出了一種基于迭代函數系統(iterative function system,IFS)的個性化耳鳴康復自然音合成的新方法。該方法以個性化選取的自然音片段代替常規音符,以基于自然音片段發展而成的自然音庫代替以往固定的音符庫,再結合 IFS 分形圖像的層次特征進行映射,最終合成分形自然音。該方法以保證相似但不重復為出發點,配合自然音的良好掩蔽特性使得合成康復音與患者更加適配,以期達到針對性緩解耳鳴癥狀的目的,對耳鳴的臨床治療具有一定的借鑒意義。
1 耳鳴康復音合成原理
本文通過控制個性化自然音音庫的生成和 IFS 分形序列來合成耳鳴康復音,其總體思路為:
(1)提供不同的自然音片段進行試聽選優,篩選合適片段作為個性化基礎自然音;
(2)基于音頻的韻律變換方法,對選取的個性化基礎自然音片段從音色、音調、響度和速度四個維度上進行韻律變換處理。在各變換算法的單獨或聯合作用下將基礎自然音片段發展成自然音音頻庫,并對庫內音頻按相關性進行編號處理;
(3)為滿足治療聲相似不重復的要求,選取經 IFS 系統產生的分形序列進行線性處理,在映射規則的控制下最終合成耳鳴康復音。
通過控制 IFS 序列及其長度可使合成的分形自然音具有可控時長相似不重復特性。基礎自然音的選取過程和映射音庫的產生過程與患者本身緊密關聯,保證了合成的康復音滿足個體需求。其流程如圖 1 所示。

2 個性化自然音音頻庫的生成
2.1 基礎自然音選取
自然音音頻庫由基礎自然音發展而成。為實現個性化,基礎自然音片段的選取應該基于患者的意愿和要求。其選取過程為:首先提供給患者不同的自然音片段(流水聲、風聲、鳥叫聲、蟬鳴聲等)進行試聽,然后從耳鳴聲匹配度、可接受度、喜歡程度三個層面去評分,最后篩選出綜合評分最高(或評分前三)的自然音片段作為基礎音。
2.2 韻律變換
耳鳴的聲治療常需保證長達半小時甚至更長時間的治療聲連續刺激[1, 5]。若僅用所選基礎自然音進行映射合成,產生的康復音必定單調重復。因此本文從響度、速度、音調和音色四個韻律維度上對所選基礎音進行變換,將其發展成具有豐富韻律的自然音庫。四種變換方法如下:
(1)響度變換:即音頻幅度的調節。
(2)速度變換:本文采用重疊疊加算法[12]進行音頻速度變換。
(3)音調變換:本文采用 Hilbert-Huang 變換與 AM-FM 相結合的方式進行音調的調節,其實質是共振峰的搬移[13]。
(4)音色均衡:本文基于均衡技術[14]進行音色調節。音頻均衡技術中,頻帶的劃分最為關鍵,為更好地建立治療聲與耳鳴患者的聯系,本文將 Mel 頻率應用于頻帶劃分。Mel 頻率是基于人耳耳蝸和基底膜特性所提出的頻率標度。人耳聽覺系統對物理頻率的感知具有對數特征,而對 Mel 頻率具有線性特征。Mel 頻率與物理頻率的關系為:
![]() |
其中,f 為物理頻率,
為 Mel 頻率。完成對 Mel 頻段的劃分一般分為三步:① 根據最大物理頻率計算 Mel 最大頻率;② 根據劃分頻帶個數計算 Mel 頻帶間隔;③ 求得各 Mel 頻段中心頻率。

圖 2 為本文由 Mel 頻率設計的帶通濾波器組。濾波器組各中心頻率呈對數遞增,恰好符合人耳聽覺系統對于物理頻率感知的對數分布特性。用圖示濾波器組將音頻信號劃分為各路子帶信號,根據均衡原理在可控范圍內對各頻帶信號進行增益(或衰減)調節,即可得到音色均衡后的音頻信號。
音頻庫由基礎音發展而成,庫內各音頻片段間具有一定自相似特征,這保證了基于該音庫映射合成的康復音具有豐富的韻律但又不產生大的突變。韻律變換時,患者可根據個人需要,控制音頻庫內音頻的頻率成分,以達到個性化匹配的目的。
2.3 自然音音頻庫的編號處理
為避免映射合成的分形自然音存在較大突變、音頻不流暢的問題,這里對自然音音頻庫進行編號處理。首先,依次求取自然音音頻庫內各音頻片段(假設為 x)與基礎自然音(假設為 y)的互相關系數:
![]() |
其中
為信號 x 的平均值,
為信號 y 的平均值。
接著,挑選出相關系數在[0.3,0.8]的音頻片段作為有效片段,并按相關程度由強自弱進行編號。將相關性在 0.3 以下和 0.8 以上的音頻片段予以舍棄,從而在一定程度上避免映射合成的音頻產生突變和重復性過高的問題。互相關系數與相關程度的定義如表 1 所示。

3 基于個性化自然音音庫和 IFS 算法合成分形自然音
研究表明,將分形技術用于音樂譜曲可使合成的音樂具有可預測而又不單調、隨機而又統一的分形特征,此特征正好符合耳鳴康復音的要求[6-8]。基于此,本文選取 IFS 分形算法[15]生成的分形序列作為映射序列來控制康復音的合成。
圖 3 即為本文的治療聲映射合成過程:① 將原始 IFS 序列經線性方法處理獲得整數分形序列;② 以整數分形序列的最大值最小值的差值作為區間跨度,并將其劃分為與音頻庫內音頻數量相同的區間得到編號區間;③ 判定分形序列值對應的區間,映射音頻庫內對應編號的音頻以合成分形自然音。

4 仿真分析及試聽分析
本文通過 1/f 波動和分形維度分析合成治療音的整體相似不重復特性,通過對比實驗分析合成治療音個性化匹配的特征,通過耳鳴模型[16]刺激效果分析合成治療音對耳鳴的治療作用,最后通過試聽分析對合成治療音進行主觀檢驗。
4.1 1/f 波動分析
1/f 波動在局部呈無序狀態但在宏觀上卻存在相關性,這種波動可使人感到舒適,大多數音樂和舒適的聲音均符合 1/f 波動[16-17]。功率譜
是信號時間相關性的一個重要量度,表示信號在頻率 f 處均方根的變化,其關系為:
![]() |
其中 β 為標準指數,當 β 在[0.5,1.5]范圍內時,可將信號看作是 1/f 波動。
本文 IFS 分形序列控制康復自然音的最終映射合成,分形序列的波動特性直接決定音頻的整體特性。將 IFS 產生的分形序列和經線性處理后用于映射合成的序列均進行 1/f 波動分析。如圖 4 所示,圖中橫、縱軸分別為頻率和功率譜的對數值。

由圖 4 可知,IFS 迭代系統產生的分形序列和映射所用序列的功率譜擬合曲線斜率分別為–0.938 1(即β = 0.938 1)和–0.937 8(即β = 0.937 8),均符合 1/f 波動特性,說明線性處理過程并不破壞分形序列的波動特性。該結果表明,合成的康復音具有整體的穩定性,可使人感到舒適和放松[16-17]。
4.2 分形維度分析
分形維度表征了分形在幾何變換下的標度無關性,可體現局部與整體的相似特征。合成自然音的分形維度特征可由相鄰自然音片段編號差 i 及其出現的頻率 Fi 來表示。當 i 與 Fi 滿足關系式:
![]() |
即當
與
存在以–D 為斜率的線性關系時表示合成自然音具有分形的自相似特性[8-9]。表 2 為對一段時長為 20 min 的合成自然音進行的相關統計,圖 5 表示 i 與
的對數域擬合關系。


由表 2 可知,相同音頻片段連續出現次數(i = 0)較少,同時音頻編號差較大的情況(i > 10)也較少出現,說明音頻無大量的重復性和明顯突變性。由 圖 5 可知,
與
為近似線性關系,說明音頻具有整體的自相似特性。
4.3 合成音頻對比分析
用文獻[10]方法合成 IFS 分形音樂,并將其由 MIDI 格式轉化為 wav 格式;用本文方法,以流水聲為基礎音構造流水聲音頻庫,合成分形流水聲 1;對該流水聲音頻庫進行個性化處理(增加 2~5 kHz 頻段音頻比例),以相同的分形序列映射合成分形流水聲 2。對合成的音頻分別進行頻譜分析,如圖 6 所示。

圖 6 中,分形流水聲 1 頻率集中在 2 kHz 內;相較于分形流水聲 1,分形流水聲 2 頻譜中 2~5 kHz 的頻率成分相應增加,這與個性化調整的預期效果相一致。據此,患者可根據自身需求構造對應自然音音頻庫來合成治療音,以實現個性化適配。由于音庫的限制,文獻[10]方法合成的 IFS 分形音樂頻率集中在 1 kHz 內,其頻率成分單一,很難進行個性化適配。
為進一步體現本文合成康復音的特點,這里選取鳥叫聲和蟬鳴聲分別合成分形鳥叫聲和分形蟬鳴聲,其頻譜對比如圖 7 所示。由圖可知,選取不同的基礎自然音,所得的合成分形自然音呈現不同的頻率特性:分形蟬鳴聲頻率較為集中,對于耳鳴聲頻率特性明顯的患者具有良好的適配效果;分形鳥叫聲頻譜較寬,正好適用于耳鳴聲頻率豐富難辨的患者。

4.4 耳鳴模型刺激分析
為驗證合成耳鳴治療音能在一定程度上抑制耳鳴,這里基于文獻[18]提出的一種自適應耳鳴模型進行了聲音刺激分析,該模型可有效模擬耳鳴的產生及聲音療法對耳鳴的抑制作用。實驗假設第三條聽覺通路損傷(即耳鳴聲頻段為 5.15~6.05 kHz)。實驗時長為 80 s,在第 20~60 s 輸入上述分形蟬鳴聲(頻率集中在 4~6 kHz)和 IFS 分形音樂(頻率集中在 1 kHz 內)分別刺激模型,仿真結果如圖 8 所示。

對比兩幅圖可以發現,在加入分形蟬鳴聲后,由于其頻率范圍處在耳鳴聲頻段范圍內,經過一段時間刺激,耳鳴自發信號得到抑制,模型輸出功率逐漸減弱;60 s 時撤去刺激信號,輸出功率逐漸上升,耳鳴癥狀復發。而加入 IFS 分形音樂后,由于其頻率不在耳鳴聲頻段范圍內,無法抑制耳鳴自發信號,因此模型輸出功率維持不變。
4.5 試聽分析
前面進行了詳細的仿真分析,在理論上論證了治療音的各項特性。本節通過試聽實驗對合成治療音進行主觀評價。需要說明的是,試聽實驗是對合成治療音聽覺效果(重復度、突變度和舒緩度)的主觀檢驗,因不涉及治療效果的評價,故選取聽力狀況良好的正常人進行試聽。該試聽僅作為對本文合成治療音的初步聽覺效果分析,在臨床中還需要根據耳鳴患者的具體情況調節相關參數以達到治療目的。
試聽人員共 45 名(男 20 名,女 25 名),均為年齡 18~25 歲的在校學生。試聽人員在相對安靜的環境中進行試聽。試聽設備為 Lenovo 小新潮 7000 電腦播放器。試聽音頻為本文基于 3 種不同的自然界聲音(流水聲、鳥叫聲、風聲)合成的 3 種分形自然音片段,分別為 frag1、frag2 和 frag3。每段音頻的試聽時長為 3 min,每次試聽時 frag1、frag2 和 frag3 輪流播放,每段音頻試聽間隔為 1 min。每位試聽人員共進行一輪試聽,試聽結束即刻依據完全不重復、相似不重復、重復、流暢及舒緩五項要素對 frag1、frag2 和 frag3 分別進行評判。評判過程為:針對每一種音頻片段每位試聽人員從各要素中選擇出最符合該音頻特性的要素,五項要素中完全不重復、相似不重復和重復只能選其一,舒緩和流暢這兩項可同時選擇、同時不選或選擇其一。試聽統計結果如表 3 所示。

分析表 3,分別約 77.8%、66.7% 和 64.4% 的試聽人員認為 frag1、frag2 和 frag3 具有相似不重復特性,該結果表明大部分試聽者認為合成治療音是相似但不重復的,這與仿真實驗所述的特征相吻合;分別約 75.6%、68.9%、80.0% 的試聽人員認為 frag1、frag2 和 frag3 舒緩悅耳;分別約 66.7%、62.2% 和 66.7% 的試聽者認為 frag1、frag2 和 frag3 前后流暢無明顯突變。上述試聽結果說明本文合成的治療音具有整體相似不重復性,且聲音流暢舒緩無明顯突變,有助于聽者放松心情。
5 結論
本文提出了一種基于 IFS 的個性化耳鳴康復自然音合成方法。IFS 系統產生的分形序列具有隨機性和可預測性的平衡,保證了合成治療音整體的相似但不重復特性;自然音天然的舒適性和豐富性增加了合成治療音的舒緩性,可使聽者放松;基礎自然音的選取和自然音庫的構造過程與患者緊密相關,具有個性化適配的特性。仿真實驗驗證了合成治療音的個性化匹配的效果、整體的 1/f 波動特性、分形特性和對耳鳴模型的抑制效果。因此,本文提出的康復音合成方法對運用聲音療法治療耳鳴具有一定借鑒意義。