已有研究表明,人格評估可以通過構建基于腦電信號的回歸模型實現。已有研究大多使用事件相關電位或功率譜密度特征進行人格評估,所表示的大腦信息局限于單個區域,但有研究發現認知功能更多依賴于腦區間的相互作用。此外,腦電特征可能存在被試間分布差異,會導致訓練得到的回歸模型在跨被試人格評估中難以取得準確結果。為了獲得更精準的跨被試人格評估結果,本研究提出一種結合腦電功能連接特征和領域自適應技術的人格評估方法。本研究收集了45名正常人在不同情緒圖片(正、中、負)刺激下的腦電信號,首先計算59個電極間在5個頻段上的相干性作為原始特征集。然后使用基于特征的領域自適應方法將相干特征映射至新的特征空間,在新的特征空間里減小訓練集和測試集的分布差異,從而減小被試間差異性。最后采用留一法交叉驗證的方式,使用轉換后的特征集對支持向量回歸模型進行訓練和測試。實驗結果顯示,相比已有研究使用的方法,本文提出的方法提高了回歸模型性能,能得到更好的人格評估結果。本研究為人格評估提供了一種新的測量方法和手段。
引用本文: 許子明, 周月瑩, 溫旭云, 牛一帆, 李子遇, 徐西嘉, 張道強, 鄔霞. 基于腦電功能連接特征和領域自適應的跨被試人格評估. 生物醫學工程學雜志, 2022, 39(2): 257-266. doi: 10.7507/1001-5515.202105033 復制
引言
人格表征個體行為模式的內在特征,可預測個體在特定情境下的行為、想法和情緒[1]。到目前為止,心理學家已經提出許多人格測量理論[2-6],其中,五因素模型是人格研究中最主要和常用的模型[7]。五因素模型也被稱為大五人格特質,主要由五個維度組成:外向性、宜人性、盡責性、神經質、開放性[8]。已有研究表明,大五人格在戀愛關系[9]、學業成績[10]、事業發展[11]等方面都有影響,因此人格的精準評估很重要。
現有的人格評估方法主要依靠自我測評量表[12]。這種方法需要受試者根據自己的實際情況對一系列描述具體行為特征的陳述句進行回答。常用的量表包括NEO-Personality-Inventory Revised(NEO-PI-R)[13]、NEO Five Factor Inventory(NEO-FFI)[14]等。由于自評量表具有簡便易行、成本較低且易于解釋等優點,一直以來都是最受歡迎的人格評估方法。然而,由于社會期許性的存在[15],自評方式容易受主觀因素的影響,導致主觀偏差[16]。因此,有研究者采用其他類型數據對人格進行客觀評估,包括社交軟件使用數據[17]、視覺數據(面部表情圖片等)[18]、眼動數據[19]、腦電數據[12]等。
雖然現有研究已經嘗試使用多種類型數據進行人格客觀評估,但社交軟件使用數據和行為數據等數據存在心理機制解釋性較弱等問題[16]。以腦電為代表的神經生理信號具有客觀性強、實際可行性好等優點,且有大量研究證實人格特質存在生物基礎[20-24],因此利用神經信號進行人格評估得到越來越多關注[16]。其中,腦電便攜性好、運行成本低,適合應用于實際的人格評估[25]。
目前基于腦電進行人格評估的研究多采用分類方法[26-30],分類維度相對粗糙,實際意義有限。盡管有少部分研究采用回歸方法對人格分數進行預測[12,25,31],但主要采用事件相關電位(event related potential,ERP)[25]和功率譜密度(power spectral density,PSD)[12,31]特征進行人格回歸預測,所反映的大腦變化情況局限于單個區域,但人的認知過程依賴于大腦區域間的相互作用[32]。有研究表明人格與大腦功能網絡間存在顯著相關性[33],而且基于腦電功能連接特征的人格分類研究也取得較好的結果(大五人格中有四個維度的二分類準確率大于80%)[26]。因此,本研究使用相干(coherence,COH)功能連接特征進行人格回歸預測。COH特征用于衡量兩個信號在特定頻段或頻率點的線性關系[34],已被應用在基于腦電的人格分類[26]、身份識別[35]等領域。本文使用電極間COH功能連接特征,嘗試從新的角度對人格進行探究。
目前基于腦電信號的跨被試人格回歸研究一般采用彈性網稀疏正則化回歸模型,研究者在n ? 1個被試的數據上進行特征選擇和回歸模型訓練,回歸模型在剩余的1個被試數據上得出人格預測分數[12,25]。上述研究采用的機器學習方法一般假設訓練數據和測試數據是獨立同分布的,但是由于腦電信號的個體差異性,被試間的數據分布可能不滿足獨立同分布條件[36]。因此,訓練出的機器學習模型可能很難適用于跨被試腦電信號分析[37],影響跨被試人格評估的準確性。針對這一問題,本文使用遷移學習中的領域自適應方法減小腦電信號個體差異帶來的負面影響。領域自適應方法通過在特征、實例、模型三個層面上對訓練集和測試集樣本進行適配,減小訓練集和測試集樣本的分布差異,從而提升機器學習模型的預測性能。該方法已被應用在基于腦電信號的跨被試情緒識別[36]、認知負荷評估[38]等領域,取得較好的結果。因此,本文使用基于特征的領域自適應方法,通過減小訓練集和測試集樣本的分布差異,使得回歸模型能夠實現更準確的跨被試人格評估。
本研究提出一種結合腦電功能連接特征和領域自適應的大五人格評估方法,利用腦區間交互信息并減小腦電個體差異性帶來的數據分布差異,從而提升人格評估結果。實驗采集45名參與者在情緒刺激下的腦電數據,基于電極間COH功能連接特征,使用基于特征的領域自適應方法,同時考慮訓練集(源域)和測試集(目標域)的邊緣分布差異和條件分布差異,并調整適配過程中兩種分布差異的重要性,根據類別比例對不同的數據類別加權處理。此外,為了說明所提出的領域自適應方法和COH功能連接特征對人格評估結果的影響,本實驗還提取了ERP和PSD兩種腦電特征,并對比了之前研究使用的彈性網稀疏正則化回歸模型[12,25]。
1 實驗與材料
1.1 參與者
在本實驗中,來自南京航空航天大學的45名大學生(17名女性和28名男性,平均年齡24.52歲,年齡分布于20~30歲)參加了這項研究。所有參與者均聽力正常,視力正常或矯正正常,沒有任何腦部或精神疾病,除一名參與者為左利手,其余44名參與者均為右利手。實驗前一天晚上要求參與者保持充足的睡眠時間。所有參與者均簽署一份書面知情同意書。
1.2 實驗范式
已有研究較多使用情緒刺激下的腦電開展人格評估[12,25-30],因此本文也采用這種刺激。本文采用150張情緒圖片作為刺激材料,其中正向情緒圖片50張,負向情緒圖片50張,中性情緒圖片50張,所有圖片均選自中國情緒圖片系統[39]。考慮到效價和喚醒度,選擇高效價、高喚醒的前50張圖片作為正向情緒圖片,低效價、高喚醒的前50張圖片作為負向情緒圖片,中性圖片喚醒度均為中。使用中國版的大五人格量表[3]評估被試人格特質,該量表是一個5級的李克特量表(0,1,2,3,4),共有240個項目,外向性、宜人性、盡責性、神經質、開放性各有48項,各維度的內部一致性為0.77~0.92[40]。
為了更貼近真實場景,實驗在沒有任何電屏蔽的常規實驗室環境中進行,情感圖片在15 inch液晶屏幕上呈現,被試坐在離顯示器屏幕約60 cm的舒適椅子上。在實驗開始之前,要求被試盡量認真準確地填寫大五人格問卷,并告知被試實驗具體流程和細節。
本研究的實驗范式參考文獻[41]設計,具體流程如圖1所示。在實驗過程中,150張情緒圖片隨機呈現,實驗分為三組,每兩組之間有1 min的休息時間,每組包括50次實驗,每個實驗包括2 s的空白界面使被試靜息休息,2 s的十字圖片用來集中被試注意力,4 s的情緒圖片顯示用于誘發被試的情緒狀態。在正式實驗開始前,被試觀看3張新的情緒圖片以熟悉實驗過程。在正式實驗中,要求被試盡可能保持靜止,并在情緒圖片出現時盡量保持不眨眼觀看圖片,以防止人工偽跡對腦電的影響。

1.3 腦電圖記錄和預處理
本研究使用64通道便攜式無線腦電圖系統(NeuSen. W64,博睿康,中國)進行數據采集,采樣率為1 000 Hz。根據國際標準10-20系統,記錄59個電極的腦電數據:AF3/4、AF7/8、Fp1/2、Fz、F1/2、F3/4、F5/6、F7/8、FC1/2、FC3/4、FC5/6、FCz、Cz、C1/2、C3/4、C5/6、FT7/8、T7/8、TP7/8、CP1/2、CP3/4、CP5/6、FPz、Pz、P3/4、P5/6、P7/8、PO3/4、PO5/6、PO7/8、POz、Oz、O1/2,并以CPz為參考電極,AFz為接地電極。在實驗過程中,所有電極的阻抗都保持在5 kΩ以下。
本研究使用EEGLAB[42]工具箱對腦電進行預處理。首先,在通道定位后,原始腦電數據經過1~45 Hz的帶通濾波,進行全腦平均重參考,并降采樣到250 Hz。其次,進行腦電數據分段(從刺激前1 000 ms到刺激后4 000 ms),去除刺激前的基線。然后,使用獨立成分分析(independent component analysis,ICA)將腦電信號分解為獨立成分,使用ADJUST[43]和ICLabel[44]插件去除眼動、肌肉運動等偽跡的影響。最后,去除峰峰電壓變化超過±100 μv的腦電信號段,以避免可能的偽影污染。由于噪聲污染嚴重,將3名被試的數據排除在外,剩下的42名被試數據用于后續分析。
2 方法
實驗整體流程如圖2所示(以COH特征為例)。在經過數據采集和預處理后,該模型首先計算不同電極間的相干性,以電極間的COH功能連接作為特征。考慮到被試間可能存在分布差異,本研究采用基于特征的領域自適應方法進行特征轉換,以減小被試間差異性。最后將轉換后的特征輸入到支持向量回歸(support vector regression,SVR)模型,分別構建大五人格五個維度下的回歸模型,實現基于腦電信號的大五人格分數預測。

2.1 腦電特征提取
本文使用電極間COH特征作為腦電功能連接特征,對于每個腦電數據段,基于漢寧窗計算59個電極間在五個頻段(δ:1~4 Hz;θ:4~8 Hz;α:8~13 Hz;β:13~30 Hz;γ:30~45 Hz)的COH特征(只使用刺激發生后4 s的腦電數據)。COH特征的計算方法如式(1)所示:
![]() |
其中, 是腦電信號x和y的互譜,
和
分別是腦電信號x和y的功率譜,f是離散頻率。
衡量兩信號x和y之間的相干性,取值范圍為[0, 1]。對于每個被試的每個樣本,計算得到59個電極在5個頻段上的COH特征后,將所有特征拼接成一個特征向量,最終得到8 555維的功能連接特征[(59(電極數)×(59 ? 1)/2)× 5(頻段數)= 8 555]。
對于ERP特征,本研究只使用刺激發生后1 s的時域采樣點作為ERP特征,對于每個被試的每個樣本,可以得到14 750維的ERP特征[59(電極數)× 1 s × 250 Hz(采樣率)= 14 750]。對于PSD特征,本研究使用Welch法計算五個頻段(與COH特征相同)的平均PSD特征,對于每個被試的每個樣本,可以得到295維的PSD特征[59(電極數)× 5(頻段數)= 295]。
2.2 基于特征的領域自適應
基于特征的領域自適應方法旨在找到一個特征映射函數β,通過映射減小源域和目標域數據的分布差異。假設 和
分別代表源域樣本和目標域樣本,
和
分別代表源域樣本標簽和目標域樣本標簽,領域自適應方法通過映射函數β盡可能減少源域和目標域數據邊緣分布和條件分布的差異,即令:
和
。
本文采用主成分分析(principal component analysis,PCA)對源域和目標域的特征進行降維重構,在新的空間中最小化特征分布差異,從而獲得新的特征表示。PCA是一種數據的線性降維方式,它可以將數據映射到一個新的空間,通過在新的空間里最大化樣本協方差對數據進行降維重構。具體地說,記 是所有樣本的矩陣;
是中心矩陣;m為樣本維度;n為總樣本數;1是
的全1矩陣。協方差矩陣可用
計算。PCA學習的目標是找到正交變換矩陣
,最大化樣本協方差,即:
![]() |
tr()表示矩陣的跡。最優問題可通過對 進行分解得到,其中
是q個最大特征值。
是變換矩陣,源域和目標域降維后的特征矩陣可以由
得到。
本文使用最大均值差異(maximum mean discrepancy,MMD)[45]作為源域和目標域的距離度量,并減小邊緣概率分布 和
,以及條件概率分布
和
所組成的聯合概率分布[46]的差異。考慮到邊緣分布自適應和條件分布自適應可能不是同等重要[47],所以采用平衡因子 μ 動態調整兩個分布的重要性,源域和目標域的MMD計算如式(3)所示:
![]() |
其中,ns為源域樣本數,nt為目標域樣本數,c表示樣本類別,、
和
、
分別表示源域和目標域中屬于類別c的樣本集合和樣本數。式(3)的第一項表示源域和目標域的邊緣概率分布差異,第二項表示源域和目標域的條件概率分布差異。
當源域和目標域的邊緣分布相對接近時,遷移學習的性能高度依賴條件分布[47]。但平衡分布自適應在計算條件分布時,利用 近似
,隱含假設此類在源域和目標域中的概率是相似的[47],但在現實中通常不是這樣。于是本文在計算條件概率分布時,對源域和目標域的類別根據比例加權,即:
![]() |
其中, 和
為權值,由于該方法會減小邊緣分布差異,所以假定
和
是相同的。則條件分布MMD距離可以計算為:
![]() |
綜上,源域和目標域的加權平衡分布自適應MMD距離為:
![]() |
其中M0是 MMD 矩陣:
![]() |
其中c∈(1,2,?,C)表示樣本類別,Wc為加權 MMD 矩陣:
![]() |
通過進一步利用矩陣技巧和正則化,最優化目標可以表示為:
![]() |
取拉格朗日乘子為 ,則上式的拉格朗日函數為:
![]() |
令 ,得到廣義特征值分解:
![]() |
最后可以通過求解上式的k個最小特征向量獲得最優變換矩陣A。
2.3 回歸模型與參數設置
在通過加權平衡分布自適應方法減小降維后源域和目標域數據分布差異,得到新的特征矩陣后,本文采用SVR構建回歸模型。對42個被試采用留一被試交叉驗證,每次將41個被試的腦電數據作為訓練集(源域),將剩下的1個被試的腦電數據作為測試集(目標域)。將經過特征降維和轉換后的訓練集特征矩陣輸入到SVR訓練,在測試集上得到每個被試五個人格維度上的預測分數。由于加權平衡分布自適應方法一般用來處理分類問題,在計算條件分布時需要用到標簽信息,但人格自評分數是一個連續值,不適合直接作為標簽,因此,將情緒圖片的情緒標簽(正、負、中)作為數據的標簽信息用于計算條件分布。
在本文方法中,需要設置平衡因子μ、正則化參數λ、子空間維數k三個參數,為了找到最優值,對三個參數進行遍歷,其中μ{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0},k
{10,20,30,40,50,60,70,80,90,100},μ
{0.01,0.1,1,10,100}。實驗通過保持其中兩個參數不變,改變第三個參數的值來尋找最優參數。
3 實驗結果
3.1 基于中國版大五人格量表的人格自評結果
42名被試在大五人格五個維度分數的平均值和標準差為(采用均值±標準差,平均值的分布范圍為0~4):神經質2.05 ± 0.51,外向性2.15 ± 0.35,開放性2.30 ± 0.25,宜人性2.48 ± 0.33,盡責性2.38 ± 0.37。五個人格維度的自評分數經Shapiro-Wilk正態分布檢驗驗證,均滿足正態分布。
3.2 基于腦電信號的大五人格預測結果
本文使用兩個指標衡量人格預測模型的性能:平均誤差和相關性。平均誤差為五個維度人格自評和人格預測結果的平均絕對值誤差,相關性為五個維度人格自評和人格預測結果的皮爾森相關系數,范圍為[?1, 1]。在人格評估模型的實際應用中,需要更關注平均誤差的大小,平均誤差越小,人格預測模型的性能越好。
為了說明所提出的領域自適應方法和COH功能連接特征對人格評估結果的影響,本文對比了之前研究所使用的ERP、PSD特征和彈性網稀疏正則化回歸模型[12,25]。對于三種特征(COH、ERP、PSD)采取兩種處理方式,一種是參照文獻[25]的方法,對每個被試每種特征下的所有樣本進行樣本平均,使得每個被試在每種特征下只有一個樣本。另一種不進行樣本平均,使用每個被試每種特征下的所有樣本。由于之前文獻使用的方法需要設置相關性P值的閾值進行特征篩選[12,25],為了找到最優P值,對P值進行遍歷,P{0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1}。大五人格預測結果如表1所示(相關性取預測誤差最小時的皮爾森相關系數)。由表1可知,對于ERP特征,樣本平均+彈性網稀疏正則化回歸方法中得到最小的大五人格平均預測誤差;對于PSD特征和COH特征,本文方法在兩種特征中均得到最小的大五人格平均預測誤差。此外,在表1所有特征 + 方法的組合結果中,COH特征+本文方法的組合得到最小的大五人格平均預測誤差。

3.3 樣本分布可視化結果
為了說明三種腦電特征在被試間是否存在分布差異,以及領域自適應方法對三種特征分布差異的改變,本研究使用t-隨機鄰近嵌入(t-distributed stochastic neighbor embedding,t-SNE)方法[48]降維可視化被試樣本分布。t-SNE是一種數據降維和可視化方法之一,它將數據點之間的相似度轉化為條件概率,然后最小化原始空間和嵌入空間的聯合概率分布的KL散度,將高維空間中的數據映射到低維空間中,不僅可以減少信息冗余,還可以保持局部樣本聚類的空間分布。本文使用t-SNE的目的是在二維空間中更好地觀察三種特征的樣本分布,從而說明本文方法的可行性。三種特征在不同情況下的樣本分布如圖3所示,其中第一列圖中,每一種顏色的點分別代表一個被試的樣本;第二列和第三列圖中,訓練集(源域)包含41個被試的樣本,測試集(目標域)包含剩下的1個被試的樣本。在圖3中,PSD特征和COH特征的樣本原始分布具有明顯的被試數據分簇現象,在相關研究中被稱為“個體聚集”,并被認為是腦電個體差異的表征[49]。因此對于跨被試人格評估,結合被試樣本分布圖和誤差結果可知,當測試集被試樣本同樣集中于一簇時不利于人格評估,而分散分布于訓練集樣本中能得到更低的誤差,這與文獻[49]結論相似。

4 討論
本研究提出一種利用腦電COH功能連接特征和領域自適應技術的人格評估方法。該方法利用腦區間交互信息,通過領域自適應技術減小腦電數據被試間的分布差異,提高回歸模型的預測性能,并與以往人格評估研究中所使用的腦電特征和回歸模型進行對比。
由表1可知,在樣本平均 + 彈性網稀疏正則化回歸方法的結果中,ERP特征得到三種特征中最小的大五人格平均預測誤差,也是基于ERP特征所有結果中的最好結果。在樣本平均 + 彈性網稀疏正則化方法中,ERP 和PSD特征比COH特征取得更低的誤差,尤其是在神經質、盡責性上具有相關性,這與文獻[12,25]的結果具有相同的趨勢。在該方法中,對每種特征在三種情緒刺激下的所有樣本分別經過平均和拼接后再進行模型訓練和測試。對于ERP特征,ERP的平均響應方法被廣泛使用[50],在樣本疊加平均之后可以去除背景噪聲[51],所以有較好結果。但是由于被試數量較少,ERP特征未能在五個人格維度上都具有相關性(文獻[12,25]報道在五個人格維度上都具有相關性),模型性能受限。對于PSD特征,已有研究表明在靜息態和情緒刺激狀態下,樣本平均后的PSD特征與人格之間具有相關性[52-54]。COH特征表現較差的原因可能是經過樣本平均之后,丟失較多的單試次腦電信息,而基于單試次功能連接特征進行人格分類的研究已取得較好的結果[26]。
由表1可知,在所有樣本+彈性網稀疏正則化回歸方法的結果中,COH特征得到三種特征中最小的大五人格平均預測誤差。分別對比三種特征在樣本平均和所有樣本兩種情況下的結果可知,ERP和PSD特征在所有樣本情況下的平均預測誤差比樣本平均情況下有較大增加,而COH特征在所有樣本情況下的平均預測誤差比樣本平均情況下則略有減小。究其原因,對于ERP特征,單次ERP不顯著,疊加平均之后才會有明顯的現象。對于PSD特征,如圖3所示,雖然所有被試樣本的原始分布整體比較集中,但是對于每個被試而言,其大部分樣本各自聚集成一簇,與圖3中PSD特征使用領域自適應后的樣本分布相比,測試集樣本的原始分布“個體聚集”較為明顯,由此推斷出測試集樣本分布越分散,得到的預測結果越好,而測試集樣本分布越集中,可能越不利于人格預測。而且在PSD特征的所有被試樣本原始分布中,仍有一些被試樣本偏離總體分布。對于COH特征,所有樣本的情況下具有更多的腦電數據樣本,但是,如圖3所示,COH特征在被試之間、訓練集和測試集之間具有明顯的分布差異,存在顯著的個體聚集現象,受限于分布差異的影響,樣本數量增加所帶來的提升效果有限。
由表1可知,相比于所有樣本+彈性網稀疏正則化回歸方法,三種特征在本文方法都可以得到更小的大五人格平均預測誤差。此外,PSD特征和COH特征在本文方法中分別得到三種方法中最好的結果。結果說明在全樣本情況下,本文提出的方法適用于不同類型的特征,可以提升不同特征下人格評估結果的準確性。具體地說,對于ERP特征,如圖3所示,雖然被試間原始樣本分布不存在明顯個體聚集現象,本文方法可以對每個人格維度的訓練集和測試集樣本分布進行調整,在部分人格維度上(神經質和宜人性)對結果有提升。但是受限于單次ERP不顯著的影響,ERP在本文方法中的結果比樣本平均+彈性網稀疏正則化回歸方法的結果差。對于PSD特征,單試次PSD特征已經被廣泛應用于人格評估中[27-31]。此外,如圖3所示,領域自適應方法可以改變測試集樣本分布,減小分布差異,并使其分散分布于訓練集樣本中,提升回歸模型的預測性能,得到了PSD特征在三種方法中的最好結果。對于COH特征,如圖3所示,使用領域自適應方法后,減小了訓練集和測試集的分布差異,從而提升了跨被試人格評估的結果。相比于單樣本不顯著的ERP特征和維數有限的PSD特征,COH特征不需要樣本疊加平均且特征維數較大(8 555維),而且COH特征可以表示大腦區域之間的相互作用。因此在使用領域自適應方法減小分布差異后,COH特征可以得到更好的人格評估結果。
本文針對腦電個體差異所導致的被試間數據分布差異,利用領域自適應方法減小這一差異,與之前相關文獻使用的方法相比,本文提出的基于COH特征的領域自適應方法取得所有對比結果中最低的大五人格平均絕對值誤差(0.278 5)。但是,本研究也存在一些不足之處。第一,本研究使用的被試數量相對較少,會導致數據的標簽分布不均勻,可能產生數據和標簽的非線性關系,影響模型預測結果(特別是線性回歸模型),使得某些人格維度上的相關性較弱或沒有相關性。第二,本文使用頭皮腦電建立功能連接,對人格的神經機制探究相對受限。有研究認為,功能連接分析應該在大腦的源空間進行,而不是在頭皮上,并且要有足夠數量的傳感器[55]。第三,領域自適應方法雖然減少了被試間數據分布差異,但在模型訓練中使用了源域所有被試的所有樣本,與目標域數據相比極為豐富。但可能不是所有被試的樣本對于知識遷移和共享都是有益的,一些樣本可能會對結果產生負遷移影響。因此,在未來進一步的工作中,可以采用源域選擇[37]等方式減少源域中無關樣本的負面影響。
此外,還有一些研究方向也許可以幫助建立更快速和準確的人格評估系統。第一,五個人格維度之間往往不是完全孤立的,存在一定相關性[56-57],例如宜人性較高的個體,其開放性也偏高。因此,利用不同人格維度間的關聯性有望提高人格評估結果。已有研究使用多任務學習方法利用人格維度間的關聯性,基于手機使用數據對大五人格進行評估[58]。第二,現有基于腦電的人格評估研究多采用情緒刺激下的腦電數據(主要是情緒視頻刺激),采集數據所需時間相對較長(25~90 min)。只有一項研究采用情緒詞語作為刺激材料[16],腦電數據采集時間僅需5 min左右。較短的數據采集時間有利于人格評估系統的實際應用,因此小樣本學習[59]等方法,可以在減少刺激數量、縮短數據采集時間的同時保持人格評估系統的穩定性。
5 結論
本文提出一種基于情緒刺激下腦電功能連接特征,利用領域自適應技術,進行跨被試人格評估的方法。該方法可以利用腦區間的交互信息并減小腦電個體差異導致的被試間數據分布差異,從而提升回歸模型的預測性能。與以往相關文獻相比,本文提出的方法得到了更優的跨被試人格評估結果。由于該方法通過不易偽造的客觀生理數據對被試進行人格評估,不涉及被試的主觀感受,因此可以應用到實際場景中,減少社會期許性的不良影響,為人格評估提供一種新的測量方法和手段。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:許子明主要負責數據分析、論文編寫以及算法程序設計;周月瑩和溫旭云主要負責實驗數據采集和論文修訂;牛一帆和李子遇主要負責實驗流程設計、數據預處理;徐西嘉、鄔霞和張道強主要負責提供實驗指導、數據分析指導、論文審閱修訂。
倫理聲明:本研究通過了南京醫科大學附屬南京腦科醫院倫理委員會的審批(批文編號:2017-KY017)。
引言
人格表征個體行為模式的內在特征,可預測個體在特定情境下的行為、想法和情緒[1]。到目前為止,心理學家已經提出許多人格測量理論[2-6],其中,五因素模型是人格研究中最主要和常用的模型[7]。五因素模型也被稱為大五人格特質,主要由五個維度組成:外向性、宜人性、盡責性、神經質、開放性[8]。已有研究表明,大五人格在戀愛關系[9]、學業成績[10]、事業發展[11]等方面都有影響,因此人格的精準評估很重要。
現有的人格評估方法主要依靠自我測評量表[12]。這種方法需要受試者根據自己的實際情況對一系列描述具體行為特征的陳述句進行回答。常用的量表包括NEO-Personality-Inventory Revised(NEO-PI-R)[13]、NEO Five Factor Inventory(NEO-FFI)[14]等。由于自評量表具有簡便易行、成本較低且易于解釋等優點,一直以來都是最受歡迎的人格評估方法。然而,由于社會期許性的存在[15],自評方式容易受主觀因素的影響,導致主觀偏差[16]。因此,有研究者采用其他類型數據對人格進行客觀評估,包括社交軟件使用數據[17]、視覺數據(面部表情圖片等)[18]、眼動數據[19]、腦電數據[12]等。
雖然現有研究已經嘗試使用多種類型數據進行人格客觀評估,但社交軟件使用數據和行為數據等數據存在心理機制解釋性較弱等問題[16]。以腦電為代表的神經生理信號具有客觀性強、實際可行性好等優點,且有大量研究證實人格特質存在生物基礎[20-24],因此利用神經信號進行人格評估得到越來越多關注[16]。其中,腦電便攜性好、運行成本低,適合應用于實際的人格評估[25]。
目前基于腦電進行人格評估的研究多采用分類方法[26-30],分類維度相對粗糙,實際意義有限。盡管有少部分研究采用回歸方法對人格分數進行預測[12,25,31],但主要采用事件相關電位(event related potential,ERP)[25]和功率譜密度(power spectral density,PSD)[12,31]特征進行人格回歸預測,所反映的大腦變化情況局限于單個區域,但人的認知過程依賴于大腦區域間的相互作用[32]。有研究表明人格與大腦功能網絡間存在顯著相關性[33],而且基于腦電功能連接特征的人格分類研究也取得較好的結果(大五人格中有四個維度的二分類準確率大于80%)[26]。因此,本研究使用相干(coherence,COH)功能連接特征進行人格回歸預測。COH特征用于衡量兩個信號在特定頻段或頻率點的線性關系[34],已被應用在基于腦電的人格分類[26]、身份識別[35]等領域。本文使用電極間COH功能連接特征,嘗試從新的角度對人格進行探究。
目前基于腦電信號的跨被試人格回歸研究一般采用彈性網稀疏正則化回歸模型,研究者在n ? 1個被試的數據上進行特征選擇和回歸模型訓練,回歸模型在剩余的1個被試數據上得出人格預測分數[12,25]。上述研究采用的機器學習方法一般假設訓練數據和測試數據是獨立同分布的,但是由于腦電信號的個體差異性,被試間的數據分布可能不滿足獨立同分布條件[36]。因此,訓練出的機器學習模型可能很難適用于跨被試腦電信號分析[37],影響跨被試人格評估的準確性。針對這一問題,本文使用遷移學習中的領域自適應方法減小腦電信號個體差異帶來的負面影響。領域自適應方法通過在特征、實例、模型三個層面上對訓練集和測試集樣本進行適配,減小訓練集和測試集樣本的分布差異,從而提升機器學習模型的預測性能。該方法已被應用在基于腦電信號的跨被試情緒識別[36]、認知負荷評估[38]等領域,取得較好的結果。因此,本文使用基于特征的領域自適應方法,通過減小訓練集和測試集樣本的分布差異,使得回歸模型能夠實現更準確的跨被試人格評估。
本研究提出一種結合腦電功能連接特征和領域自適應的大五人格評估方法,利用腦區間交互信息并減小腦電個體差異性帶來的數據分布差異,從而提升人格評估結果。實驗采集45名參與者在情緒刺激下的腦電數據,基于電極間COH功能連接特征,使用基于特征的領域自適應方法,同時考慮訓練集(源域)和測試集(目標域)的邊緣分布差異和條件分布差異,并調整適配過程中兩種分布差異的重要性,根據類別比例對不同的數據類別加權處理。此外,為了說明所提出的領域自適應方法和COH功能連接特征對人格評估結果的影響,本實驗還提取了ERP和PSD兩種腦電特征,并對比了之前研究使用的彈性網稀疏正則化回歸模型[12,25]。
1 實驗與材料
1.1 參與者
在本實驗中,來自南京航空航天大學的45名大學生(17名女性和28名男性,平均年齡24.52歲,年齡分布于20~30歲)參加了這項研究。所有參與者均聽力正常,視力正常或矯正正常,沒有任何腦部或精神疾病,除一名參與者為左利手,其余44名參與者均為右利手。實驗前一天晚上要求參與者保持充足的睡眠時間。所有參與者均簽署一份書面知情同意書。
1.2 實驗范式
已有研究較多使用情緒刺激下的腦電開展人格評估[12,25-30],因此本文也采用這種刺激。本文采用150張情緒圖片作為刺激材料,其中正向情緒圖片50張,負向情緒圖片50張,中性情緒圖片50張,所有圖片均選自中國情緒圖片系統[39]。考慮到效價和喚醒度,選擇高效價、高喚醒的前50張圖片作為正向情緒圖片,低效價、高喚醒的前50張圖片作為負向情緒圖片,中性圖片喚醒度均為中。使用中國版的大五人格量表[3]評估被試人格特質,該量表是一個5級的李克特量表(0,1,2,3,4),共有240個項目,外向性、宜人性、盡責性、神經質、開放性各有48項,各維度的內部一致性為0.77~0.92[40]。
為了更貼近真實場景,實驗在沒有任何電屏蔽的常規實驗室環境中進行,情感圖片在15 inch液晶屏幕上呈現,被試坐在離顯示器屏幕約60 cm的舒適椅子上。在實驗開始之前,要求被試盡量認真準確地填寫大五人格問卷,并告知被試實驗具體流程和細節。
本研究的實驗范式參考文獻[41]設計,具體流程如圖1所示。在實驗過程中,150張情緒圖片隨機呈現,實驗分為三組,每兩組之間有1 min的休息時間,每組包括50次實驗,每個實驗包括2 s的空白界面使被試靜息休息,2 s的十字圖片用來集中被試注意力,4 s的情緒圖片顯示用于誘發被試的情緒狀態。在正式實驗開始前,被試觀看3張新的情緒圖片以熟悉實驗過程。在正式實驗中,要求被試盡可能保持靜止,并在情緒圖片出現時盡量保持不眨眼觀看圖片,以防止人工偽跡對腦電的影響。

1.3 腦電圖記錄和預處理
本研究使用64通道便攜式無線腦電圖系統(NeuSen. W64,博睿康,中國)進行數據采集,采樣率為1 000 Hz。根據國際標準10-20系統,記錄59個電極的腦電數據:AF3/4、AF7/8、Fp1/2、Fz、F1/2、F3/4、F5/6、F7/8、FC1/2、FC3/4、FC5/6、FCz、Cz、C1/2、C3/4、C5/6、FT7/8、T7/8、TP7/8、CP1/2、CP3/4、CP5/6、FPz、Pz、P3/4、P5/6、P7/8、PO3/4、PO5/6、PO7/8、POz、Oz、O1/2,并以CPz為參考電極,AFz為接地電極。在實驗過程中,所有電極的阻抗都保持在5 kΩ以下。
本研究使用EEGLAB[42]工具箱對腦電進行預處理。首先,在通道定位后,原始腦電數據經過1~45 Hz的帶通濾波,進行全腦平均重參考,并降采樣到250 Hz。其次,進行腦電數據分段(從刺激前1 000 ms到刺激后4 000 ms),去除刺激前的基線。然后,使用獨立成分分析(independent component analysis,ICA)將腦電信號分解為獨立成分,使用ADJUST[43]和ICLabel[44]插件去除眼動、肌肉運動等偽跡的影響。最后,去除峰峰電壓變化超過±100 μv的腦電信號段,以避免可能的偽影污染。由于噪聲污染嚴重,將3名被試的數據排除在外,剩下的42名被試數據用于后續分析。
2 方法
實驗整體流程如圖2所示(以COH特征為例)。在經過數據采集和預處理后,該模型首先計算不同電極間的相干性,以電極間的COH功能連接作為特征。考慮到被試間可能存在分布差異,本研究采用基于特征的領域自適應方法進行特征轉換,以減小被試間差異性。最后將轉換后的特征輸入到支持向量回歸(support vector regression,SVR)模型,分別構建大五人格五個維度下的回歸模型,實現基于腦電信號的大五人格分數預測。

2.1 腦電特征提取
本文使用電極間COH特征作為腦電功能連接特征,對于每個腦電數據段,基于漢寧窗計算59個電極間在五個頻段(δ:1~4 Hz;θ:4~8 Hz;α:8~13 Hz;β:13~30 Hz;γ:30~45 Hz)的COH特征(只使用刺激發生后4 s的腦電數據)。COH特征的計算方法如式(1)所示:
![]() |
其中, 是腦電信號x和y的互譜,
和
分別是腦電信號x和y的功率譜,f是離散頻率。
衡量兩信號x和y之間的相干性,取值范圍為[0, 1]。對于每個被試的每個樣本,計算得到59個電極在5個頻段上的COH特征后,將所有特征拼接成一個特征向量,最終得到8 555維的功能連接特征[(59(電極數)×(59 ? 1)/2)× 5(頻段數)= 8 555]。
對于ERP特征,本研究只使用刺激發生后1 s的時域采樣點作為ERP特征,對于每個被試的每個樣本,可以得到14 750維的ERP特征[59(電極數)× 1 s × 250 Hz(采樣率)= 14 750]。對于PSD特征,本研究使用Welch法計算五個頻段(與COH特征相同)的平均PSD特征,對于每個被試的每個樣本,可以得到295維的PSD特征[59(電極數)× 5(頻段數)= 295]。
2.2 基于特征的領域自適應
基于特征的領域自適應方法旨在找到一個特征映射函數β,通過映射減小源域和目標域數據的分布差異。假設 和
分別代表源域樣本和目標域樣本,
和
分別代表源域樣本標簽和目標域樣本標簽,領域自適應方法通過映射函數β盡可能減少源域和目標域數據邊緣分布和條件分布的差異,即令:
和
。
本文采用主成分分析(principal component analysis,PCA)對源域和目標域的特征進行降維重構,在新的空間中最小化特征分布差異,從而獲得新的特征表示。PCA是一種數據的線性降維方式,它可以將數據映射到一個新的空間,通過在新的空間里最大化樣本協方差對數據進行降維重構。具體地說,記 是所有樣本的矩陣;
是中心矩陣;m為樣本維度;n為總樣本數;1是
的全1矩陣。協方差矩陣可用
計算。PCA學習的目標是找到正交變換矩陣
,最大化樣本協方差,即:
![]() |
tr()表示矩陣的跡。最優問題可通過對 進行分解得到,其中
是q個最大特征值。
是變換矩陣,源域和目標域降維后的特征矩陣可以由
得到。
本文使用最大均值差異(maximum mean discrepancy,MMD)[45]作為源域和目標域的距離度量,并減小邊緣概率分布 和
,以及條件概率分布
和
所組成的聯合概率分布[46]的差異。考慮到邊緣分布自適應和條件分布自適應可能不是同等重要[47],所以采用平衡因子 μ 動態調整兩個分布的重要性,源域和目標域的MMD計算如式(3)所示:
![]() |
其中,ns為源域樣本數,nt為目標域樣本數,c表示樣本類別,、
和
、
分別表示源域和目標域中屬于類別c的樣本集合和樣本數。式(3)的第一項表示源域和目標域的邊緣概率分布差異,第二項表示源域和目標域的條件概率分布差異。
當源域和目標域的邊緣分布相對接近時,遷移學習的性能高度依賴條件分布[47]。但平衡分布自適應在計算條件分布時,利用 近似
,隱含假設此類在源域和目標域中的概率是相似的[47],但在現實中通常不是這樣。于是本文在計算條件概率分布時,對源域和目標域的類別根據比例加權,即:
![]() |
其中, 和
為權值,由于該方法會減小邊緣分布差異,所以假定
和
是相同的。則條件分布MMD距離可以計算為:
![]() |
綜上,源域和目標域的加權平衡分布自適應MMD距離為:
![]() |
其中M0是 MMD 矩陣:
![]() |
其中c∈(1,2,?,C)表示樣本類別,Wc為加權 MMD 矩陣:
![]() |
通過進一步利用矩陣技巧和正則化,最優化目標可以表示為:
![]() |
取拉格朗日乘子為 ,則上式的拉格朗日函數為:
![]() |
令 ,得到廣義特征值分解:
![]() |
最后可以通過求解上式的k個最小特征向量獲得最優變換矩陣A。
2.3 回歸模型與參數設置
在通過加權平衡分布自適應方法減小降維后源域和目標域數據分布差異,得到新的特征矩陣后,本文采用SVR構建回歸模型。對42個被試采用留一被試交叉驗證,每次將41個被試的腦電數據作為訓練集(源域),將剩下的1個被試的腦電數據作為測試集(目標域)。將經過特征降維和轉換后的訓練集特征矩陣輸入到SVR訓練,在測試集上得到每個被試五個人格維度上的預測分數。由于加權平衡分布自適應方法一般用來處理分類問題,在計算條件分布時需要用到標簽信息,但人格自評分數是一個連續值,不適合直接作為標簽,因此,將情緒圖片的情緒標簽(正、負、中)作為數據的標簽信息用于計算條件分布。
在本文方法中,需要設置平衡因子μ、正則化參數λ、子空間維數k三個參數,為了找到最優值,對三個參數進行遍歷,其中μ{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0},k
{10,20,30,40,50,60,70,80,90,100},μ
{0.01,0.1,1,10,100}。實驗通過保持其中兩個參數不變,改變第三個參數的值來尋找最優參數。
3 實驗結果
3.1 基于中國版大五人格量表的人格自評結果
42名被試在大五人格五個維度分數的平均值和標準差為(采用均值±標準差,平均值的分布范圍為0~4):神經質2.05 ± 0.51,外向性2.15 ± 0.35,開放性2.30 ± 0.25,宜人性2.48 ± 0.33,盡責性2.38 ± 0.37。五個人格維度的自評分數經Shapiro-Wilk正態分布檢驗驗證,均滿足正態分布。
3.2 基于腦電信號的大五人格預測結果
本文使用兩個指標衡量人格預測模型的性能:平均誤差和相關性。平均誤差為五個維度人格自評和人格預測結果的平均絕對值誤差,相關性為五個維度人格自評和人格預測結果的皮爾森相關系數,范圍為[?1, 1]。在人格評估模型的實際應用中,需要更關注平均誤差的大小,平均誤差越小,人格預測模型的性能越好。
為了說明所提出的領域自適應方法和COH功能連接特征對人格評估結果的影響,本文對比了之前研究所使用的ERP、PSD特征和彈性網稀疏正則化回歸模型[12,25]。對于三種特征(COH、ERP、PSD)采取兩種處理方式,一種是參照文獻[25]的方法,對每個被試每種特征下的所有樣本進行樣本平均,使得每個被試在每種特征下只有一個樣本。另一種不進行樣本平均,使用每個被試每種特征下的所有樣本。由于之前文獻使用的方法需要設置相關性P值的閾值進行特征篩選[12,25],為了找到最優P值,對P值進行遍歷,P{0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1}。大五人格預測結果如表1所示(相關性取預測誤差最小時的皮爾森相關系數)。由表1可知,對于ERP特征,樣本平均+彈性網稀疏正則化回歸方法中得到最小的大五人格平均預測誤差;對于PSD特征和COH特征,本文方法在兩種特征中均得到最小的大五人格平均預測誤差。此外,在表1所有特征 + 方法的組合結果中,COH特征+本文方法的組合得到最小的大五人格平均預測誤差。

3.3 樣本分布可視化結果
為了說明三種腦電特征在被試間是否存在分布差異,以及領域自適應方法對三種特征分布差異的改變,本研究使用t-隨機鄰近嵌入(t-distributed stochastic neighbor embedding,t-SNE)方法[48]降維可視化被試樣本分布。t-SNE是一種數據降維和可視化方法之一,它將數據點之間的相似度轉化為條件概率,然后最小化原始空間和嵌入空間的聯合概率分布的KL散度,將高維空間中的數據映射到低維空間中,不僅可以減少信息冗余,還可以保持局部樣本聚類的空間分布。本文使用t-SNE的目的是在二維空間中更好地觀察三種特征的樣本分布,從而說明本文方法的可行性。三種特征在不同情況下的樣本分布如圖3所示,其中第一列圖中,每一種顏色的點分別代表一個被試的樣本;第二列和第三列圖中,訓練集(源域)包含41個被試的樣本,測試集(目標域)包含剩下的1個被試的樣本。在圖3中,PSD特征和COH特征的樣本原始分布具有明顯的被試數據分簇現象,在相關研究中被稱為“個體聚集”,并被認為是腦電個體差異的表征[49]。因此對于跨被試人格評估,結合被試樣本分布圖和誤差結果可知,當測試集被試樣本同樣集中于一簇時不利于人格評估,而分散分布于訓練集樣本中能得到更低的誤差,這與文獻[49]結論相似。

4 討論
本研究提出一種利用腦電COH功能連接特征和領域自適應技術的人格評估方法。該方法利用腦區間交互信息,通過領域自適應技術減小腦電數據被試間的分布差異,提高回歸模型的預測性能,并與以往人格評估研究中所使用的腦電特征和回歸模型進行對比。
由表1可知,在樣本平均 + 彈性網稀疏正則化回歸方法的結果中,ERP特征得到三種特征中最小的大五人格平均預測誤差,也是基于ERP特征所有結果中的最好結果。在樣本平均 + 彈性網稀疏正則化方法中,ERP 和PSD特征比COH特征取得更低的誤差,尤其是在神經質、盡責性上具有相關性,這與文獻[12,25]的結果具有相同的趨勢。在該方法中,對每種特征在三種情緒刺激下的所有樣本分別經過平均和拼接后再進行模型訓練和測試。對于ERP特征,ERP的平均響應方法被廣泛使用[50],在樣本疊加平均之后可以去除背景噪聲[51],所以有較好結果。但是由于被試數量較少,ERP特征未能在五個人格維度上都具有相關性(文獻[12,25]報道在五個人格維度上都具有相關性),模型性能受限。對于PSD特征,已有研究表明在靜息態和情緒刺激狀態下,樣本平均后的PSD特征與人格之間具有相關性[52-54]。COH特征表現較差的原因可能是經過樣本平均之后,丟失較多的單試次腦電信息,而基于單試次功能連接特征進行人格分類的研究已取得較好的結果[26]。
由表1可知,在所有樣本+彈性網稀疏正則化回歸方法的結果中,COH特征得到三種特征中最小的大五人格平均預測誤差。分別對比三種特征在樣本平均和所有樣本兩種情況下的結果可知,ERP和PSD特征在所有樣本情況下的平均預測誤差比樣本平均情況下有較大增加,而COH特征在所有樣本情況下的平均預測誤差比樣本平均情況下則略有減小。究其原因,對于ERP特征,單次ERP不顯著,疊加平均之后才會有明顯的現象。對于PSD特征,如圖3所示,雖然所有被試樣本的原始分布整體比較集中,但是對于每個被試而言,其大部分樣本各自聚集成一簇,與圖3中PSD特征使用領域自適應后的樣本分布相比,測試集樣本的原始分布“個體聚集”較為明顯,由此推斷出測試集樣本分布越分散,得到的預測結果越好,而測試集樣本分布越集中,可能越不利于人格預測。而且在PSD特征的所有被試樣本原始分布中,仍有一些被試樣本偏離總體分布。對于COH特征,所有樣本的情況下具有更多的腦電數據樣本,但是,如圖3所示,COH特征在被試之間、訓練集和測試集之間具有明顯的分布差異,存在顯著的個體聚集現象,受限于分布差異的影響,樣本數量增加所帶來的提升效果有限。
由表1可知,相比于所有樣本+彈性網稀疏正則化回歸方法,三種特征在本文方法都可以得到更小的大五人格平均預測誤差。此外,PSD特征和COH特征在本文方法中分別得到三種方法中最好的結果。結果說明在全樣本情況下,本文提出的方法適用于不同類型的特征,可以提升不同特征下人格評估結果的準確性。具體地說,對于ERP特征,如圖3所示,雖然被試間原始樣本分布不存在明顯個體聚集現象,本文方法可以對每個人格維度的訓練集和測試集樣本分布進行調整,在部分人格維度上(神經質和宜人性)對結果有提升。但是受限于單次ERP不顯著的影響,ERP在本文方法中的結果比樣本平均+彈性網稀疏正則化回歸方法的結果差。對于PSD特征,單試次PSD特征已經被廣泛應用于人格評估中[27-31]。此外,如圖3所示,領域自適應方法可以改變測試集樣本分布,減小分布差異,并使其分散分布于訓練集樣本中,提升回歸模型的預測性能,得到了PSD特征在三種方法中的最好結果。對于COH特征,如圖3所示,使用領域自適應方法后,減小了訓練集和測試集的分布差異,從而提升了跨被試人格評估的結果。相比于單樣本不顯著的ERP特征和維數有限的PSD特征,COH特征不需要樣本疊加平均且特征維數較大(8 555維),而且COH特征可以表示大腦區域之間的相互作用。因此在使用領域自適應方法減小分布差異后,COH特征可以得到更好的人格評估結果。
本文針對腦電個體差異所導致的被試間數據分布差異,利用領域自適應方法減小這一差異,與之前相關文獻使用的方法相比,本文提出的基于COH特征的領域自適應方法取得所有對比結果中最低的大五人格平均絕對值誤差(0.278 5)。但是,本研究也存在一些不足之處。第一,本研究使用的被試數量相對較少,會導致數據的標簽分布不均勻,可能產生數據和標簽的非線性關系,影響模型預測結果(特別是線性回歸模型),使得某些人格維度上的相關性較弱或沒有相關性。第二,本文使用頭皮腦電建立功能連接,對人格的神經機制探究相對受限。有研究認為,功能連接分析應該在大腦的源空間進行,而不是在頭皮上,并且要有足夠數量的傳感器[55]。第三,領域自適應方法雖然減少了被試間數據分布差異,但在模型訓練中使用了源域所有被試的所有樣本,與目標域數據相比極為豐富。但可能不是所有被試的樣本對于知識遷移和共享都是有益的,一些樣本可能會對結果產生負遷移影響。因此,在未來進一步的工作中,可以采用源域選擇[37]等方式減少源域中無關樣本的負面影響。
此外,還有一些研究方向也許可以幫助建立更快速和準確的人格評估系統。第一,五個人格維度之間往往不是完全孤立的,存在一定相關性[56-57],例如宜人性較高的個體,其開放性也偏高。因此,利用不同人格維度間的關聯性有望提高人格評估結果。已有研究使用多任務學習方法利用人格維度間的關聯性,基于手機使用數據對大五人格進行評估[58]。第二,現有基于腦電的人格評估研究多采用情緒刺激下的腦電數據(主要是情緒視頻刺激),采集數據所需時間相對較長(25~90 min)。只有一項研究采用情緒詞語作為刺激材料[16],腦電數據采集時間僅需5 min左右。較短的數據采集時間有利于人格評估系統的實際應用,因此小樣本學習[59]等方法,可以在減少刺激數量、縮短數據采集時間的同時保持人格評估系統的穩定性。
5 結論
本文提出一種基于情緒刺激下腦電功能連接特征,利用領域自適應技術,進行跨被試人格評估的方法。該方法可以利用腦區間的交互信息并減小腦電個體差異導致的被試間數據分布差異,從而提升回歸模型的預測性能。與以往相關文獻相比,本文提出的方法得到了更優的跨被試人格評估結果。由于該方法通過不易偽造的客觀生理數據對被試進行人格評估,不涉及被試的主觀感受,因此可以應用到實際場景中,減少社會期許性的不良影響,為人格評估提供一種新的測量方法和手段。
重要聲明
利益沖突聲明:本文全體作者均聲明不存在利益沖突。
作者貢獻聲明:許子明主要負責數據分析、論文編寫以及算法程序設計;周月瑩和溫旭云主要負責實驗數據采集和論文修訂;牛一帆和李子遇主要負責實驗流程設計、數據預處理;徐西嘉、鄔霞和張道強主要負責提供實驗指導、數據分析指導、論文審閱修訂。
倫理聲明:本研究通過了南京醫科大學附屬南京腦科醫院倫理委員會的審批(批文編號:2017-KY017)。