針對多參數流式細胞數據分析過程復雜、自動化程度不高、要求操作者具有一定專業背景等問題,本文提出了一種基于核主成分分析算法(KPCA)進行多參數流式細胞數據分群的方法。利用 KPCA 對多參數流式細胞數據進行非線性變換,降低數據的維度,得到主成分特征變量下的散點圖分群結果,并使用改進的K-means 聚類算法實現不同亞群的自動設門。以人體外周血淋巴細胞樣本檢測結果為實驗數據,分別對其進行傳統分群、主成分分析(PCA)分群、KPCA 分群處理,并對特征參數的選取進行了探索。結果表明,KPCA 方法能夠較好地應用于多參數流式細胞數據分析中,與傳統細胞分群方法相比,該方法無需操作者具備專業知識,即可實現快速準確的自動分群,能夠提高流式細胞儀臨床診斷分析的效率。
針對提高情感識別正確率這一國際開放問題,本文提出了一種基于小波包熵和自回歸模型相結合的腦電信號特征提取算法。自回歸過程能最大程度逼近腦電信號,用很少的自回歸參數提供豐富的譜信息。小波包熵反映腦電信號在各個頻帶中的譜能量分布情況。將二者結合,能夠更好地體現腦電信號的能量特征。本文基于核主成分分析方法,實現了腦電信號特征提取融合。課題組采用情感腦電國際標準數據集(DEAP),選取 6 類情感狀態以本文算法進行情感識別。結果顯示,本文算法情感識別正確率均在 90% 以上,最高情感識別正確率可達 99.33%。本文的研究結果表明,該算法能夠較好地提取腦電信號情感特征,是一種有效的情感特征提取算法。
流式細胞儀中多參數流式數據分群傳統方法主要是利用專業軟件采取人工設門方式,圈出目標細胞進行分析,分析過程較為復雜,專業性較強。基于此,本文提出了一種基于 t 分布鄰域嵌入(t-SNE)算法對多參數流式數據進行分群處理。該算法將樣本數據在高維空間中的歐幾里德距離轉化為條件概率來表征相似性,使數據降到低維空間。本文通過使用流式細胞儀處理染色后的人體外周血細胞,并將處理后的數據導出作為實驗樣本數據,對其利用 t-SNE 算法進行降維,并與核主成分分析(KPCA)降維算法對比,分別使用 K 均值(K-means)算法對降維得到的主成分數據進行分類。結果表明,t-SNE 算法對呈非對稱且有拖尾分布的細胞類群具有很好的分群效果,分群準確率可達 92.55%,或可有助于多色多參數流式數據進行自動分析。