針對多參數流式細胞數據分析過程復雜、自動化程度不高、要求操作者具有一定專業背景等問題,本文提出了一種基于核主成分分析算法(KPCA)進行多參數流式細胞數據分群的方法。利用 KPCA 對多參數流式細胞數據進行非線性變換,降低數據的維度,得到主成分特征變量下的散點圖分群結果,并使用改進的K-means 聚類算法實現不同亞群的自動設門。以人體外周血淋巴細胞樣本檢測結果為實驗數據,分別對其進行傳統分群、主成分分析(PCA)分群、KPCA 分群處理,并對特征參數的選取進行了探索。結果表明,KPCA 方法能夠較好地應用于多參數流式細胞數據分析中,與傳統細胞分群方法相比,該方法無需操作者具備專業知識,即可實現快速準確的自動分群,能夠提高流式細胞儀臨床診斷分析的效率。
為了實現血液中肝癌細胞的自動識別,本文基于主成分分析(PCA)和反向傳播(BP)神經網絡算法對三種細胞(小鼠的白細胞、紅細胞和人體肝癌細胞 HepG2)進行了識別研究。利用光纖共聚焦后向散射(FCBS)光譜儀獲取光譜數據后進行 PCA,選取前兩個主成分作為光譜的特征,建立一個具有 2 個輸入層節點、11 個隱層節點、3 個輸出節點的神經網絡模式識別模型。選取 195 例對象數據訓練該模型,隨機抽取 150 組數據作為訓練集,45 組數據作為測試集,驗證模型給出的細胞是否識別準確。結果顯示三種細胞的整體識別準確率在 90% 以上,平均相對偏差只有 4.36%。實驗結果預示采用 PCA+BP 算法能夠從紅細胞和白細胞中自動識別肝癌細胞,這將為研究肝癌的轉移與肝癌的生物代謝特性提供有利的工具。