針對肝病分類中存在的特征交互的問題, 我們研究了一種分層交互lasso分類方法。首先對logistic模型添加lasso罰函數和分層凸約束, 其次采用卡羅需-庫恩-塔克條件與廣義梯度下降法相結合的凸優化方法給出模型求解方法, 最后得到主效應特征系數與交互特征系數的稀疏解, 實現模型分類。本文在兩個肝病數據集上進行實驗, 證明了特征交互對肝病分類有貢獻。實驗結果證明了分層交互lasso方法可解釋性強, 效果、效率均優于lasso方法、全特征對lasso方法以及支持向量機、最近鄰和決策樹等傳統分類方法。
肝臟疾病特征及交互特征對于肝臟疾病的分類具有重要意義,本文在交互最小絕對收縮和選擇算子(LASSO)模型的基礎上,研究了廣義交互 LASSO 模型并與其他可用于肝臟疾病分類的方法比較。首先,本文建立了廣義交互邏輯斯特(logistic)分類模型,在模型參數中添加 LASSO 罰函數,然后將模型參數通過交替方向乘子法(ADMM)求解,得到模型系數的稀疏解。最后將測試樣本代入模型,按照最大概率進行分類結果統計。通過將本文方法應用在肝臟失調數據集和印度肝病數據集的數據實驗結果表明,交互特征的模型系數不為零,這說明交互特征對分類存在貢獻。最終結果表明,本文提出的廣義交互 LASSO 方法的正確率要優于交互 LASSO 方法,也優于傳統模式識別方法,可將廣義交互 LASSO 方法推廣應用到其他疾病的分類問題上。