基于語音數據挖掘實現帕金森病診斷的方法近年來已被證明有效。然而,受數據采集對象患病程度以及采集設備和環境等因素影響,所獲取數據集的樣本空間中存在不同類別樣本混疊現象。混疊區域的樣本難以有效識別,嚴重影響了算法的分類準確度。為了解決這一問題,本文提出了分包融合集成算法,通過設計類心距離比值來衡量樣本的混疊程度并將訓練集劃分成多個子集,再利用錯誤分類樣本傳遞式訓練的方法調整子集劃分結果,最后通過優化子分類權重對各個子分類器的測試結果進行加權融合。實驗結果表明,本文方法分類準確度在兩個公共數據集上都得到明顯提高,平均準確度最大提高可達25.44%。該方法不僅有效提高了帕金森病語音數據集分類準確度,還增加了樣本利用率,為帕金森病語音診斷提供了一種新思路。