針對二維凝膠電泳(2-DE)圖像蛋白質點重疊和堆聚問題,本文提出了一種基于山谷特征的重疊蛋白質點自動分離算法。首先,采用內外標記分水嶺法進行粗檢測,提取目標區域的初始輪廓;然后,采用中軸變換和分層剪枝算法提取目標區域主骨架,確定蛋白質點重疊方向;最后,在重疊方向各法平面上,采用分層掃描三維目標區域的方法,提取山谷特征,并利用驗證模型構造分離線。結果表明:通過對兩組真實掃描凝膠圖像進行檢測實驗,重疊蛋白質點的正確分離率分別為78.95%和85.71%,明顯高于現有方法,可用于工程實際。
引用本文: 歐巧鳳, 張會生, 熊邦書. 基于山谷特征的重疊蛋白質點分離算法. 生物醫學工程學雜志, 2014, 31(5): 1018-1022. doi: 10.7507/1001-5515.20140191 復制
引言
二維凝膠電泳(two-dimensional gel electrophoresis,2-DE)技術是蛋白質組學研究的重要手段,通過等電位和分子質量對蛋白質分子進行二維分離,再采用圖像獲取設備得到2-DE圖像,最后采用圖像分析方法提取差異蛋白質點,為疾病診斷、藥物研制和環境污染分析提供依據。蛋白質點檢測是差異蛋白質點提取的基礎[1-4]。由于蛋白質自身性質較為接近以及2-DE過程中環境的影響,容易形成蛋白質點的重疊,因此凝膠圖像中重疊蛋白質點分離是蛋白質點檢測研究的難點和熱點。
現有蛋白質點檢測方法可分為三類。第一類是基于數學模型的方法,如高斯模型和Gaussian-Laplacian檢測[5],此類方法對噪聲敏感。第二類是基于小波變換的方法,2008年,Morris等[6]通過在圖像小波變換域中檢測峰值點的方法實現了蛋白質點檢測,但對飽和蛋白質點的檢測效果不佳。第三類是基于分水嶺及其改進方法。1999年,Pleissner等[7]將分水嶺方法用于凝膠圖像蛋白質點檢測,取得較好效果,但存在過分割問題。為此,出現了許多改進方法[8-11],很好地解決了過分割問題,但仍存在重疊蛋白質點不能分離的問題。2005年,Schlags等[12]針對重疊點問題提出了分層分水嶺方法,可以分離存在灰度差異的重疊點,但對完全飽和重疊點無效。商用凝膠分析軟件為達到好的檢測效果,往往依靠人工經驗輸入一些檢測參數,或手動分離飽和重疊蛋白質點[13]。
據此,本文提出了一種基于山谷特征的重疊蛋白質點自動分離算法。利用目標區域主骨架確定重疊方向,再分層掃描目標區域三維圖像提取山谷特征,最后結合驗證模型構造分離線,以期解決重疊蛋白質點的分離問題。
1 算法描述
1.1 蛋白質點粗檢測
蛋白質點粗檢測采用內外標記分水嶺法[11]提取出蛋白質點的初始輪廓。采用形態學濾波去除噪聲,采用長度為31個像素的線性結構元素去除條紋干擾,采用高帽變換進行背景校正。對原始圖像進行粗檢測的結果如圖 1所示,其中閉合曲線表示檢測到的蛋白質點輪廓線,并標記示意了粗檢測結果中幾個典型的重疊蛋白質點區域。

1.2 重疊蛋白質點分離
1.2.1 重疊模型分析
根據重疊蛋白質點的重疊程度,重疊類型分為輕度、中度和重度重疊,其三維模型和特征分析如圖 2所示。由圖 2可知,重疊蛋白質點三維圖像中的山谷可作為重疊蛋白質點分離的依據,且山谷具有方向性,與重疊蛋白質點的重疊方向近似垂直。

1.2.2 確定重疊方向
利用目標區域主骨架確定重疊方向,過程如下:
(1)建立骨架樹。采用索引表細化迭代方法對目標區域進行中軸變換,得到骨架二值離散圖像,記為S(i,j)。逐行掃描S(i,j),若當前像素p的值為1且未處理,則以p為出發點,采用深度優先算法對S(i,j)進行8-鄰域遍歷,生成骨架樹,其葉節點記為l,與l相連的邊記為e=E(l),l的第j層父節點記為lj。
(2)提取主骨架。主骨架是骨架中心線,采用分層剪枝算法提取主骨架。其步驟如下:
步驟1: 選取任意未處理的葉節點l,若l1有父節點l2,則進行第二步;否則轉第四步。
步驟2: 若l1有唯一子節點l,結束當前分支的修剪,轉第一步;否則l1有n≥2個子節點li,保留lmax=arg maxli(di+ki),剪除其余葉節點,其中di=d(li,l2)為歐式距離,描述分支走向,ki為邊的權值,描述分支的長度。
步驟3: 刪除節點l1,合并lmaxl2,并更新lj為lj-1,重復第二步。
步驟4: 在兄弟節點中選取滿足式(1)的兩個葉節點lj和lq作為主骨架的兩個端點。
$\underset{{{l}_{i}}{{l}_{q}}}{\mathop{arg\text{ }max}}\,({{d}_{iq}}+{{k}_{i}}+{{k}_{q}})\text{ },$ |
其中diq=d(li,lq)為li和lq兩個葉節點之間的歐式距離,ki為邊ei=E(li)的像素個數。
(3)確定重疊方向。主骨架是不規則數字曲線,以線段為基元擬合主骨架曲線,采用擬合的線段方向作為蛋白質點重疊方向。擬合步驟如下:
步驟1: 確定初始分界點。采用基于圍線分層掃描的完全歐式距離變換算法,計算主骨架上每個點pi的邊界距離di,邊界距離數組D={d1,i=1…N}中極大值對應的點作為主骨架曲線的初始分界點,第i個分界點記為ci。
步驟2: 分段擬合。利用分界點ci和ci+1之間的像素點(xij,yij),1≤j≤M進行最小二乘直線擬合,得到第i段直線方程y=kix+bi。
步驟3: 迭代優化,減少分段。根據ci兩邊的線段斜率ki-1和ki,計算線段夾角θi。如果θi≤ξ,則刪除ci,選取ci-1和ci+1之間的點,重新進行最小二乘擬合。根據多次實驗驗證,ξ取10°效果較好。重復上述步驟,直到沒有分界點可刪除。主骨架擬合得到的重疊方向如圖 3(a)所示,三個線段代表三個重疊方向。

(a)重疊方向;(b)三維示意圖;(c)二維示意圖
Figure3. The object area scanned(a) overlap direction; (b) 3-dimentional sketch map; (c) 2-dimentional sketch map
1.2.3 提取山谷特征
在重疊方向各法平面上逐層掃描目標區域三維模型,提取山谷特征。掃描的三維示意圖如圖 3(b)所示,z′軸表示灰度值,o′x′表示重疊方向。為了提取單側山谷特征,以主骨架擬合線段p1pN所在的平面o′x′z′為掃描基準,在經過pk的p1pN法平面上掃描半剖面。三維模型的極小半剖面對應山谷位置。三維掃描的俯視圖如圖 3(c)所示,其中閉合曲線表示粗檢測得到的目標區域初始輪廓。經過點pk進行第k次掃描,從pk到粗檢測輪廓邊緣Ak進行灰度累加得到SA(k),從pk到粗檢測輪廓邊緣Bk進行灰度累加得到SB(k),掃描pkAk或pkBk時,若其斜率絕對值大于1,則選擇y為掃描遞增變量,否則選擇x為掃描遞增變量。第k個反向半剖面SB(k)如圖 3(b)中網格陰影部分所示,面積為
${{S}_{B}}\left( k \right)=\sum\limits_{\left( x,y \right)\in {{p}_{k}}{{B}_{k}}}{g\left( x,y \right)\text{ }},$ |
其中g(x,y)表示點(x,y)的灰度值。取k=1…N,獲得SA(k)和SB(k)兩個面積數組。求數組SA(k)和SB(k)的局部極小值,確定山谷位置,對應的邊界點如圖3(c)中Ai和Bj所示。
1.2.4 確定重疊蛋白質點分離線
分離區間定義如下:主骨架像素點的灰度值數組記為G={gi,i=1…N},邊界距離值數組記為D={di,k=1…N},對數量積D·G進行一維高斯濾波得到數組F={fi,i=1…N},F相鄰極大值對應點之間的區域構成一個分離區間。圖 3(c)中的掃描區間p1pN分成p1pmax1和pmax1pN兩個分離區間。
位于同一分離區間的山谷位置Ai和Bj構成分離線AiBj,若AiBj與重疊方向的夾角大于閾值則保留,根據多次實驗驗證,選取閾值θth=70°對各圖像分離效果較好。若同一個點Ai構成的AiBj和AiBk均滿足閾值要求,則保留夾角最大的分離線。分離線li把目標區域分成兩個子區域,其面積分別為Si1和Si2,周長分別為Li1和Li2。若一個分離區間中保留了多條分離線,根據式(3)構造第一條分離線,其余分離線保留同時滿足式(3)和式(4)的分離線。
$\underset{{{l}_{i}}}{\mathop{arg\text{ }max}}\,(4{{S}_{i1}}/\pi {{L}_{i1}}^{2}+4{{S}_{i2}}/\pi {{L}_{i2}}^{2})$ |
$2\times 4{{S}_{i0}}/\pi {{L}_{i0}}^{2}\le 4{{S}_{i1}}/\pi {{L}_{i1}}^{2}+4{{S}_{i2}}/\pi {{L}_{i2}}^{2}$ |
若一個分離區間中沒有分離線滿足角度閾值要求,則經過Ai或Bj構造垂直主骨架p1pN的弦li,分別使用li進行試分割,選取同時滿足式(3)和式(4)的弦為分離線。根據上述驗證模型,圖 3(c)中的目標區域被A1B1和A4B3分離為三個蛋白質點。
1.2.5 迭代分離
目標區域經過分離產生的子區域可能存在其它分支方向的重疊,因此再對子區域執行分離。重復上述過程,直到沒有子區域被分離。不能被分離的子區域是一個單獨的蛋白質點。
2 結果與分析
為了驗證算法的有效性,在Windows XP環境下,基于C++ Builder6.0對算法進行編程實現,選用課題組采集的真實掃描凝膠圖像進行了兩組實驗,并與應用最廣的商用軟件PDQuest8.0.1和文獻[12]的方法進行對比研究。第一組實驗凝膠圖像分辨率為964×952,圖中蛋白質點共407個,其中重疊蛋白質點38個,圖 4(a)為其局部圖。第二組實驗的凝膠圖像分辨率為993×972,圖中蛋白質點共497個,其中重疊蛋白質點28個,圖 5(a)為其局部圖。圖 4(b)和圖 5(b)是PDQuest8.0.1自動檢測的結果;圖 4(c)和圖 5(c)是分層分水嶺法[12]的檢測結果;圖 4(d)和圖 5(d)是本文算法的檢測結果。

(a)原始圖像(局部);(b) PDQuest8.0.1 檢測結果;(c) 分層分水嶺法檢測結果;(d)本文算法分離結果
Figure4. Detection results of protein spots in the first image(a) original image (local); (b) detected by PDQuest8.0.1 ; (c) detected by hierarchical watershed; (d) detected by the proposed algorithm
從圖 4和圖 5的檢測結果可以看出,商用軟件PDQuest8.0.1 對于重疊蛋白質點的檢測和分離需要采用人工介入的方法達到好的效果;分層分水嶺法對非飽和重疊點的分離有效,但由于只利用了蛋白質點圖像的灰度差異信息,對完全飽和點無法分離,且分離線形狀不符合實際分離位置。本文的重疊點分離算法綜合利用了灰度差異和輪廓變化,對飽和重疊點依然有效,而且提高了重疊蛋白質點分離線的定位精度。

(a)原始圖像(局部);(b)PDQuest8.0.1 檢測結果;(c)分層分水嶺法檢測結果;(d)本文算法分離結果
Figure5. Detection results of protein spots in the second image(a) original image (local); (b) detected by PDQuest8.0.1 ; (c) detected by hierarchical watershed; (d) detected by the proposed algorithm
為了量化評估上述三種方法的分離效果,表 1給出了三種方法的實驗統計數據,其統計數據是基于人工點數和評判獲取的。

從表 1中可以看出,就TP、FN和FP三個指標而言,本文算法接近于PDQuest8.0.1,優于文獻[12]介紹的方法;在重疊蛋白質點正確分離率方面,本文算法兩次實驗的正確分離率分別為78.95%和85.71%,相對于文獻[12]的方法和PDQuest8.0.1的算法都有較大提高。
3 結論
本文提出了一種基于山谷特征的重疊蛋白質點分離算法,利用重疊蛋白質點三維模型的山谷特征,成功分離了過飽和并且蛋白質點中心距離小的重度重疊點;采用了分層剪枝算法提取主骨架,有效確定了重疊方向,提高了重疊蛋白質點的正確分離率;在驗證模型中綜合利用了背景距離、灰度分布和圓度等先驗知識,有效抑制了噪聲的影響。通過多組不同來源的真實凝膠圖像的蛋白質點檢測實驗,結果表明本文算法的有效性,較好地解決了傳統方法對重度重疊點效果不佳的問題。當圖像分辨率比較低時,本文方法的分離效果下降,提高低分辨率下重疊蛋白質點的正確分離率,是進一步的研究工作。
引言
二維凝膠電泳(two-dimensional gel electrophoresis,2-DE)技術是蛋白質組學研究的重要手段,通過等電位和分子質量對蛋白質分子進行二維分離,再采用圖像獲取設備得到2-DE圖像,最后采用圖像分析方法提取差異蛋白質點,為疾病診斷、藥物研制和環境污染分析提供依據。蛋白質點檢測是差異蛋白質點提取的基礎[1-4]。由于蛋白質自身性質較為接近以及2-DE過程中環境的影響,容易形成蛋白質點的重疊,因此凝膠圖像中重疊蛋白質點分離是蛋白質點檢測研究的難點和熱點。
現有蛋白質點檢測方法可分為三類。第一類是基于數學模型的方法,如高斯模型和Gaussian-Laplacian檢測[5],此類方法對噪聲敏感。第二類是基于小波變換的方法,2008年,Morris等[6]通過在圖像小波變換域中檢測峰值點的方法實現了蛋白質點檢測,但對飽和蛋白質點的檢測效果不佳。第三類是基于分水嶺及其改進方法。1999年,Pleissner等[7]將分水嶺方法用于凝膠圖像蛋白質點檢測,取得較好效果,但存在過分割問題。為此,出現了許多改進方法[8-11],很好地解決了過分割問題,但仍存在重疊蛋白質點不能分離的問題。2005年,Schlags等[12]針對重疊點問題提出了分層分水嶺方法,可以分離存在灰度差異的重疊點,但對完全飽和重疊點無效。商用凝膠分析軟件為達到好的檢測效果,往往依靠人工經驗輸入一些檢測參數,或手動分離飽和重疊蛋白質點[13]。
據此,本文提出了一種基于山谷特征的重疊蛋白質點自動分離算法。利用目標區域主骨架確定重疊方向,再分層掃描目標區域三維圖像提取山谷特征,最后結合驗證模型構造分離線,以期解決重疊蛋白質點的分離問題。
1 算法描述
1.1 蛋白質點粗檢測
蛋白質點粗檢測采用內外標記分水嶺法[11]提取出蛋白質點的初始輪廓。采用形態學濾波去除噪聲,采用長度為31個像素的線性結構元素去除條紋干擾,采用高帽變換進行背景校正。對原始圖像進行粗檢測的結果如圖 1所示,其中閉合曲線表示檢測到的蛋白質點輪廓線,并標記示意了粗檢測結果中幾個典型的重疊蛋白質點區域。

1.2 重疊蛋白質點分離
1.2.1 重疊模型分析
根據重疊蛋白質點的重疊程度,重疊類型分為輕度、中度和重度重疊,其三維模型和特征分析如圖 2所示。由圖 2可知,重疊蛋白質點三維圖像中的山谷可作為重疊蛋白質點分離的依據,且山谷具有方向性,與重疊蛋白質點的重疊方向近似垂直。

1.2.2 確定重疊方向
利用目標區域主骨架確定重疊方向,過程如下:
(1)建立骨架樹。采用索引表細化迭代方法對目標區域進行中軸變換,得到骨架二值離散圖像,記為S(i,j)。逐行掃描S(i,j),若當前像素p的值為1且未處理,則以p為出發點,采用深度優先算法對S(i,j)進行8-鄰域遍歷,生成骨架樹,其葉節點記為l,與l相連的邊記為e=E(l),l的第j層父節點記為lj。
(2)提取主骨架。主骨架是骨架中心線,采用分層剪枝算法提取主骨架。其步驟如下:
步驟1: 選取任意未處理的葉節點l,若l1有父節點l2,則進行第二步;否則轉第四步。
步驟2: 若l1有唯一子節點l,結束當前分支的修剪,轉第一步;否則l1有n≥2個子節點li,保留lmax=arg maxli(di+ki),剪除其余葉節點,其中di=d(li,l2)為歐式距離,描述分支走向,ki為邊的權值,描述分支的長度。
步驟3: 刪除節點l1,合并lmaxl2,并更新lj為lj-1,重復第二步。
步驟4: 在兄弟節點中選取滿足式(1)的兩個葉節點lj和lq作為主骨架的兩個端點。
$\underset{{{l}_{i}}{{l}_{q}}}{\mathop{arg\text{ }max}}\,({{d}_{iq}}+{{k}_{i}}+{{k}_{q}})\text{ },$ |
其中diq=d(li,lq)為li和lq兩個葉節點之間的歐式距離,ki為邊ei=E(li)的像素個數。
(3)確定重疊方向。主骨架是不規則數字曲線,以線段為基元擬合主骨架曲線,采用擬合的線段方向作為蛋白質點重疊方向。擬合步驟如下:
步驟1: 確定初始分界點。采用基于圍線分層掃描的完全歐式距離變換算法,計算主骨架上每個點pi的邊界距離di,邊界距離數組D={d1,i=1…N}中極大值對應的點作為主骨架曲線的初始分界點,第i個分界點記為ci。
步驟2: 分段擬合。利用分界點ci和ci+1之間的像素點(xij,yij),1≤j≤M進行最小二乘直線擬合,得到第i段直線方程y=kix+bi。
步驟3: 迭代優化,減少分段。根據ci兩邊的線段斜率ki-1和ki,計算線段夾角θi。如果θi≤ξ,則刪除ci,選取ci-1和ci+1之間的點,重新進行最小二乘擬合。根據多次實驗驗證,ξ取10°效果較好。重復上述步驟,直到沒有分界點可刪除。主骨架擬合得到的重疊方向如圖 3(a)所示,三個線段代表三個重疊方向。

(a)重疊方向;(b)三維示意圖;(c)二維示意圖
Figure3. The object area scanned(a) overlap direction; (b) 3-dimentional sketch map; (c) 2-dimentional sketch map
1.2.3 提取山谷特征
在重疊方向各法平面上逐層掃描目標區域三維模型,提取山谷特征。掃描的三維示意圖如圖 3(b)所示,z′軸表示灰度值,o′x′表示重疊方向。為了提取單側山谷特征,以主骨架擬合線段p1pN所在的平面o′x′z′為掃描基準,在經過pk的p1pN法平面上掃描半剖面。三維模型的極小半剖面對應山谷位置。三維掃描的俯視圖如圖 3(c)所示,其中閉合曲線表示粗檢測得到的目標區域初始輪廓。經過點pk進行第k次掃描,從pk到粗檢測輪廓邊緣Ak進行灰度累加得到SA(k),從pk到粗檢測輪廓邊緣Bk進行灰度累加得到SB(k),掃描pkAk或pkBk時,若其斜率絕對值大于1,則選擇y為掃描遞增變量,否則選擇x為掃描遞增變量。第k個反向半剖面SB(k)如圖 3(b)中網格陰影部分所示,面積為
${{S}_{B}}\left( k \right)=\sum\limits_{\left( x,y \right)\in {{p}_{k}}{{B}_{k}}}{g\left( x,y \right)\text{ }},$ |
其中g(x,y)表示點(x,y)的灰度值。取k=1…N,獲得SA(k)和SB(k)兩個面積數組。求數組SA(k)和SB(k)的局部極小值,確定山谷位置,對應的邊界點如圖3(c)中Ai和Bj所示。
1.2.4 確定重疊蛋白質點分離線
分離區間定義如下:主骨架像素點的灰度值數組記為G={gi,i=1…N},邊界距離值數組記為D={di,k=1…N},對數量積D·G進行一維高斯濾波得到數組F={fi,i=1…N},F相鄰極大值對應點之間的區域構成一個分離區間。圖 3(c)中的掃描區間p1pN分成p1pmax1和pmax1pN兩個分離區間。
位于同一分離區間的山谷位置Ai和Bj構成分離線AiBj,若AiBj與重疊方向的夾角大于閾值則保留,根據多次實驗驗證,選取閾值θth=70°對各圖像分離效果較好。若同一個點Ai構成的AiBj和AiBk均滿足閾值要求,則保留夾角最大的分離線。分離線li把目標區域分成兩個子區域,其面積分別為Si1和Si2,周長分別為Li1和Li2。若一個分離區間中保留了多條分離線,根據式(3)構造第一條分離線,其余分離線保留同時滿足式(3)和式(4)的分離線。
$\underset{{{l}_{i}}}{\mathop{arg\text{ }max}}\,(4{{S}_{i1}}/\pi {{L}_{i1}}^{2}+4{{S}_{i2}}/\pi {{L}_{i2}}^{2})$ |
$2\times 4{{S}_{i0}}/\pi {{L}_{i0}}^{2}\le 4{{S}_{i1}}/\pi {{L}_{i1}}^{2}+4{{S}_{i2}}/\pi {{L}_{i2}}^{2}$ |
若一個分離區間中沒有分離線滿足角度閾值要求,則經過Ai或Bj構造垂直主骨架p1pN的弦li,分別使用li進行試分割,選取同時滿足式(3)和式(4)的弦為分離線。根據上述驗證模型,圖 3(c)中的目標區域被A1B1和A4B3分離為三個蛋白質點。
1.2.5 迭代分離
目標區域經過分離產生的子區域可能存在其它分支方向的重疊,因此再對子區域執行分離。重復上述過程,直到沒有子區域被分離。不能被分離的子區域是一個單獨的蛋白質點。
2 結果與分析
為了驗證算法的有效性,在Windows XP環境下,基于C++ Builder6.0對算法進行編程實現,選用課題組采集的真實掃描凝膠圖像進行了兩組實驗,并與應用最廣的商用軟件PDQuest8.0.1和文獻[12]的方法進行對比研究。第一組實驗凝膠圖像分辨率為964×952,圖中蛋白質點共407個,其中重疊蛋白質點38個,圖 4(a)為其局部圖。第二組實驗的凝膠圖像分辨率為993×972,圖中蛋白質點共497個,其中重疊蛋白質點28個,圖 5(a)為其局部圖。圖 4(b)和圖 5(b)是PDQuest8.0.1自動檢測的結果;圖 4(c)和圖 5(c)是分層分水嶺法[12]的檢測結果;圖 4(d)和圖 5(d)是本文算法的檢測結果。

(a)原始圖像(局部);(b) PDQuest8.0.1 檢測結果;(c) 分層分水嶺法檢測結果;(d)本文算法分離結果
Figure4. Detection results of protein spots in the first image(a) original image (local); (b) detected by PDQuest8.0.1 ; (c) detected by hierarchical watershed; (d) detected by the proposed algorithm
從圖 4和圖 5的檢測結果可以看出,商用軟件PDQuest8.0.1 對于重疊蛋白質點的檢測和分離需要采用人工介入的方法達到好的效果;分層分水嶺法對非飽和重疊點的分離有效,但由于只利用了蛋白質點圖像的灰度差異信息,對完全飽和點無法分離,且分離線形狀不符合實際分離位置。本文的重疊點分離算法綜合利用了灰度差異和輪廓變化,對飽和重疊點依然有效,而且提高了重疊蛋白質點分離線的定位精度。

(a)原始圖像(局部);(b)PDQuest8.0.1 檢測結果;(c)分層分水嶺法檢測結果;(d)本文算法分離結果
Figure5. Detection results of protein spots in the second image(a) original image (local); (b) detected by PDQuest8.0.1 ; (c) detected by hierarchical watershed; (d) detected by the proposed algorithm
為了量化評估上述三種方法的分離效果,表 1給出了三種方法的實驗統計數據,其統計數據是基于人工點數和評判獲取的。

從表 1中可以看出,就TP、FN和FP三個指標而言,本文算法接近于PDQuest8.0.1,優于文獻[12]介紹的方法;在重疊蛋白質點正確分離率方面,本文算法兩次實驗的正確分離率分別為78.95%和85.71%,相對于文獻[12]的方法和PDQuest8.0.1的算法都有較大提高。
3 結論
本文提出了一種基于山谷特征的重疊蛋白質點分離算法,利用重疊蛋白質點三維模型的山谷特征,成功分離了過飽和并且蛋白質點中心距離小的重度重疊點;采用了分層剪枝算法提取主骨架,有效確定了重疊方向,提高了重疊蛋白質點的正確分離率;在驗證模型中綜合利用了背景距離、灰度分布和圓度等先驗知識,有效抑制了噪聲的影響。通過多組不同來源的真實凝膠圖像的蛋白質點檢測實驗,結果表明本文算法的有效性,較好地解決了傳統方法對重度重疊點效果不佳的問題。當圖像分辨率比較低時,本文方法的分離效果下降,提高低分辨率下重疊蛋白質點的正確分離率,是進一步的研究工作。