在SCI數據庫中檢索出近十年與醫學圖像處理相關的文獻,并將檢索出的文獻導入TDA軟件進行數據清理后,用EXCLE、UCINET等軟件進行數據分析和處理。統計分析出能夠從文獻計量學的角度反映論文基本情況、領域發展特點與研究熱點的表格與圖形。結果表明該領域的研究歐美國家占據比較領先的位置,國家之間的合作關系緊密;該領域學科分布廣泛,存在多學科交叉融合;近幾年主要是對于算法、系統、模型、圖像、分割等方面的研究比較多;排名比較靠前的關鍵詞之間存在一定方式的聚類,但是之間的聚類關系比較復雜。
引用本文: 陳薇, 王艷斌, 歐陽昭連, 郭文姣, 池慧. 近十年醫學圖像處理領域文獻計量學分析. 生物醫學工程學雜志, 2014, 31(1): 113-119. doi: 10.7507/1001-5515.20140022 復制
引言
醫學成像技術主要包括:X射線成像、計算機斷層成像(CT)、核磁共振成像(MRI)、放射性核素成像、超聲成像及數字減影血管造影(DSA)等[1]。圖像處理技術主要包括:醫學圖像分割、壓縮、配準以及圖像的增強、特征提取、分析識別等,是計算機輔助影像學診斷與治療的主要內容之一[1]。
醫學圖像處理技術在醫學診斷與臨床治療等方面起著非常重要的作用[1]。醫學成像相關技術的發展更新會帶來醫學診斷的準確性及可靠性的提高。本文采用文獻計量的方法,從已發表文獻的計量統計分析入手,了解醫學圖像處理相關技術的進展情況。
1 討論
醫學圖像處理涉及的內容廣泛,研究技術復雜,對其整體領域的基本情況了解存在一定的困難。
文獻計量學的方法能夠追蹤一個領域的前沿和熱點。對這些前沿與熱點的追蹤能夠深入揭示研究領域的軌跡、特征和規律,可以幫助該領域的專家學者更好地理解該領域的研究動態與發展趨勢[2]。
借助文獻計量學的方法統計與分析醫學圖像處理領域論文的基本情況、領域的發展特點、研究內容與熱點等情況,從一個側面反映該領域研究的基本情況。
2 數據來源
科學引文索引(Science Citation Index,SCI)。因其收錄期刊的標準高,代表性強,所以歷來被公認為是在世界范圍內權威的科學技術文獻的索引工具和科學計量、科學評價的重要工具[3]。
本文通過檢索近十年發表的與醫學圖像處理相關的SCI論文,運用一些評價工具以及相關的數據信息采集整理與圖形化工具對檢索到的文獻進行統計與分析,了解本學科的科研現狀以及發展概況。
以ISI Web of Science 中的SCI-EXPANDED數據庫為統計源,運用主題檢索的方法對檢索式 TS=(medical imag*)and(image process* or map process*)進行檢索,時間限定為2003-2012年,檢索近十年內的關于醫學圖像處理的文章,共3 581篇。SCI數據庫中主題檢索的范圍包括了標題、摘要與主題詞,并不是標準化的主題檢索,所以其檢索結果與需要檢索的內容相比存在一定程度的擴檢,但是由于文獻的總量比較大,這樣的擴展檢所對文獻分析的整體情況影響并不大。
3 分析方法和工具
將檢索出的文獻,導入TDA軟件進行數據的整理與清洗并統計出時間分布、國家分布、機構分布、關鍵詞等方面的數據。數據結果導入EXCLE、UCINET等分析軟件,將部分內容圖形化,得出直觀易懂的結果,根據結果分析該領域發展的基本特點以及熱點等。
TDA是用于進行數據處理的軟件,其界面簡單操作方便,可以對文獻的作者、關鍵詞等進行數據提取、分類、篩選等,為文獻的數據整合提供了一個簡單的平臺。
EXCLE能夠對統計出的數據進行整理與分析,并根據結果做出一系列可視化的圖表,幫助直觀地了解數據的分布與發展情況及趨勢,是一種非常好的可視化工具。
UCINET網絡分析工具能將一維與二維數據進行可視化顯示,簡單直觀地了解并分析各個節點之間的社會網絡關系,并且還能進行各種網絡分析指標的數值分析,如點度中心度、中間中心度、核心邊緣結構分析以及K-叢聚類分析等,是一個功能強大的計量學分析工具。
4 論文的基本情況分析
論文統計的基本情況包括檢索到論文的時間分布、機構分布、論文的期刊來源分布。
4.1 論文時間分布
如圖 1所示,從2003~2012年上半年共檢索到3 581篇文獻。2007年之前的文獻量之間的差距不大,基本平穩。2008~2010年的文獻數量上有所增加,2011年與前幾年相比減少了幾十篇,數量有所下降。

4.2 論文機構分布
在檢索到的3 581篇文獻中,使用數據庫的機構統計功能統計出機構的首選名稱以及組織名稱。結果統計出大約900多個主要的團體作者機構。排名前十的機構的發文量占文獻總數的11.2%。這些機構分別是:哈佛大學、斯坦福大學、加利福利亞州洛杉磯大學、杜克大學、密歇根大學、梅奧臨床醫學院、芝加哥大學、多倫多大學、倫敦大學學院、約翰霍普金斯大學。發表文獻量以及排名,如圖 2所示。中國的上海交通大學排在第17位。

4.3 論文期刊來源分布
檢索出的3 581篇文獻來自400多種不同的期刊。表 1列出了載文量排名前10的期刊,以及這些期刊的影響因子。影響因子是一種即時指數,此值越大則期刊的影響力就越高,在科學發展與交流過程中的影響力就越大,期刊的質量就越高[4]。從表 1的情況來看,載文量最多的是醫學物理學雜志(MEDICAL PHYSICS),其次是算機科學講義(LECTURE NOTES IN COMPUTER SCIENCE)和電氣與電子工程師協會醫學影像學報(IEEE TRANSACTIONS ON MEDICAL IMAGING)。其中,計算機科學講義的影響因子不高,但發文量較高。

5 醫學圖像處理領域的發展特點分析
5.1 論文學科分布
醫學圖像處理技術中,理論技術人員與醫務人員之間的交流、多學科的交叉與融合來提高醫學圖像的處理水平已是發展的一種必然趨勢[5]。根據使用數據庫的科學引文索引的學科類別進行學科分類,例如:放射核醫學成像學科是指包括生物學以及生物物理學的輻射研究的資源,這些資源集中在介入放射學、放射治療學、腫瘤學等方面。具體的統計結果顯示,醫學圖像處理的相關領域的研究類別與方向有90多種,可以看出這個領域研究方向比較寬泛,交叉學科與內容也相對較多。在3 581篇的文獻中,共統計出了90多個學科類別。如表 2所示,顯示了排名前10的學科類別以及各個學科的文獻量以及文獻的比例情況,可以看出,醫學圖像處理領域,研究放射醫學成像的文獻量最大。放射學是一門融合了醫學影像與臨床治療于一體的新興邊緣學科,近30年的發展尤為迅速[6]。其次是工程類學科與計算機類學科。成像技術是以計算機和醫學圖像處理技術的發展為基礎的,計算機技術、網絡通訊技術、數字技術等工程類技術在醫學圖像處理領域中的廣泛應用,極大地促進了醫學影像技術的進步與發展[7] 。

5.2 論文國家分布以及國家間合作關系
統計發現,檢索到的論文分別來自123個不同的國家和地區,其中第一作者分布在88個不同的國家和地區。許多國家都很重視該領域的研究與發展,不同的國家的發文量存在一定的差距。統計各個國家發文量,發現排名前10的國家發文量占總發文量的86%。排名前10國家以及其發文量情況如表 3所示。

美國是發文量最大的國家,約占論文總數的35%。其次是德國與法國。我國的發文量超過200篇,約占論文總數的6%。
不同國家之間存在研究的相互交流與合作,為了研究其基本的科研合作情況,用UCINET做出了合作關系網絡,選擇了發文量排名前40的國家做出其合作關系網絡如圖 3所示。

社會網絡可以顯示各個節點之間的社會關系,從而形成一個社會網絡,這樣的社會網絡可以顯示人與人之間的關系、上下級關系、科研合作關系和文章合著關系等。分析這樣的網絡并進行量化研究,可以建立起一個能夠顯示其特征的模型[7]。社會網絡是根據凝聚子群的概念將行動者之間有相對較強、直接、緊密、經常或者積極關系的行動者聚集到一起,建立起的社會網絡關系圖譜能在一定程度上反映各個行動者之間的關系。如圖 3的模型,各個節點的大小表示了其發表論文的數量,各個節點之間線條的粗細程度可以看出合作的緊密程度。
由圖 3可以看出歐美各個國家之間的合作關系緊密,合作程度相對較高。美國不僅發文量最高,而且與其他國家合作關系也比較緊密。中國跟美國、法國、英國、加拿大等主要國家合作緊密。
(1) 密度分析
密度可以表示社會網絡各個節點之間關系的緊密程度,連線越多,表示整體網絡的密度越大[8]。總體來說,整體網絡的密度越大,表示該網絡中節點之間的相互影響的可能性越大。根據分析結果得到網絡的整體密度為1.238 5,說明在醫學圖像處理領域各個國家之間的聯系相對而言是緊密的,但是各個國家之間的相互影響并不是特別大。從個體網絡密度的分析可以發現,美國、德國、英國、加拿大的平均網絡密度分別為1.65、1.61、1.55、1.60,都高于整體網絡密度,說明歐美等國家在該領域的影響較大。中國的平均網絡密度為1.24,略微高于整體網絡密度,說明中國在這樣一個確定規模的網絡中影響力處于一般水平。
(2) 中心性分析
中心性分析可以衡量這個人或者組織的在整體網絡中的地位。中心度分析一般可以從點度中心度、中間中心度和接近中心度這三個方面的數值去衡量。
點度中心度可以用網絡中與該點有直接聯系的數目來衡量,如果該節點與很多其他行動者之間存在關聯,說明在該網絡中其地位相對而言處于比較中心的位置[9]。一般還可以將點度中心度分為絕對點度中心度和相對點度中心度,后者是前者的標準化。
中間中心度是指一個行動者處于許多交往網絡的路徑上,可以認為其占據一個重要的位置[9]。
接近中心度是指一個點與其他點的鏈接通過的路徑比較短,這樣的是點的接近中心度比較高,可以描述為網絡中的行動者不受其他行動者控制的能力[9]。
由表 4可以看出排名前10的節點的點度中心度,排名前四的國家分別為美國、英國、德國與法國,這表明歐美國家在合作關系網絡中與其他國家的合作關系比較緊密。這些國家處于比較中心的位置。其中,中國排在第八位,絕對點度中心度為3.533,說明中國在合作方面與其他國家的聯系也是比較緊密的。

就中間中心度而言,美國占據著最為中心的位置,中心度為140.129。其次是德國與法國,這兩個國家的中間中心度比較接近,數值相對也比較高,所處的位置也相對比較中心。然后就是英國、加拿大與意大利的中間中心度比較高。中國的中間中心度僅為1.971,在整個網絡中不是處于一個特別中心的位置上。
由此可見,就中國而言與其他國家的合作關系比較緊密,但是并不處于主導地位。
(3) 核心邊緣結構分析
核心邊緣分析是根據網絡中節點之間的緊密程度將節點分為和核心與邊緣兩個區域。核心區域的節點相對而言位置比較重要[9]。
核心邊緣結構分析將40個國家中的美國、德國、英國這三個國家置于了核心的位置,剩下的其他37個國家放在了邊緣位置。說明了在整個網絡中美國、德國與法國的位置比較重要,對其他國家的合作關系影響力最大。
5.3 論文被引用情況分析
總被引頻次可以顯示期刊的被使用情況從而反映出其受重視程度以及在科學交流中的作用和地位[4]。
根據檢索到的3 581篇文章進行被引情況的統計發現,這些文獻的被引頻次總計為34 613次,去除自引的被引頻次總計為33 453次,施引文獻為30 722篇,每項平均被引次數為9.67次,H指數為65。檢索到的這些文獻對醫學圖像處理領域的研究是有很高的參考價值的。
6 研究內容與熱點分析
醫學圖像處理領域的研究內容比較多,存在多學科的交叉與融合。本文嘗試從關鍵詞熱點的角度進行統計分析,從一個側面反映本領域研究的熱點情況。
關鍵詞的統計分析基本是根據關鍵詞出現頻率的高低來判定研究較多的內容從而確定其研究熱點。而聚類是將相關的關鍵詞之間的共性與個性體現出來,從而分析不同關鍵詞之間研究的相關性。
用TDA分別統計這些文獻中的關鍵詞,經過數據擴展與清洗后,結果表明在這10年的文獻量中共檢索到8 063個關鍵詞。其中排名前10個關鍵詞分別為“算法”、“系統”、“模型”、“分割”、“圖像”、“計算機斷層掃描”、“分類”、“CI”、“重建”。用UCINET將前40個關鍵詞進行核心邊緣結構分析結果顯示,處在核心位置的關鍵詞為“算法”、“系統”、“模型”、“分割”、“圖像”,這可以從一個側面反映出這幾個關鍵詞處在醫學圖像處理領域的研究處在比較核心的位置,這些方面的研究比較多,也就是研究的熱點。
聚類分析(cluster analysis)是將事物本身根據其個體差異分類。根據其相似程度劃分出能夠顯示個體之間親疏關系的圖譜,并將同一類中的不同個體的差異性顯示出來[10]。用UCNET軟件的CONCOR方法將前40個關鍵詞進行聚類分析。CONCOR是一種迭代相關收斂法,它是將一個矩陣中的各行(或者列)之間的相關系數進行重復計算,最終產生的是一個僅由1和-1組成的相關系數矩陣[11]。整個過程中經過多次迭代,這樣就可以對各個行動者進行區分,從而簡化數據。在多次嘗試之后,使用CONCOR方法的層次設置為3時,對這40個關鍵詞的聚類結構為最佳。聚類樹形如圖 4所示。

由圖 4的關鍵詞聚類可以將關鍵詞分為8個子群。這8個子群的分類如表 5所示。

由表 5可以看出在第1子群中“算法”與“圖像”、“分割”、“重建”、“系統”等關鍵詞存在一定程度的聚類,這從一個側面反映出,在圖像處理過程中算法是很重要的,圖像的分割重建等都涉及到了算法的設計與研究。第2子群中的“MRI”、“大腦”等關鍵詞,MRI與大腦有一定的聚類關系,這樣的關系可以在一定程度上反映出MRI在診斷大腦損傷中的應用與研究是比較廣泛的。第3類群中的“識別”、“分類”與“特性”這三個關鍵詞可以看出,在圖像的識別過程中一般會根據其圖像的特性進行分類識別,這樣的三個關鍵詞之間的聚類也是存在的。第5子群中的“計算機斷層掃描”、“運動”、“放射”等關鍵詞的聚類可以看出,由于計算機斷層掃描使用的是X射線,所以它與放射的聚類是合理的,而且計算機斷層掃描的過程是一種運動圖像的生成,所以這些關鍵詞的聚類也是有其合理性的。第6子群的質量、性能、優化等關鍵詞的聚類可以從一個側面反映出圖像的優化與優化性能的提高是圖像質量的一部分,所以這些關鍵詞存在一定程度的聚類。
從整個聚類分析來看,這40個關鍵詞之間的聚類關系比較復雜,細分下來各個集群的關鍵詞之間的聚類大部分是合理的,但是這些關鍵詞之間的復雜的具體關系,還需要更加詳盡的研究。
7 結論
本文將收集與采集到的論文數據進行了整理與分析,統計出這些論文的時間、機構、期刊來源等論文的基本情況。統計并分析學科分布、國家分布與合作、文獻被引用情況等掌握本領域的發展特點。最后統計關鍵詞并將其進行聚類,從而發現領域的研究的主要內容與熱點。
根據統計與研究結果顯示,醫學圖像處理領域的研究歐美國家的發文量比較高,國家間合作關系緊密。從學科的分布來看該領域研究方向多,學科之間存在很多交叉融合。最近幾年主要是對于“算法”、“系統”、“模型”、“圖像”、“分割”等方面的研究比較多。排名比較靠前的關鍵詞之間都存在一定方式的聚類,但是他們之間的聚類關系比較復雜。
經過統計與分析,我們可以大致地掌握該領域發展的基本情況、發展的特點及研究的熱點等情況。
引言
醫學成像技術主要包括:X射線成像、計算機斷層成像(CT)、核磁共振成像(MRI)、放射性核素成像、超聲成像及數字減影血管造影(DSA)等[1]。圖像處理技術主要包括:醫學圖像分割、壓縮、配準以及圖像的增強、特征提取、分析識別等,是計算機輔助影像學診斷與治療的主要內容之一[1]。
醫學圖像處理技術在醫學診斷與臨床治療等方面起著非常重要的作用[1]。醫學成像相關技術的發展更新會帶來醫學診斷的準確性及可靠性的提高。本文采用文獻計量的方法,從已發表文獻的計量統計分析入手,了解醫學圖像處理相關技術的進展情況。
1 討論
醫學圖像處理涉及的內容廣泛,研究技術復雜,對其整體領域的基本情況了解存在一定的困難。
文獻計量學的方法能夠追蹤一個領域的前沿和熱點。對這些前沿與熱點的追蹤能夠深入揭示研究領域的軌跡、特征和規律,可以幫助該領域的專家學者更好地理解該領域的研究動態與發展趨勢[2]。
借助文獻計量學的方法統計與分析醫學圖像處理領域論文的基本情況、領域的發展特點、研究內容與熱點等情況,從一個側面反映該領域研究的基本情況。
2 數據來源
科學引文索引(Science Citation Index,SCI)。因其收錄期刊的標準高,代表性強,所以歷來被公認為是在世界范圍內權威的科學技術文獻的索引工具和科學計量、科學評價的重要工具[3]。
本文通過檢索近十年發表的與醫學圖像處理相關的SCI論文,運用一些評價工具以及相關的數據信息采集整理與圖形化工具對檢索到的文獻進行統計與分析,了解本學科的科研現狀以及發展概況。
以ISI Web of Science 中的SCI-EXPANDED數據庫為統計源,運用主題檢索的方法對檢索式 TS=(medical imag*)and(image process* or map process*)進行檢索,時間限定為2003-2012年,檢索近十年內的關于醫學圖像處理的文章,共3 581篇。SCI數據庫中主題檢索的范圍包括了標題、摘要與主題詞,并不是標準化的主題檢索,所以其檢索結果與需要檢索的內容相比存在一定程度的擴檢,但是由于文獻的總量比較大,這樣的擴展檢所對文獻分析的整體情況影響并不大。
3 分析方法和工具
將檢索出的文獻,導入TDA軟件進行數據的整理與清洗并統計出時間分布、國家分布、機構分布、關鍵詞等方面的數據。數據結果導入EXCLE、UCINET等分析軟件,將部分內容圖形化,得出直觀易懂的結果,根據結果分析該領域發展的基本特點以及熱點等。
TDA是用于進行數據處理的軟件,其界面簡單操作方便,可以對文獻的作者、關鍵詞等進行數據提取、分類、篩選等,為文獻的數據整合提供了一個簡單的平臺。
EXCLE能夠對統計出的數據進行整理與分析,并根據結果做出一系列可視化的圖表,幫助直觀地了解數據的分布與發展情況及趨勢,是一種非常好的可視化工具。
UCINET網絡分析工具能將一維與二維數據進行可視化顯示,簡單直觀地了解并分析各個節點之間的社會網絡關系,并且還能進行各種網絡分析指標的數值分析,如點度中心度、中間中心度、核心邊緣結構分析以及K-叢聚類分析等,是一個功能強大的計量學分析工具。
4 論文的基本情況分析
論文統計的基本情況包括檢索到論文的時間分布、機構分布、論文的期刊來源分布。
4.1 論文時間分布
如圖 1所示,從2003~2012年上半年共檢索到3 581篇文獻。2007年之前的文獻量之間的差距不大,基本平穩。2008~2010年的文獻數量上有所增加,2011年與前幾年相比減少了幾十篇,數量有所下降。

4.2 論文機構分布
在檢索到的3 581篇文獻中,使用數據庫的機構統計功能統計出機構的首選名稱以及組織名稱。結果統計出大約900多個主要的團體作者機構。排名前十的機構的發文量占文獻總數的11.2%。這些機構分別是:哈佛大學、斯坦福大學、加利福利亞州洛杉磯大學、杜克大學、密歇根大學、梅奧臨床醫學院、芝加哥大學、多倫多大學、倫敦大學學院、約翰霍普金斯大學。發表文獻量以及排名,如圖 2所示。中國的上海交通大學排在第17位。

4.3 論文期刊來源分布
檢索出的3 581篇文獻來自400多種不同的期刊。表 1列出了載文量排名前10的期刊,以及這些期刊的影響因子。影響因子是一種即時指數,此值越大則期刊的影響力就越高,在科學發展與交流過程中的影響力就越大,期刊的質量就越高[4]。從表 1的情況來看,載文量最多的是醫學物理學雜志(MEDICAL PHYSICS),其次是算機科學講義(LECTURE NOTES IN COMPUTER SCIENCE)和電氣與電子工程師協會醫學影像學報(IEEE TRANSACTIONS ON MEDICAL IMAGING)。其中,計算機科學講義的影響因子不高,但發文量較高。

5 醫學圖像處理領域的發展特點分析
5.1 論文學科分布
醫學圖像處理技術中,理論技術人員與醫務人員之間的交流、多學科的交叉與融合來提高醫學圖像的處理水平已是發展的一種必然趨勢[5]。根據使用數據庫的科學引文索引的學科類別進行學科分類,例如:放射核醫學成像學科是指包括生物學以及生物物理學的輻射研究的資源,這些資源集中在介入放射學、放射治療學、腫瘤學等方面。具體的統計結果顯示,醫學圖像處理的相關領域的研究類別與方向有90多種,可以看出這個領域研究方向比較寬泛,交叉學科與內容也相對較多。在3 581篇的文獻中,共統計出了90多個學科類別。如表 2所示,顯示了排名前10的學科類別以及各個學科的文獻量以及文獻的比例情況,可以看出,醫學圖像處理領域,研究放射醫學成像的文獻量最大。放射學是一門融合了醫學影像與臨床治療于一體的新興邊緣學科,近30年的發展尤為迅速[6]。其次是工程類學科與計算機類學科。成像技術是以計算機和醫學圖像處理技術的發展為基礎的,計算機技術、網絡通訊技術、數字技術等工程類技術在醫學圖像處理領域中的廣泛應用,極大地促進了醫學影像技術的進步與發展[7] 。

5.2 論文國家分布以及國家間合作關系
統計發現,檢索到的論文分別來自123個不同的國家和地區,其中第一作者分布在88個不同的國家和地區。許多國家都很重視該領域的研究與發展,不同的國家的發文量存在一定的差距。統計各個國家發文量,發現排名前10的國家發文量占總發文量的86%。排名前10國家以及其發文量情況如表 3所示。

美國是發文量最大的國家,約占論文總數的35%。其次是德國與法國。我國的發文量超過200篇,約占論文總數的6%。
不同國家之間存在研究的相互交流與合作,為了研究其基本的科研合作情況,用UCINET做出了合作關系網絡,選擇了發文量排名前40的國家做出其合作關系網絡如圖 3所示。

社會網絡可以顯示各個節點之間的社會關系,從而形成一個社會網絡,這樣的社會網絡可以顯示人與人之間的關系、上下級關系、科研合作關系和文章合著關系等。分析這樣的網絡并進行量化研究,可以建立起一個能夠顯示其特征的模型[7]。社會網絡是根據凝聚子群的概念將行動者之間有相對較強、直接、緊密、經常或者積極關系的行動者聚集到一起,建立起的社會網絡關系圖譜能在一定程度上反映各個行動者之間的關系。如圖 3的模型,各個節點的大小表示了其發表論文的數量,各個節點之間線條的粗細程度可以看出合作的緊密程度。
由圖 3可以看出歐美各個國家之間的合作關系緊密,合作程度相對較高。美國不僅發文量最高,而且與其他國家合作關系也比較緊密。中國跟美國、法國、英國、加拿大等主要國家合作緊密。
(1) 密度分析
密度可以表示社會網絡各個節點之間關系的緊密程度,連線越多,表示整體網絡的密度越大[8]。總體來說,整體網絡的密度越大,表示該網絡中節點之間的相互影響的可能性越大。根據分析結果得到網絡的整體密度為1.238 5,說明在醫學圖像處理領域各個國家之間的聯系相對而言是緊密的,但是各個國家之間的相互影響并不是特別大。從個體網絡密度的分析可以發現,美國、德國、英國、加拿大的平均網絡密度分別為1.65、1.61、1.55、1.60,都高于整體網絡密度,說明歐美等國家在該領域的影響較大。中國的平均網絡密度為1.24,略微高于整體網絡密度,說明中國在這樣一個確定規模的網絡中影響力處于一般水平。
(2) 中心性分析
中心性分析可以衡量這個人或者組織的在整體網絡中的地位。中心度分析一般可以從點度中心度、中間中心度和接近中心度這三個方面的數值去衡量。
點度中心度可以用網絡中與該點有直接聯系的數目來衡量,如果該節點與很多其他行動者之間存在關聯,說明在該網絡中其地位相對而言處于比較中心的位置[9]。一般還可以將點度中心度分為絕對點度中心度和相對點度中心度,后者是前者的標準化。
中間中心度是指一個行動者處于許多交往網絡的路徑上,可以認為其占據一個重要的位置[9]。
接近中心度是指一個點與其他點的鏈接通過的路徑比較短,這樣的是點的接近中心度比較高,可以描述為網絡中的行動者不受其他行動者控制的能力[9]。
由表 4可以看出排名前10的節點的點度中心度,排名前四的國家分別為美國、英國、德國與法國,這表明歐美國家在合作關系網絡中與其他國家的合作關系比較緊密。這些國家處于比較中心的位置。其中,中國排在第八位,絕對點度中心度為3.533,說明中國在合作方面與其他國家的聯系也是比較緊密的。

就中間中心度而言,美國占據著最為中心的位置,中心度為140.129。其次是德國與法國,這兩個國家的中間中心度比較接近,數值相對也比較高,所處的位置也相對比較中心。然后就是英國、加拿大與意大利的中間中心度比較高。中國的中間中心度僅為1.971,在整個網絡中不是處于一個特別中心的位置上。
由此可見,就中國而言與其他國家的合作關系比較緊密,但是并不處于主導地位。
(3) 核心邊緣結構分析
核心邊緣分析是根據網絡中節點之間的緊密程度將節點分為和核心與邊緣兩個區域。核心區域的節點相對而言位置比較重要[9]。
核心邊緣結構分析將40個國家中的美國、德國、英國這三個國家置于了核心的位置,剩下的其他37個國家放在了邊緣位置。說明了在整個網絡中美國、德國與法國的位置比較重要,對其他國家的合作關系影響力最大。
5.3 論文被引用情況分析
總被引頻次可以顯示期刊的被使用情況從而反映出其受重視程度以及在科學交流中的作用和地位[4]。
根據檢索到的3 581篇文章進行被引情況的統計發現,這些文獻的被引頻次總計為34 613次,去除自引的被引頻次總計為33 453次,施引文獻為30 722篇,每項平均被引次數為9.67次,H指數為65。檢索到的這些文獻對醫學圖像處理領域的研究是有很高的參考價值的。
6 研究內容與熱點分析
醫學圖像處理領域的研究內容比較多,存在多學科的交叉與融合。本文嘗試從關鍵詞熱點的角度進行統計分析,從一個側面反映本領域研究的熱點情況。
關鍵詞的統計分析基本是根據關鍵詞出現頻率的高低來判定研究較多的內容從而確定其研究熱點。而聚類是將相關的關鍵詞之間的共性與個性體現出來,從而分析不同關鍵詞之間研究的相關性。
用TDA分別統計這些文獻中的關鍵詞,經過數據擴展與清洗后,結果表明在這10年的文獻量中共檢索到8 063個關鍵詞。其中排名前10個關鍵詞分別為“算法”、“系統”、“模型”、“分割”、“圖像”、“計算機斷層掃描”、“分類”、“CI”、“重建”。用UCINET將前40個關鍵詞進行核心邊緣結構分析結果顯示,處在核心位置的關鍵詞為“算法”、“系統”、“模型”、“分割”、“圖像”,這可以從一個側面反映出這幾個關鍵詞處在醫學圖像處理領域的研究處在比較核心的位置,這些方面的研究比較多,也就是研究的熱點。
聚類分析(cluster analysis)是將事物本身根據其個體差異分類。根據其相似程度劃分出能夠顯示個體之間親疏關系的圖譜,并將同一類中的不同個體的差異性顯示出來[10]。用UCNET軟件的CONCOR方法將前40個關鍵詞進行聚類分析。CONCOR是一種迭代相關收斂法,它是將一個矩陣中的各行(或者列)之間的相關系數進行重復計算,最終產生的是一個僅由1和-1組成的相關系數矩陣[11]。整個過程中經過多次迭代,這樣就可以對各個行動者進行區分,從而簡化數據。在多次嘗試之后,使用CONCOR方法的層次設置為3時,對這40個關鍵詞的聚類結構為最佳。聚類樹形如圖 4所示。

由圖 4的關鍵詞聚類可以將關鍵詞分為8個子群。這8個子群的分類如表 5所示。

由表 5可以看出在第1子群中“算法”與“圖像”、“分割”、“重建”、“系統”等關鍵詞存在一定程度的聚類,這從一個側面反映出,在圖像處理過程中算法是很重要的,圖像的分割重建等都涉及到了算法的設計與研究。第2子群中的“MRI”、“大腦”等關鍵詞,MRI與大腦有一定的聚類關系,這樣的關系可以在一定程度上反映出MRI在診斷大腦損傷中的應用與研究是比較廣泛的。第3類群中的“識別”、“分類”與“特性”這三個關鍵詞可以看出,在圖像的識別過程中一般會根據其圖像的特性進行分類識別,這樣的三個關鍵詞之間的聚類也是存在的。第5子群中的“計算機斷層掃描”、“運動”、“放射”等關鍵詞的聚類可以看出,由于計算機斷層掃描使用的是X射線,所以它與放射的聚類是合理的,而且計算機斷層掃描的過程是一種運動圖像的生成,所以這些關鍵詞的聚類也是有其合理性的。第6子群的質量、性能、優化等關鍵詞的聚類可以從一個側面反映出圖像的優化與優化性能的提高是圖像質量的一部分,所以這些關鍵詞存在一定程度的聚類。
從整個聚類分析來看,這40個關鍵詞之間的聚類關系比較復雜,細分下來各個集群的關鍵詞之間的聚類大部分是合理的,但是這些關鍵詞之間的復雜的具體關系,還需要更加詳盡的研究。
7 結論
本文將收集與采集到的論文數據進行了整理與分析,統計出這些論文的時間、機構、期刊來源等論文的基本情況。統計并分析學科分布、國家分布與合作、文獻被引用情況等掌握本領域的發展特點。最后統計關鍵詞并將其進行聚類,從而發現領域的研究的主要內容與熱點。
根據統計與研究結果顯示,醫學圖像處理領域的研究歐美國家的發文量比較高,國家間合作關系緊密。從學科的分布來看該領域研究方向多,學科之間存在很多交叉融合。最近幾年主要是對于“算法”、“系統”、“模型”、“圖像”、“分割”等方面的研究比較多。排名比較靠前的關鍵詞之間都存在一定方式的聚類,但是他們之間的聚類關系比較復雜。
經過統計與分析,我們可以大致地掌握該領域發展的基本情況、發展的特點及研究的熱點等情況。