研究原癌基因pim-2的分子生物學特性, 分析其相關機制。使用生物信息學方法和技術研究分析原癌基因pim-2, 用在線服務器分析pim-2基因的染色體定位, 預測外顯子、開放式閱讀框、CpG島和miRNAs互補片段等。用生物信息學軟件預測原癌基因pim-2轉錄蛋白的理化性質和蛋白序列各類修飾位點, 如泛素化、糖基化等, 計算抗原指數, 模建空間結構。結果顯示原癌基因pim-2有6個外顯子, CDS編碼框轉錄一段含311個氨基酸的肽鏈; 基因啟動子存在CpG島; 3'UTR區域含miRNA基因。Pim-2蛋白分子量34 188.47, 等電點5.78, 不穩定指數是45.87, 消光系數為279 nm; 蛋白序列分布著多處共價修飾位點、2處泛素化位點、4處糖基化位點、1處SUMO化位點、1處亞硝基化位點以及2處棕櫚酰化位點; 蛋白序列存在16段抗原指數較高區域。研究表明原癌基因pim-2序列上所分布的相關區域和修飾位點與其致癌作用存在密切關系。
引用本文: 周小東, 沈富兵. 原癌基因pim-2分子生物學特性研究. 生物醫學工程學雜志, 2015, 32(2): 405-411. doi: 10.7507/1001-5515.20150073 復制
引言
絲/蘇氨酸激酶Pim家族最初在莫羅尼鼠類白血病病毒(Moloney murine leukemia virus, MMLV)的前病毒整合過程中被發現而得名,后被證實屬于鈣/鈣調蛋白激酶(calcium/calmodulin regulated kinase, CAMP)相關的蛋白激酶家族。Pim家族在多細胞組織進化過程中高度保守,廣泛分布在各脊椎動物組織中,具有多種重要功能,是細胞通路的關鍵分子,能增強細胞的抗凋亡作用,對腫瘤細胞、某些正常細胞的增殖與細胞周期具有調節功能。現已發現3個成員pim-1、pim-2和pim-3,其中pim-2基因是一種原癌基因,是MMLV前病毒整合的共同位點,能抑制細胞凋亡,能使翻譯抑制因子4EBP-1保持磷酸化而失活,其反義核苷酸可抑制前列腺腫瘤DU2145細胞系的增殖。但是,對pim-2基因和其轉錄蛋白研究甚少,它的大部分功能還未闡明。本研究利用生物信息學的方法和技術,對pim-2基因及其轉錄蛋白的結構和生物學特性做深入研究。
1 材料與方法
1.1 數據來源
數據資料來自美國國立信息技術中心NCBI,檢索下載人類pim-2基因序列,序列號為NM_006875.3。
1.2 pim-2基因分析
使用生物信息學的在線服務器,分析pim-2基因的染色體定位,預測外顯子、啟動子、開放式閱讀框、編碼序列,分析CpG島(cytosine guanine island,CpG island)和微RNA(microRNAs,miRNAs)互補片段。
1.3 Pim-2蛋白研究
生物信息學分析軟件分析蛋白理化性質,預測蛋白的各類修飾位點,包括共價修飾、泛素化、糖基化、SUMO化、亞硝基化、棕櫚酰化等,分析抗原指數,模建空間結構。
2 結果與分析
2.1 pim-2基因特性研究
pim-2基因位于X染色體短臂1區1帶2亞帶3次亞帶,序列全長2 234堿基對(bp),含有478個腺嘌呤(adenine,A)、643個胞嘧啶(cytosine,C)、576個鳥嘌呤(guanine,G)、537個胸腺嘧啶(thymine,T)。使用在線服務器Sim4分析序列,結果顯示pim-2基因分布著6個外顯子,分別位于1-363、364-473、474-524、525-897、898-1 074、1 075-2 187位。2個尚未歸類特征區(misc_feature)885-887和912-914位,2個序列標簽位點(sequence-tagged site,STS)1941-2097和2037-2159位。使用在線服務程序Promoter Scan分析pim-2基因,在2-252位預測分值為89,為啟動子區。啟動子位于結構基因5′端上游,具有活化RNA聚合酶、轉錄起始的特異性。它本身并不控制基因活動,而是通過轉錄因子的結合而控制基因活動。當啟動子發生基因突變,將導致基因表達障礙,可引起惡性腫瘤。使用在線服務器ORF Finder分析pim-2基因的閱讀框,pim-2基因分布著多段開放式閱讀框,可編碼相應的肽鏈,如圖 1所示。

其中蛋白質編碼區(CDS)位于303-1238,長936 bp,編碼一段311個氨基酸構成的肽鏈,編碼序列為:MLTKPLQGPPAPPGTPTPPPGGKDREAFEAE-YRLGPLLGKGGFGTVFAGHRLTDRLQVAIK-VIPRNRVLGWSPLSDSVTCPLEVALLWKVGA-GGGHPGVIRLLDWFETQEGFMLVLERPLPA-QDLFDYITEKGPLGEGPSRCFFGQVVAAIQH-CHSRGVVHRDIKDENILIDLRRGCAKLIDFGS-GALLHDEPYTDFDGTRVYSPPEWISRHQYH-ALPATVWSLGILLYDMVCGDIPFERDQEILEA-ELHFPAHVSPDCCALIRRCLAPKPSSRPSLEE-ILLDPWMQTPAEDVPLNPSKGGPAPLAWSLLP。
2.2 CpG島預測
使用在線服務器Urogene的Methprimer程序分析pim-2基因,在序列的啟動子區域存在一段富含雙核苷酸“CG”及磷酸酯鍵的重復序列,這段DNA片段被稱為CpG島。pim-2基因序列的CpG島,位于48-487位,全長440 bp,預測結果如圖 2所示。CpG島易發生甲基化,DNA甲基化是在DNA甲基轉移酶(DNA methyltransferase,DNAMTs)作用下將胞嘧啶第5位碳原子添加甲基基團,形成甲基化胞嘧啶(5-mC),再與3′端的鳥嘌呤結合形成甲基化CpG(methylation CpG,mCpG),并雙鏈對稱出現,這一過程可引起DNA構象、穩定性以及染色體結構的改變。由于pim-2基因的啟動子與CpG島重疊,啟動子區發生CpG島高甲基化后,在轉錄水平抑制基因表達,啟動子區的高甲基化抑制基因轉錄的機制有以下幾點:①mCpG的甲基化胞嘧啶伸入DNA雙螺旋的主溝,抑制了DNA與多種轉錄因子的結合。②mCpG能抑制核因子-κB(nucleus factor-kappa B,NF-κB)、核轉錄因子2(elongation 2 factor,E2F)、增強子結合蛋白2(enhancer binding protein 2,AP-2)等序列特異性轉錄因子與DNA的結合。③mCpG激活DNA甲基轉移酶相關蛋白1(DNA methyltransferase 1-associated protein 1,DMAP1)、腫瘤易感基因101(tumor susceptibility gene 101,TSG101)等阻遏蛋白因子,導致抑制蛋白轉錄。④乙酰化后的組蛋白H3、H4賴氨酸與DNA緊密結合,轉錄過程中難以解聚,從而抑制基因轉錄。另外基因甲基化導致突變率增高,自發出現5-甲基胞嘧啶脫氨形成胸腺嘧啶,再易發生C→T的突變。由上可見,CpG島甲基化可抑制基因轉錄,改變親代遺傳印記,導致基因結構功能異常,使癌基因激活,造成一些疾病和腫瘤的發生。有文獻報道很多腫瘤病例在確診之前,如乳腺癌患者的血液、淋巴結標本、乳頭導管分泌液,就已經明確出現甲基化陽性。

2.3 miRNAs基因預測
miRNAs是在一種內源性的具有調控功能的非編碼RNA,長度約22個核苷酸,成熟后的miRNAs與靶基因mRNA的3′非編碼區(3′Untranslated Regions,3′UTR)互補結合,抑制靶基因的翻譯或降解切割,從而改變基因的表達[1]。通過數據庫TargetScan,查找與pim-2基因配對的miRNAs,分析結果顯示,pim-2基因3′UTR區域有一段與之互補的miRNAs互補片段,位于pim-2基因終止密碼子下游區119-126位,與shsa-miR-200b、hsa-miR-200c、hsa-miR-429三種miRNAs能互補結合,相互交叉重疊。miRNAs的5′非編碼區(5′UTR)與靶基因3′UTR完全互補結合后,靶mRNA可被分裂切割,蛋白質的合成被阻止,從而對細胞的增殖、分化、凋亡起到調節作用。當miRNAs的5′UTR與靶基因3′UTR發生不完全互補,則會抑制靶mRNA的翻譯[2]。當一個靶基因能被多個miRNAs同時作用,常協同發生轉錄后抑制靶mRNA的作用,造成基因沉默。miRNAs若出現突變或異常表達,可引起多種人類腫瘤,大約50%得到注解的miRNAs都可以定位于在基因組上的腫瘤相關脆性位點,如純合性缺失區、雜合性缺失區、斷裂點區、擴增區、抑癌基因部位和近癌基因部位[3]。miRNAs與腫瘤的關系密切且多樣,可發揮癌基因、抑癌基因、下調原癌基因活性、下調抑原癌基因活性的作用。
分析結果還顯示該miRNAs靶基因序列在進化上有較高保守性,在人(Homo sapiens, Hsa)、黑猩猩(Pan troglodytes,Ptr)、獼猴(Macaca mulatta,Mml)、小耳大嬰猴(Otolemur garnettii,Oga)、小家鼠(Mus musculus,Mmu)、褐家鼠(Rattus norvegicus,Rno)、豚鼠(Cavia porcellus,Cpo)、非洲象(Loxodonta africana,Laf)等多個物種之間保守存在,如圖 3所示。進化保守一般意味著具有重要生理功能,轉錄蛋白具有特殊蛋白質位點,該位點位于重要功能區域內[4]。

2.4 Pim-2蛋白理化性質
使用生物信息學分析軟件DNAMAN V6分析Pim-2蛋白序列,該肽鏈相對分子量為34 188.47,分子式為C1550H2401N417O433S12,預測等電點為5.78。通過線服務器expasy的protparam程序分析顯示Pim-2蛋白的不穩定指數是45.87,消光系數為279 nm,脂肪指數91.25,平均親水性-0.141。含38個酸性氨基酸,29個堿性氨基酸,53個親水性氨基酸,112個疏水性氨基酸。肽鏈中含量最高的氨基酸是亮氨酸Leu(12.54%),其次是脯氨酸Pro(11.25%),甘氨酸Gly(9.65%)。肽鏈的氨基酸構成比如圖 4所示。

2.5 轉錄蛋白共價修飾
蛋白共價修飾是蛋白質轉錄合成之后發生的共價修飾,修飾作用對功能發揮具有重要作用。使用在線服務器Prosite預測Pim-2蛋白可能的修飾位點[5],Pim-2蛋白序列上分布著6種13段蛋白質修飾位點,如表 1所示。

序列53-55、130-132、272-274位為蛋白激酶C磷酸化位點,蛋白激酶C能作用細胞質的靶酶調控生化反應,作用于細胞核中的轉錄因子調控基因表達,進而影響細胞的生長和分化。
序列25-32位為酪氨酸激酶磷酸化位點,酪氨酸激酶能將蛋白質上的某些酪氨酸殘基磷酸化調節其功能,磷酸化的酪氨酸部位成為細胞內信號蛋白的結合位點,激活細胞內的生化反應,引起細胞的綜合性應答。
序列195-198、204-207、276-279、288-291位為蛋白激酶CK2磷酸化位點,是典型的磷酸化受體部位,位點周圍存在大量酸性氨基酸殘基。蛋白激酶CK2是一類信使非依賴性絲/蘇氨酸蛋白激酶,在很多腫瘤中表達失調、活性增高。其致癌機制很復雜,與下列因素有關:①CK2可影響c-myc癌基因(c-myelocytomatosis viral oncogene,c-myc)的穩定性,是腫瘤發生相關的Wnt信號的正性調節物[6];②CK2表達失衡,如c-myc聯合CK2α轉基因表達,可出現致癌潛能,可使小鼠出現白血病、淋巴瘤[7]。CK2還通過多條途徑參與著細胞凋亡,作用于細胞質和細胞核的靶點,如半胱天冬酶-2(cysteinyl aspartate specific proteinase-2,Caspase-2)、核纖層蛋白A(nuclear lamina protein A,Lamin A)、凋亡抑制蛋白(inhibitor of apoptosis proteins,IAPs)等:①Caspase-2是CK2的靶點,被CK2作用后,可發生脫磷酸二聚作用后活化,使Bcl-2相關X蛋白(Bcl-2 Associated X Protein,BAX)轉移到線粒體,釋放出凋亡蛋白;②Lamin A的分裂程度常可用來指示核凋亡的活性,Lamin A與CK2之間的表達呈負相關,CK2表達下調時Lamin A分裂增強,CK2過度表達時Lamin A分裂被抑制;③IAPs能保護特定細胞抵抗凋亡,是一種抗凋亡基因表達產物,IAPs與CK2之間呈正相關的表達,當CK2被化學抑制劑抑制時,可導致IAPs水平降低,進而影響細胞凋亡[8]。
序列41-46、91-96、145-150位為N-豆蔻酰化位點。N-豆蔻酰化為豆蔻酰CoA與蛋白質N端甘氨酸殘基成酰胺鍵,為不可逆的蛋白質脂酰基修飾方式。它在膜定位中起重要作用,豆蔻酰化殘基穿梭于膜之間,可結合到疏水核心,能穩定蛋白質結構。插入質膜內脂層的豆蔻酰化殘基可使膜容易相互作用,把細胞質內接受到的信號,通過核孔傳遞到核內。當豆蔻酰轉移酶(N-Myristoyltransferase,NMT)活性過高,可導致蛋白質畸形豆蔻酰化,引起信號轉導紊亂,導致腫瘤發生。據報道,Magnuson等發現早期結腸癌的細胞NMT活性異常增高。
2.6 泛素化位點預測
蛋白質泛素化是蛋白質翻譯后的修飾模式,與細胞內蛋白質降解和細胞活動密切相關。預測蛋白質泛素化已有多種在線程序,如BDM-PUB、UbPred、CKSAAP_UbSite等。利用這些方法預測Pim-2蛋白的泛素化修飾,綜合分析可見Pim-2蛋白上分布著5處泛素化得分較高位點,但第4和23位得分分別為0.114 845、0.120 762,超過閾值,可確定為泛素化位點,如圖 5所示。泛素化是靶蛋白

上的特定賴氨酸殘基與泛素分子共價結合,所形成肽鍵能促進蛋白質降解,該過程保守并可逆[9]。研究發現,細胞必須保持蛋白質的產生、降解動態平衡,才能使細胞功能正常,結構穩定。泛素與蛋白酶構成泛素-蛋白酶途徑(ubiquitin-proteasome pathway,UPP)可選擇性高效降解細胞內蛋白質,如癌基因、抑癌基因產物和短壽命細胞周期調節蛋白和變性變結蛋白等。當UPP系統對靶蛋白降解的部位、時間、速率出現功能失常,可引起抑癌蛋白異常降解、癌蛋白聚集、突變細胞凋亡受阻增殖加速,引起癌變。研究發現,其致癌機制有多種途徑:①UPP系統調控著細胞周期依賴性蛋白激酶(cyclin-dependent protein kinases,CDKs)和細胞周期素(Cyclins),這二者控制著細胞周期轉換,當泛素降解缺陷,導致Cyclins增高,一些惡性腫瘤的Cyclins表達異常增高。②UPP系統調控著細胞凋亡:B淋巴細胞瘤-2基因(B-cell lymphoma-2,Bcl-2)家族能促進具有凋亡作用的Bax表達,Bax進入線粒體后可活化半胱氨酸天冬氨酸蛋白酶-9(cysteinyl aspartate specific proteinase-9,Caspase-9),促進凋亡。隨著前列腺癌的格利森評分(Gleason)增高,UPP對Bax蛋白的泛素化降解也明顯增強。③UPP系統參與著一些關鍵蛋白和信號傳導途徑的調節:NF-κB、β-鏈蛋白(β-catenin)、抑癌基因p53(tumor suppressor p53)、表皮生長因子受體(epidermal growth factor receptor,EGFR)、第10號染色體缺失的磷酸酶和張力蛋白同源物基因(phosphatase and tensin hmmlogydeleted on ten,PTEN)[10]。
2.7 糖基化位點預測
蛋白糖基化是真核生物蛋白質翻譯后的一種修飾,糖基轉移酶將活化的單糖加到肽鏈上,而形成具有獨特生物活性的糖蛋白[11]。使用在線生物信息學程序DictyOGlyc 1.1 Server分析Pim-2蛋白的糖基化結構,預測結果顯示蛋白序列上存在4處糖基化位點,分別在15、17、140、272位。其分布如圖 6如示。糖基化修飾是一種最普遍的蛋白質修飾,約50%的蛋白質經過糖基化修飾。蛋白質糖基化可調節受體與配體的作用,影響免疫分子的結構功能,控制蛋白質在細胞器之間的穿梭以及在細胞膜上的翻轉[12],進而影響影響免疫分子的折疊、成熟、包裝、投送、定位和穩定,以及影響T細胞功能、體液免疫的功能和免疫應答的強弱等。

2.8 其它蛋白質修飾預測
使用在線服務器biocuckoo的工具包,分析Pim-2蛋白的其它蛋白質修飾,包括小泛素相關修飾物(small ubiquitin-related modifier,SUMO)化、亞硝基化和棕櫚酰化。使用程序SUMOsp 2.0.4,分析預測Pim-2蛋白SUMO化。該法是基于PSFS法,即連續前向特性選擇法[13]。結果顯示在蛋白序列的第165位,預測分值為2.886,存在SUMO化修飾序列RDIKDEN。SUMO修飾是一種依賴ATP的小蛋白共價修飾,能結合于組蛋白的賴氨酸殘基。蛋白質經SUMO化修飾后更加穩定,并對其修飾底物具有廣泛功能,如能調節蛋白質定位,調節蛋白質轉錄活性,調節細胞周期,拮泛素化作用,并能影響到蛋白的穩定性、核質轉運、酶活性、蛋白之間、DNA-蛋白之間的相互作用等。蛋白質經SUMO化修飾后與腫瘤的發生發展關系密切,但致癌機制復雜,與P53、崗哨蛋白特異蛋白酶(sentrin-specificprotease,SENP)、瘦蛋白(Reptin蛋白)、腫瘤轉移抑制基因1(kangai1, KAI1)、低氧誘導因子1(Hypoxia-inducible factor-1,HIF-1)、ETS轉錄因子家族(E-twenty six,Ets)等異常表達相關,一些致癌因素的機制已探明,一些尚在探索之中。如:①SUMO可激活P53轉錄活性,易化P53介導的細胞衰老,當SUMO化修飾減少,可降低P53的抑癌功能,導致癌癥發生[14]。②SUMO化與去SUMO化處于動態平衡之中,位于細胞核內的SENP能逆轉SUMO修飾,當SENP表達異常增高使SUMO化與去SUMO化的平衡被破壞,將導致調節功能發生異常。曾有文獻報道大量前列腺癌患者SENP表達異常增高[15]。
使用程序GPS-YNO2 1.0分析預測Pim-2蛋白的亞硝基化位點,結果顯示在Pim-2蛋白序列的80位,預測分值是23.022,存在亞硝基化序列PLSDSVTCPLEVALL。蛋白質亞硝基化是一氧化氮(nitric oxide,NO)氧化修飾半胱氨酸巰基(-SH)生成高分子量的亞硝基化蛋白質(protein S-nitrosylation,PSNO)和低分子量的亞硝基硫醇(s-nitrosothiols, RSNO)。蛋白硝基化改變了蛋白質的結構和功能,調節著很多生理、病理功能,如調控細胞信號轉導,調控離子通道,調節膜受體功能,影響激酶活性,影響轉錄因子DNA結合活性,還參與細胞凋亡和炎癥反應[16]。
使用生物信息學軟件CSS-Palm 3.0,分析預測Pim-2蛋白質棕櫚酰化結構,結果顯示蛋白質序列在260位(AHVSPDCCALIRRCL)和266位(CCALIRRCLAPKPSS)預測分值為1.628、0.75,說明存在兩段棕櫚酰化序列。蛋白質棕櫚酰化是蛋白質翻譯后的一種脂質共價修飾,賦予蛋白質復雜的生理功能,如調節蛋白質活性、穩定性,參與調節多種細胞信號通路,介導蛋白質之間和蛋白質-脂質相互作用[17]。
2.9 抗原性指數分析
常用于預測蛋白質抗原性的軟件有DNAMAN V6,使用軟件DNAMAN V6分析Pim-2蛋白序列,結果顯示蛋白序列存在16段抗原指數較高區域,如表 2所示。Pim-2蛋白序列的這些區段抗原指數值高,氨基酸殘基親水性強,二級結構易于形成轉角和不規則卷曲,符合B細胞表位要求,說明該區段含潛在優勢抗原表位,構成蛋白質表位的可能性較大[18]。

2.10 Pim-2蛋白空間結構模建
蛋白的功能發揮是與其空間結構和活性結構域密切相關,空間結構的不同很大程度上導致了其生物學功能多樣性,將Pim-2蛋白序列提交通過專業網expasy的在線程序Swiss-Model同源模建Pim-2蛋白的空間構型。用Discovery Studio模建Pim-2蛋白的受體活性中心,受體活性中心呈球狀結構,如圖 7所示。受體活性中心是蛋白質結構和功能的重要組成部分,可按照能量互補、空間幾何互補以及化學環境互補的原則,與相對應的配體互補結合,從而發揮相應的功能。Pim-2蛋白活性中心具體的生理作用、致癌機制尚未完全明確,與抗癌藥物進行分子對接的研究工作也正在進行之中。

3 總結
pim-2是于1984年在染色體Xp11.23中被首次發現,后來發現在腦和淋巴樣細胞廣泛表達,具有絲氨酸/蘇氨酸激酶活性的有效存活因子。在特定條件下,表現出原癌基因的作用,參與細胞抗凋亡作用及其信號轉導,與多種腫瘤的發生發展密切相關。國內外學者對其展開了深入研究,取得一系列發現,pim-2具有抗凋亡特性,與B淋巴細胞瘤-xL(B-cell lymphoma-extra large,Bcl-xL)和蛋白激酶B(protein kinase B, PKB)類似,具有維持細胞大小的功能,在糖酵解時可維持線粒體膜蛋白完整,防止萎縮,在缺乏生長因子的狀態下能夠維持細胞的生存和合成代謝。pim-2抗凋亡受很多因素調節,如飽和性的影響,以及受白細胞介素3、4、6(interleukin-3, 4, 6, IL-3, 4, 6,)和γ干擾素等的影響。以色列希伯來大學的研究者發現,pim-2基因可轉錄出34、38和41 kDa的三種蛋白,三者N端不同但具有相同的活性中心,催化位點相同,其中34 kDa蛋白活性最強。Pim-2蛋白具有激酶作用,能使p21蛋白、促凋亡蛋白(Bcl-xl/Bcl-2-Associated Death promoter, BAD)發生磷酸化改變活性,抑制細胞凋亡。當凋亡和增生平衡被打破,可導致腫瘤發生。例如,研究發現非霍奇金淋巴瘤、淋巴細胞性白血病、急性骨髓性白血病等惡性腫瘤患者體內,pim-2水平表達異常增高。
pim-2是重要的原癌基因,它的結構和生物學功能、轉錄蛋白和激酶底物都是研究熱點,并逐漸成為抗癌藥物的新靶點。Pim-2激酶抑制劑是腫瘤治療藥物的研究方向。大多數研究分析了其在信號轉導過程中的作用、致癌機制以及抗癌治療設想,但未對pim-2的各特性做全面梳理歸納,故本研究用生物信息學的方法對pim-2從基因到蛋白層面都進行全面的分析和系統的總結。分析出pim-2基因分布的外顯子,明確了啟動子區,發現啟動子區存在CpG島,含有miRNAs基因互補片段。研究還分析了Pim-2蛋白的理化性質,發現蛋白序列上存在CK2、TYR、myristyl等多種蛋白共價修飾位點,以及泛素化位點、糖基化位點、SUMO化、亞硝基化和棕櫚酰化修飾位點。預測出抗原指數,模建了空間結構。這些分析結果當中,CpG島、miRNAs基因互補片段、CK2 phospho Site、泛素化位點、SUMO化等與致癌關系密切,并對各致癌機制做了分析歸納整理。外顯子、理化性質、糖基化、亞硝基化、棕櫚酰化、抗原指數、空間結構等,雖然不具備直接的致癌作用,但也是pim-2重要構成部分,會直接、間接地發揮著相應作用。通過這些基礎性的研究工作,構建起pim-2的知識體系,可為進一步研究pim-2在各類腫瘤的發病機制、臨床治療和轉歸、預后,提供一定科學依據和必要的理論幫助。
引言
絲/蘇氨酸激酶Pim家族最初在莫羅尼鼠類白血病病毒(Moloney murine leukemia virus, MMLV)的前病毒整合過程中被發現而得名,后被證實屬于鈣/鈣調蛋白激酶(calcium/calmodulin regulated kinase, CAMP)相關的蛋白激酶家族。Pim家族在多細胞組織進化過程中高度保守,廣泛分布在各脊椎動物組織中,具有多種重要功能,是細胞通路的關鍵分子,能增強細胞的抗凋亡作用,對腫瘤細胞、某些正常細胞的增殖與細胞周期具有調節功能。現已發現3個成員pim-1、pim-2和pim-3,其中pim-2基因是一種原癌基因,是MMLV前病毒整合的共同位點,能抑制細胞凋亡,能使翻譯抑制因子4EBP-1保持磷酸化而失活,其反義核苷酸可抑制前列腺腫瘤DU2145細胞系的增殖。但是,對pim-2基因和其轉錄蛋白研究甚少,它的大部分功能還未闡明。本研究利用生物信息學的方法和技術,對pim-2基因及其轉錄蛋白的結構和生物學特性做深入研究。
1 材料與方法
1.1 數據來源
數據資料來自美國國立信息技術中心NCBI,檢索下載人類pim-2基因序列,序列號為NM_006875.3。
1.2 pim-2基因分析
使用生物信息學的在線服務器,分析pim-2基因的染色體定位,預測外顯子、啟動子、開放式閱讀框、編碼序列,分析CpG島(cytosine guanine island,CpG island)和微RNA(microRNAs,miRNAs)互補片段。
1.3 Pim-2蛋白研究
生物信息學分析軟件分析蛋白理化性質,預測蛋白的各類修飾位點,包括共價修飾、泛素化、糖基化、SUMO化、亞硝基化、棕櫚酰化等,分析抗原指數,模建空間結構。
2 結果與分析
2.1 pim-2基因特性研究
pim-2基因位于X染色體短臂1區1帶2亞帶3次亞帶,序列全長2 234堿基對(bp),含有478個腺嘌呤(adenine,A)、643個胞嘧啶(cytosine,C)、576個鳥嘌呤(guanine,G)、537個胸腺嘧啶(thymine,T)。使用在線服務器Sim4分析序列,結果顯示pim-2基因分布著6個外顯子,分別位于1-363、364-473、474-524、525-897、898-1 074、1 075-2 187位。2個尚未歸類特征區(misc_feature)885-887和912-914位,2個序列標簽位點(sequence-tagged site,STS)1941-2097和2037-2159位。使用在線服務程序Promoter Scan分析pim-2基因,在2-252位預測分值為89,為啟動子區。啟動子位于結構基因5′端上游,具有活化RNA聚合酶、轉錄起始的特異性。它本身并不控制基因活動,而是通過轉錄因子的結合而控制基因活動。當啟動子發生基因突變,將導致基因表達障礙,可引起惡性腫瘤。使用在線服務器ORF Finder分析pim-2基因的閱讀框,pim-2基因分布著多段開放式閱讀框,可編碼相應的肽鏈,如圖 1所示。

其中蛋白質編碼區(CDS)位于303-1238,長936 bp,編碼一段311個氨基酸構成的肽鏈,編碼序列為:MLTKPLQGPPAPPGTPTPPPGGKDREAFEAE-YRLGPLLGKGGFGTVFAGHRLTDRLQVAIK-VIPRNRVLGWSPLSDSVTCPLEVALLWKVGA-GGGHPGVIRLLDWFETQEGFMLVLERPLPA-QDLFDYITEKGPLGEGPSRCFFGQVVAAIQH-CHSRGVVHRDIKDENILIDLRRGCAKLIDFGS-GALLHDEPYTDFDGTRVYSPPEWISRHQYH-ALPATVWSLGILLYDMVCGDIPFERDQEILEA-ELHFPAHVSPDCCALIRRCLAPKPSSRPSLEE-ILLDPWMQTPAEDVPLNPSKGGPAPLAWSLLP。
2.2 CpG島預測
使用在線服務器Urogene的Methprimer程序分析pim-2基因,在序列的啟動子區域存在一段富含雙核苷酸“CG”及磷酸酯鍵的重復序列,這段DNA片段被稱為CpG島。pim-2基因序列的CpG島,位于48-487位,全長440 bp,預測結果如圖 2所示。CpG島易發生甲基化,DNA甲基化是在DNA甲基轉移酶(DNA methyltransferase,DNAMTs)作用下將胞嘧啶第5位碳原子添加甲基基團,形成甲基化胞嘧啶(5-mC),再與3′端的鳥嘌呤結合形成甲基化CpG(methylation CpG,mCpG),并雙鏈對稱出現,這一過程可引起DNA構象、穩定性以及染色體結構的改變。由于pim-2基因的啟動子與CpG島重疊,啟動子區發生CpG島高甲基化后,在轉錄水平抑制基因表達,啟動子區的高甲基化抑制基因轉錄的機制有以下幾點:①mCpG的甲基化胞嘧啶伸入DNA雙螺旋的主溝,抑制了DNA與多種轉錄因子的結合。②mCpG能抑制核因子-κB(nucleus factor-kappa B,NF-κB)、核轉錄因子2(elongation 2 factor,E2F)、增強子結合蛋白2(enhancer binding protein 2,AP-2)等序列特異性轉錄因子與DNA的結合。③mCpG激活DNA甲基轉移酶相關蛋白1(DNA methyltransferase 1-associated protein 1,DMAP1)、腫瘤易感基因101(tumor susceptibility gene 101,TSG101)等阻遏蛋白因子,導致抑制蛋白轉錄。④乙酰化后的組蛋白H3、H4賴氨酸與DNA緊密結合,轉錄過程中難以解聚,從而抑制基因轉錄。另外基因甲基化導致突變率增高,自發出現5-甲基胞嘧啶脫氨形成胸腺嘧啶,再易發生C→T的突變。由上可見,CpG島甲基化可抑制基因轉錄,改變親代遺傳印記,導致基因結構功能異常,使癌基因激活,造成一些疾病和腫瘤的發生。有文獻報道很多腫瘤病例在確診之前,如乳腺癌患者的血液、淋巴結標本、乳頭導管分泌液,就已經明確出現甲基化陽性。

2.3 miRNAs基因預測
miRNAs是在一種內源性的具有調控功能的非編碼RNA,長度約22個核苷酸,成熟后的miRNAs與靶基因mRNA的3′非編碼區(3′Untranslated Regions,3′UTR)互補結合,抑制靶基因的翻譯或降解切割,從而改變基因的表達[1]。通過數據庫TargetScan,查找與pim-2基因配對的miRNAs,分析結果顯示,pim-2基因3′UTR區域有一段與之互補的miRNAs互補片段,位于pim-2基因終止密碼子下游區119-126位,與shsa-miR-200b、hsa-miR-200c、hsa-miR-429三種miRNAs能互補結合,相互交叉重疊。miRNAs的5′非編碼區(5′UTR)與靶基因3′UTR完全互補結合后,靶mRNA可被分裂切割,蛋白質的合成被阻止,從而對細胞的增殖、分化、凋亡起到調節作用。當miRNAs的5′UTR與靶基因3′UTR發生不完全互補,則會抑制靶mRNA的翻譯[2]。當一個靶基因能被多個miRNAs同時作用,常協同發生轉錄后抑制靶mRNA的作用,造成基因沉默。miRNAs若出現突變或異常表達,可引起多種人類腫瘤,大約50%得到注解的miRNAs都可以定位于在基因組上的腫瘤相關脆性位點,如純合性缺失區、雜合性缺失區、斷裂點區、擴增區、抑癌基因部位和近癌基因部位[3]。miRNAs與腫瘤的關系密切且多樣,可發揮癌基因、抑癌基因、下調原癌基因活性、下調抑原癌基因活性的作用。
分析結果還顯示該miRNAs靶基因序列在進化上有較高保守性,在人(Homo sapiens, Hsa)、黑猩猩(Pan troglodytes,Ptr)、獼猴(Macaca mulatta,Mml)、小耳大嬰猴(Otolemur garnettii,Oga)、小家鼠(Mus musculus,Mmu)、褐家鼠(Rattus norvegicus,Rno)、豚鼠(Cavia porcellus,Cpo)、非洲象(Loxodonta africana,Laf)等多個物種之間保守存在,如圖 3所示。進化保守一般意味著具有重要生理功能,轉錄蛋白具有特殊蛋白質位點,該位點位于重要功能區域內[4]。

2.4 Pim-2蛋白理化性質
使用生物信息學分析軟件DNAMAN V6分析Pim-2蛋白序列,該肽鏈相對分子量為34 188.47,分子式為C1550H2401N417O433S12,預測等電點為5.78。通過線服務器expasy的protparam程序分析顯示Pim-2蛋白的不穩定指數是45.87,消光系數為279 nm,脂肪指數91.25,平均親水性-0.141。含38個酸性氨基酸,29個堿性氨基酸,53個親水性氨基酸,112個疏水性氨基酸。肽鏈中含量最高的氨基酸是亮氨酸Leu(12.54%),其次是脯氨酸Pro(11.25%),甘氨酸Gly(9.65%)。肽鏈的氨基酸構成比如圖 4所示。

2.5 轉錄蛋白共價修飾
蛋白共價修飾是蛋白質轉錄合成之后發生的共價修飾,修飾作用對功能發揮具有重要作用。使用在線服務器Prosite預測Pim-2蛋白可能的修飾位點[5],Pim-2蛋白序列上分布著6種13段蛋白質修飾位點,如表 1所示。

序列53-55、130-132、272-274位為蛋白激酶C磷酸化位點,蛋白激酶C能作用細胞質的靶酶調控生化反應,作用于細胞核中的轉錄因子調控基因表達,進而影響細胞的生長和分化。
序列25-32位為酪氨酸激酶磷酸化位點,酪氨酸激酶能將蛋白質上的某些酪氨酸殘基磷酸化調節其功能,磷酸化的酪氨酸部位成為細胞內信號蛋白的結合位點,激活細胞內的生化反應,引起細胞的綜合性應答。
序列195-198、204-207、276-279、288-291位為蛋白激酶CK2磷酸化位點,是典型的磷酸化受體部位,位點周圍存在大量酸性氨基酸殘基。蛋白激酶CK2是一類信使非依賴性絲/蘇氨酸蛋白激酶,在很多腫瘤中表達失調、活性增高。其致癌機制很復雜,與下列因素有關:①CK2可影響c-myc癌基因(c-myelocytomatosis viral oncogene,c-myc)的穩定性,是腫瘤發生相關的Wnt信號的正性調節物[6];②CK2表達失衡,如c-myc聯合CK2α轉基因表達,可出現致癌潛能,可使小鼠出現白血病、淋巴瘤[7]。CK2還通過多條途徑參與著細胞凋亡,作用于細胞質和細胞核的靶點,如半胱天冬酶-2(cysteinyl aspartate specific proteinase-2,Caspase-2)、核纖層蛋白A(nuclear lamina protein A,Lamin A)、凋亡抑制蛋白(inhibitor of apoptosis proteins,IAPs)等:①Caspase-2是CK2的靶點,被CK2作用后,可發生脫磷酸二聚作用后活化,使Bcl-2相關X蛋白(Bcl-2 Associated X Protein,BAX)轉移到線粒體,釋放出凋亡蛋白;②Lamin A的分裂程度常可用來指示核凋亡的活性,Lamin A與CK2之間的表達呈負相關,CK2表達下調時Lamin A分裂增強,CK2過度表達時Lamin A分裂被抑制;③IAPs能保護特定細胞抵抗凋亡,是一種抗凋亡基因表達產物,IAPs與CK2之間呈正相關的表達,當CK2被化學抑制劑抑制時,可導致IAPs水平降低,進而影響細胞凋亡[8]。
序列41-46、91-96、145-150位為N-豆蔻酰化位點。N-豆蔻酰化為豆蔻酰CoA與蛋白質N端甘氨酸殘基成酰胺鍵,為不可逆的蛋白質脂酰基修飾方式。它在膜定位中起重要作用,豆蔻酰化殘基穿梭于膜之間,可結合到疏水核心,能穩定蛋白質結構。插入質膜內脂層的豆蔻酰化殘基可使膜容易相互作用,把細胞質內接受到的信號,通過核孔傳遞到核內。當豆蔻酰轉移酶(N-Myristoyltransferase,NMT)活性過高,可導致蛋白質畸形豆蔻酰化,引起信號轉導紊亂,導致腫瘤發生。據報道,Magnuson等發現早期結腸癌的細胞NMT活性異常增高。
2.6 泛素化位點預測
蛋白質泛素化是蛋白質翻譯后的修飾模式,與細胞內蛋白質降解和細胞活動密切相關。預測蛋白質泛素化已有多種在線程序,如BDM-PUB、UbPred、CKSAAP_UbSite等。利用這些方法預測Pim-2蛋白的泛素化修飾,綜合分析可見Pim-2蛋白上分布著5處泛素化得分較高位點,但第4和23位得分分別為0.114 845、0.120 762,超過閾值,可確定為泛素化位點,如圖 5所示。泛素化是靶蛋白

上的特定賴氨酸殘基與泛素分子共價結合,所形成肽鍵能促進蛋白質降解,該過程保守并可逆[9]。研究發現,細胞必須保持蛋白質的產生、降解動態平衡,才能使細胞功能正常,結構穩定。泛素與蛋白酶構成泛素-蛋白酶途徑(ubiquitin-proteasome pathway,UPP)可選擇性高效降解細胞內蛋白質,如癌基因、抑癌基因產物和短壽命細胞周期調節蛋白和變性變結蛋白等。當UPP系統對靶蛋白降解的部位、時間、速率出現功能失常,可引起抑癌蛋白異常降解、癌蛋白聚集、突變細胞凋亡受阻增殖加速,引起癌變。研究發現,其致癌機制有多種途徑:①UPP系統調控著細胞周期依賴性蛋白激酶(cyclin-dependent protein kinases,CDKs)和細胞周期素(Cyclins),這二者控制著細胞周期轉換,當泛素降解缺陷,導致Cyclins增高,一些惡性腫瘤的Cyclins表達異常增高。②UPP系統調控著細胞凋亡:B淋巴細胞瘤-2基因(B-cell lymphoma-2,Bcl-2)家族能促進具有凋亡作用的Bax表達,Bax進入線粒體后可活化半胱氨酸天冬氨酸蛋白酶-9(cysteinyl aspartate specific proteinase-9,Caspase-9),促進凋亡。隨著前列腺癌的格利森評分(Gleason)增高,UPP對Bax蛋白的泛素化降解也明顯增強。③UPP系統參與著一些關鍵蛋白和信號傳導途徑的調節:NF-κB、β-鏈蛋白(β-catenin)、抑癌基因p53(tumor suppressor p53)、表皮生長因子受體(epidermal growth factor receptor,EGFR)、第10號染色體缺失的磷酸酶和張力蛋白同源物基因(phosphatase and tensin hmmlogydeleted on ten,PTEN)[10]。
2.7 糖基化位點預測
蛋白糖基化是真核生物蛋白質翻譯后的一種修飾,糖基轉移酶將活化的單糖加到肽鏈上,而形成具有獨特生物活性的糖蛋白[11]。使用在線生物信息學程序DictyOGlyc 1.1 Server分析Pim-2蛋白的糖基化結構,預測結果顯示蛋白序列上存在4處糖基化位點,分別在15、17、140、272位。其分布如圖 6如示。糖基化修飾是一種最普遍的蛋白質修飾,約50%的蛋白質經過糖基化修飾。蛋白質糖基化可調節受體與配體的作用,影響免疫分子的結構功能,控制蛋白質在細胞器之間的穿梭以及在細胞膜上的翻轉[12],進而影響影響免疫分子的折疊、成熟、包裝、投送、定位和穩定,以及影響T細胞功能、體液免疫的功能和免疫應答的強弱等。

2.8 其它蛋白質修飾預測
使用在線服務器biocuckoo的工具包,分析Pim-2蛋白的其它蛋白質修飾,包括小泛素相關修飾物(small ubiquitin-related modifier,SUMO)化、亞硝基化和棕櫚酰化。使用程序SUMOsp 2.0.4,分析預測Pim-2蛋白SUMO化。該法是基于PSFS法,即連續前向特性選擇法[13]。結果顯示在蛋白序列的第165位,預測分值為2.886,存在SUMO化修飾序列RDIKDEN。SUMO修飾是一種依賴ATP的小蛋白共價修飾,能結合于組蛋白的賴氨酸殘基。蛋白質經SUMO化修飾后更加穩定,并對其修飾底物具有廣泛功能,如能調節蛋白質定位,調節蛋白質轉錄活性,調節細胞周期,拮泛素化作用,并能影響到蛋白的穩定性、核質轉運、酶活性、蛋白之間、DNA-蛋白之間的相互作用等。蛋白質經SUMO化修飾后與腫瘤的發生發展關系密切,但致癌機制復雜,與P53、崗哨蛋白特異蛋白酶(sentrin-specificprotease,SENP)、瘦蛋白(Reptin蛋白)、腫瘤轉移抑制基因1(kangai1, KAI1)、低氧誘導因子1(Hypoxia-inducible factor-1,HIF-1)、ETS轉錄因子家族(E-twenty six,Ets)等異常表達相關,一些致癌因素的機制已探明,一些尚在探索之中。如:①SUMO可激活P53轉錄活性,易化P53介導的細胞衰老,當SUMO化修飾減少,可降低P53的抑癌功能,導致癌癥發生[14]。②SUMO化與去SUMO化處于動態平衡之中,位于細胞核內的SENP能逆轉SUMO修飾,當SENP表達異常增高使SUMO化與去SUMO化的平衡被破壞,將導致調節功能發生異常。曾有文獻報道大量前列腺癌患者SENP表達異常增高[15]。
使用程序GPS-YNO2 1.0分析預測Pim-2蛋白的亞硝基化位點,結果顯示在Pim-2蛋白序列的80位,預測分值是23.022,存在亞硝基化序列PLSDSVTCPLEVALL。蛋白質亞硝基化是一氧化氮(nitric oxide,NO)氧化修飾半胱氨酸巰基(-SH)生成高分子量的亞硝基化蛋白質(protein S-nitrosylation,PSNO)和低分子量的亞硝基硫醇(s-nitrosothiols, RSNO)。蛋白硝基化改變了蛋白質的結構和功能,調節著很多生理、病理功能,如調控細胞信號轉導,調控離子通道,調節膜受體功能,影響激酶活性,影響轉錄因子DNA結合活性,還參與細胞凋亡和炎癥反應[16]。
使用生物信息學軟件CSS-Palm 3.0,分析預測Pim-2蛋白質棕櫚酰化結構,結果顯示蛋白質序列在260位(AHVSPDCCALIRRCL)和266位(CCALIRRCLAPKPSS)預測分值為1.628、0.75,說明存在兩段棕櫚酰化序列。蛋白質棕櫚酰化是蛋白質翻譯后的一種脂質共價修飾,賦予蛋白質復雜的生理功能,如調節蛋白質活性、穩定性,參與調節多種細胞信號通路,介導蛋白質之間和蛋白質-脂質相互作用[17]。
2.9 抗原性指數分析
常用于預測蛋白質抗原性的軟件有DNAMAN V6,使用軟件DNAMAN V6分析Pim-2蛋白序列,結果顯示蛋白序列存在16段抗原指數較高區域,如表 2所示。Pim-2蛋白序列的這些區段抗原指數值高,氨基酸殘基親水性強,二級結構易于形成轉角和不規則卷曲,符合B細胞表位要求,說明該區段含潛在優勢抗原表位,構成蛋白質表位的可能性較大[18]。

2.10 Pim-2蛋白空間結構模建
蛋白的功能發揮是與其空間結構和活性結構域密切相關,空間結構的不同很大程度上導致了其生物學功能多樣性,將Pim-2蛋白序列提交通過專業網expasy的在線程序Swiss-Model同源模建Pim-2蛋白的空間構型。用Discovery Studio模建Pim-2蛋白的受體活性中心,受體活性中心呈球狀結構,如圖 7所示。受體活性中心是蛋白質結構和功能的重要組成部分,可按照能量互補、空間幾何互補以及化學環境互補的原則,與相對應的配體互補結合,從而發揮相應的功能。Pim-2蛋白活性中心具體的生理作用、致癌機制尚未完全明確,與抗癌藥物進行分子對接的研究工作也正在進行之中。

3 總結
pim-2是于1984年在染色體Xp11.23中被首次發現,后來發現在腦和淋巴樣細胞廣泛表達,具有絲氨酸/蘇氨酸激酶活性的有效存活因子。在特定條件下,表現出原癌基因的作用,參與細胞抗凋亡作用及其信號轉導,與多種腫瘤的發生發展密切相關。國內外學者對其展開了深入研究,取得一系列發現,pim-2具有抗凋亡特性,與B淋巴細胞瘤-xL(B-cell lymphoma-extra large,Bcl-xL)和蛋白激酶B(protein kinase B, PKB)類似,具有維持細胞大小的功能,在糖酵解時可維持線粒體膜蛋白完整,防止萎縮,在缺乏生長因子的狀態下能夠維持細胞的生存和合成代謝。pim-2抗凋亡受很多因素調節,如飽和性的影響,以及受白細胞介素3、4、6(interleukin-3, 4, 6, IL-3, 4, 6,)和γ干擾素等的影響。以色列希伯來大學的研究者發現,pim-2基因可轉錄出34、38和41 kDa的三種蛋白,三者N端不同但具有相同的活性中心,催化位點相同,其中34 kDa蛋白活性最強。Pim-2蛋白具有激酶作用,能使p21蛋白、促凋亡蛋白(Bcl-xl/Bcl-2-Associated Death promoter, BAD)發生磷酸化改變活性,抑制細胞凋亡。當凋亡和增生平衡被打破,可導致腫瘤發生。例如,研究發現非霍奇金淋巴瘤、淋巴細胞性白血病、急性骨髓性白血病等惡性腫瘤患者體內,pim-2水平表達異常增高。
pim-2是重要的原癌基因,它的結構和生物學功能、轉錄蛋白和激酶底物都是研究熱點,并逐漸成為抗癌藥物的新靶點。Pim-2激酶抑制劑是腫瘤治療藥物的研究方向。大多數研究分析了其在信號轉導過程中的作用、致癌機制以及抗癌治療設想,但未對pim-2的各特性做全面梳理歸納,故本研究用生物信息學的方法對pim-2從基因到蛋白層面都進行全面的分析和系統的總結。分析出pim-2基因分布的外顯子,明確了啟動子區,發現啟動子區存在CpG島,含有miRNAs基因互補片段。研究還分析了Pim-2蛋白的理化性質,發現蛋白序列上存在CK2、TYR、myristyl等多種蛋白共價修飾位點,以及泛素化位點、糖基化位點、SUMO化、亞硝基化和棕櫚酰化修飾位點。預測出抗原指數,模建了空間結構。這些分析結果當中,CpG島、miRNAs基因互補片段、CK2 phospho Site、泛素化位點、SUMO化等與致癌關系密切,并對各致癌機制做了分析歸納整理。外顯子、理化性質、糖基化、亞硝基化、棕櫚酰化、抗原指數、空間結構等,雖然不具備直接的致癌作用,但也是pim-2重要構成部分,會直接、間接地發揮著相應作用。通過這些基礎性的研究工作,構建起pim-2的知識體系,可為進一步研究pim-2在各類腫瘤的發病機制、臨床治療和轉歸、預后,提供一定科學依據和必要的理論幫助。