【新聞事件】:昨天兩年一度的預測蛋白結構CASP大賽揭曉,結果谷歌旗下Deepmind的AlphaFold2以較大優(yōu)勢冠軍。這個(gè)AI從氨基酸序列準確預測了約100個(gè)蛋白的三維結構,平均GDT(大概測量與實(shí)驗結構的平均偏差)分值92.4、幾乎達到實(shí)驗水平。這個(gè)結果引起各界一片驚嘆,《自然》雜志說(shuō)這將改變一切、有人甚至聲稱(chēng)蛋白折疊問(wèn)題已經(jīng)不再是問(wèn)題。這一方面是大家對AI工夫如此了得的驚訝、另一方面似乎也期待新藥發(fā)現將變得容易很多。
【藥源解析】:這個(gè)結果無(wú)疑是個(gè)巨大成就。蛋白本是一個(gè)長(cháng)鏈氨基酸聚合物,可能構象數目巨大。據估計一個(gè)普通蛋白的構象數目在10的300次方,而且很多構象能量非常接近、所以預測天然結構如大海撈針。很多天然蛋白可在極短時(shí)間內折疊成極少數具有高選擇性、高活性的三維結構,如同一根鐵絲眨眼間自己折成一個(gè)大熊貓。獲得三維結構可以通過(guò)實(shí)驗如X光、冷電鏡、核磁等實(shí)驗手段,也可以同源蛋白做模板預測。這個(gè)AlphaFold利用機器學(xué)習技術(shù)擺脫了上面這些技術(shù)限制,而且準確度驚人。這顯然對新藥發(fā)現可能有一定幫助。
但是這并一定能轉化成新藥產(chǎn)出的大幅增加。一是對于復雜蛋白復合物現在A(yíng)I還預測能力有限,而這些蛋白-蛋白、核酸-蛋白復合物如表觀(guān)遺傳蛋白、DNA解旋酶等正在成為制藥業(yè)關(guān)注的新興靶點(diǎn)家族。二是雖然蛋白結構很重要但蛋白因為上面提到存在多個(gè)能量類(lèi)似構象也很容易變形,尤其是與小分子配體結合后,所謂誘導契合是個(gè)很老的現象。所以如果沒(méi)有與先導物的共晶結構藥物設計還是會(huì )受到限制。很多做CADD的朋友認為docking等計算技術(shù)可以根據蛋白結構預測小分子配體結合強度,我不否認有成功案例、但當代最重要的有機化學(xué)家George Whitesides最近還說(shuō)總體上docking仍是一個(gè)懸而未決的技術(shù)難題。三是蛋白結構只能提供更可靠思路,但把設計變成化合物還受合成技術(shù)的限制、也與結合腔的內在結構有關(guān)。分子間相互作用是有極限的(0.3 kcal/mol/重原子),如果沒(méi)有足夠的接觸面積是無(wú)法達到藥物水平的結合力的。
找到高活性小分子配體也只是新藥發(fā)現的一小部分,選擇性、過(guò)膜性、穩定性等成藥性質(zhì)也需要優(yōu)化。雖然活性配體越多選擇也越多,但如何評價(jià)這些性質(zhì)并不是精準科學(xué)。除了化學(xué)問(wèn)題還有更難的生物問(wèn)題,這個(gè)靶點(diǎn)是否在治療疾病有用幾乎是無(wú)法在三期臨床前可靠預測的,這也是為什么臨床試驗失敗率多年高居不下的原因。蛋白結構在很多藥靶并非限制因素,一些有實(shí)驗晶體結構的靶點(diǎn)如Kras還是找不到高效配體。當然能加快可成藥靶點(diǎn)配體的發(fā)現速度也是一個(gè)重要貢獻,但說(shuō)能改變一切有點(diǎn)過(guò)于樂(lè )觀(guān)。當年RBW合成奎寧后也令很多人樂(lè )觀(guān)地預測人類(lèi)將不再依賴(lài)自然界獲取藥物,但現在合成技術(shù)與RBW時(shí)代不可同日而語(yǔ)但還是不能產(chǎn)業(yè)化全合成紫杉醇。AI如此高效也引起有些人擔心會(huì )取代科學(xué)家的工作,當然有些工作會(huì )被AI代替、但AI進(jìn)步的凈結果基本是會(huì )擴展人類(lèi)技術(shù)的可及范圍,而不僅僅是把科學(xué)家踢出現在的小圈子。
美中藥源原創(chuàng )文章,轉載注明出處并添加超鏈接,商業(yè)用途需經(jīng)書(shū)面授權。★ 請關(guān)注《美中藥源》微信公眾號 ★
要發(fā)表評論,您必須先登錄。