单细胞蛋白质生物学的情境人工智能模型

【字体: 时间:2024年08月27日 来源:AAAS

编辑推荐:

  与目前的人工智能模型相比,这种新方法取得了显著进步,它捕捉到了蛋白质在细胞和组织环境中的作用,而不是孤立的。该模型阐明了周围细胞和组织如何影响维持健康和助长疾病的蛋白质行为。该工具可以帮助研究人员确定一系列条件下的药物靶标。

濠电姷鏁搁崑鐐哄垂閸洖绠插ù锝呭濞存牠鏌曟繛褍妫楀皬闂備焦鏋奸弲娑㈠疮娴兼潙鐓樼€广儱顦伴悡鏇㈡煙娴煎瓨娑ф鐐瘁缚缁辨帡鎮╅崫鍕優缂備浇椴哥敮妤€顕ラ崟顓涘亾閿濆簼绨藉ù鐘虫綑椤啴濡堕崱妤冾儌闂佸摜濮甸悧鐘荤嵁閸℃稑绀冩い鏃囧亹椤︽澘顪冮妶鍛婵☆偅鐩畷鎰版倷閻戞ǚ鎷洪梺闈╁瘜閸欌偓婵$偓鎮傞弻娑樷枎韫囨洜顔婂┑鈥冲级閸旀洟鍩為幋鐘亾閿濆骸浜滃ù鐘虫そ濮婅櫣绱掑Ο鑽ゅ弳闂佸湱鈷堥崑濠囧春濞戙垹鍐€妞ゆ挾鍟块幏鍝勵渻閵堝棗濮х紒韫矙瀹曨偄煤椤忓懐鍘遍梺鎸庣箓鐎氼剙鐣甸崱妯诲弿濠电姴鍊归崑銉р偓瑙勬礋娴滆泛顕i幘顔藉亹闁告瑥顦伴悵锕傛⒒娴e憡鎯堟い锔诲亰瀵彃饪伴崼鐔蜂画閻熸粍妫冮獮鍡樼瑹閳ь剟鐛幒鎳虫棃鍩€椤掆偓铻炴慨妞诲亾闁哄本鐩俊鐑藉閳╁啰褰囬柣鐔哥矋濠㈡ê岣块敓鐘茶摕闁靛ǹ鍎Σ鍫熶繆椤栨氨浠㈡い蹇e幖椤啴濡堕崒娑欐闂佹悶鍎洪悡鍫濐潖閸ф鈷戦梺顐ゅ仜閼活垱鏅堕幘顔界厵鐎规洖娲ら弸鎴炵箾閻撳海绠诲┑鈩冩倐閺佸倿鏌ㄩ姘濡炪倖娲嶉崑鎾绘煛鐏炲墽鈽夐摶锝夋煟閹惧啿顒㈤柣搴ㄧ畺濮婃椽宕崟闈涘壈闂佸摜鍠愰幐鍐差嚕椤愩埄鍚嬮柛娑卞灡濞堟洟姊洪崨濠傚闁稿骸鍟块埢鎾诲蓟閵夛腹鎷虹紓鍌欑劍閿氬┑顔碱樀閺岀喖鎼归锝呯3閻庤娲滈弫濠氥€佸璺虹劦妞ゆ帒瀚弸浣衡偓骞垮劚椤︿即寮查幖浣圭叆闁绘洖鍊圭€氾拷闂傚倷娴囧畷鍨叏閹惰姤鈷旂€广儱顦崹鍌炴煢濡尨绱氶柨婵嗩槸缁€鍕叏濠垫挾顔嘓ot缂傚倸鍊搁崐宄邦渻閹烘梻鐭氶柛顐f礀閸ㄥ倻鐥鐐村櫡濞存粌缍婇弻娑㈠Ψ椤旂厧顫╅梺绋胯閸旀垿寮婚敐澶婃闁圭ǹ楠搁弳鍫ユ⒑鐠囨彃鍤遍柟鍑ゆ嫹
  

陆地上的鱼仍然摆动鳍,但当鱼在水中时,结果明显不同。这个比喻出自著名的计算机科学家艾伦·凯(Alan Kay)之口,用来说明背景在阐明正在调查的问题时的力量。

在人工智能(AI)领域,一个名为PINNACLE的工具体现了Kay的洞察力,当涉及到理解蛋白质在适当环境下的行为时,这些蛋白质在其中起作用并与之相互作用的组织和细胞决定了。值得注意的是,PINNACLE克服了当前人工智能模型的一些局限性,这些模型倾向于分析蛋白质的功能和故障,但它们是在孤立的情况下进行的,一次只能分析一种细胞和组织类型。

在《自然方法》杂志上描述的这种新的人工智能模型的开发是由哈佛医学院的研究人员领导的。

“自然界是相互联系的,PINNACLE有助于识别这些联系,我们可以利用这些联系获得关于蛋白质和更安全、更有效的药物的更详细的知识,”该研究的资深作者、HMS Blavatnik研究所生物医学信息学助理教授Marinka Zitnik说。“它克服了当前无上下文模型的局限性,并为加强蛋白质相互作用分析提出了未来的方向。”

研究人员指出,这一进展可以推动目前对蛋白质在健康和疾病中的作用的理解,并为设计更精确、更有针对性的治疗方法提供新的药物靶点。

世界各地的科学家都可以免费使用PINNACLE。

向前迈出的一大步

解开蛋白质之间的相互作用及其相邻生物邻居的影响是棘手的。目前的分析工具通过提供有关单个蛋白质的结构特性和形状的信息,起到了至关重要的作用。然而,这些工具并不是为了解决整个蛋白质环境的上下文细微差别而设计的。相反,它们产生的蛋白质表征与上下文无关,这意味着它们缺乏细胞类型和组织类型的上下文信息。

然而,蛋白质在不同的细胞和组织环境中扮演不同的角色,也取决于相同的组织或细胞是健康的还是患病的。单蛋白表示模型不能识别在多种情况下变化的蛋白质功能。

当涉及到蛋白质的行为时,它是位置,位置,位置

蛋白质由20种不同的氨基酸组成,构成细胞和组织的基本组成部分,是维持生命的一系列生物功能所不可或缺的——从输送全身氧气到收缩呼吸和行走的肌肉,再到促进消化和抵抗感染,等等。

科学家估计,人体中蛋白质的数量在2万到数十万之间。

蛋白质相互作用,但也与其他分子,如DNA和RNA。蛋白质之间和蛋白质之间复杂的相互作用创造了复杂的蛋白质相互作用网络。这些网络位于其他细胞内或细胞之间,与其他蛋白质和蛋白质网络进行许多复杂的交叉对话。

PINNACLE的优势源于其识别蛋白质行为可因细胞和组织类型而异的能力。同一种蛋白质在健康的肺细胞中可能具有与在健康的肾细胞或患病的结肠细胞中不同的功能。

婵犲痉鏉库偓妤佹叏閻戣棄纾绘繛鎴欏灪閸婅埖绻濋棃娑卞剰缂佺姷鍠栭弻銊╂偆閸屾稑顏� 欢迎进入10X学习中心,新手指南让您信心满满地开展单细胞RNA-seq

PINNACLE揭示了这些细胞和组织如何以不同的方式影响相同的蛋白质,这是目前模型无法做到的。根据蛋白质网络所在的特定细胞类型,PINNACLE可以确定哪些蛋白质参与某些对话,哪些蛋白质保持沉默。这有助于PINNACLE更好地解码蛋白质串扰和行为类型,并最终使其能够预测导致疾病的功能失调蛋白质的窄定制药物靶标。

研究人员指出,PINNACLE并没有排除单一表征模型,而是补充了单一表征模型,因为它可以分析不同细胞环境下的蛋白质相互作用。

因此,PINNACLE可以使研究人员更好地了解和预测蛋白质的功能,并有助于阐明重要的细胞过程和疾病机制。

这种能力可以帮助精确定位“可药物”蛋白质,作为个体药物的靶标,并预测各种药物对不同细胞类型的影响。出于这个原因,PINNACLE可以成为科学家和药物开发人员更有效地瞄准潜在目标的宝贵工具。

兹特尼克说,这种药物发现过程的优化是非常必要的,他也是哈佛大学肯普纳自然与人工智能研究所的副教员。

将一种新药推向市场可能需要10到15年的时间,耗资高达10亿美元,而且从发现到药物的道路是出了名的坎坷,最终结果往往是不可预测的。事实上,近90%的候选药物没有成为药物。

PINNACLE的建设和培训

利用来自综合多器官图谱的人类细胞数据,结合蛋白质相互作用、细胞类型与细胞类型相互作用和组织的多个网络,研究人员训练PINNACLE生成包含156种细胞类型和62种组织和器官的全景图形蛋白质表示。

迄今为止,PINNACLE已经生成了近395,000个多维表示,而在当前的单蛋白质模型下,大约有22,000个可能的表示。它的156种细胞类型中的每一种都包含大约2500种蛋白质的上下文丰富的蛋白质相互作用网络。

目前的细胞类型、组织和器官数量并不是该模型的上限。迄今为止所评估的细胞类型都来自活体供体,覆盖了人体的大部分细胞类型,但不是全部。此外,许多细胞类型尚未被确定,而其他细胞类型则很罕见或难以探测,例如大脑中的神经元。

为了使PINNACLE的细胞库多样化,Zitnik计划利用一个数据平台,其中包括从整个人体取样的数千万个细胞。

濠电姷鏁搁崑鐐哄垂閸洖绠伴柟闂寸贰閺佸嫰鏌涢锝囪穿鐟滅増甯掗悙濠囨煃鐟欏嫬鍔ゅù婊堢畺閺岋綁鎮㈤悡搴濆枈濠碘剝褰冨﹢閬嶅焵椤掑喚娼愰柟绋挎憸閳ь剚绋堥弲婵嬪焵椤掑嫭娑ч柕鍫熸倐瀵偊宕掗悙鏉戔偓閿嬨亜閹哄秶鍔嶉柣锕€閰e铏规嫚閹绘帩鍔夌紓浣割儐鐢€崇暦濠靛绠虫俊銈傚亾缂佲偓婢舵劖鐓熼柡鍐ㄥ€哥敮鑸垫交濠靛洨绡€闁汇垽娼у瓭濠电偠灏欐繛鈧€规洘鍨块獮姗€骞囨担鐟板厞闁诲氦顫夊ú鏍洪妸鈺傚仼闁惧繐婀辩壕浠嬫煕鐏炲墽鎳呮い锔奸檮娣囧﹪顢曢敐鍥╃厜閻庤娲樺ú鐔笺€侀弮鍫濆窛妞ゆ牭绲剧粊顐︽⒒娴g懓顕滅紒璇插€块幃褔骞樺鍕枔閳ь剨缍嗛崰妤呮偂濞嗘劗绠鹃柤濂割杺閸ゆ瑦顨ラ悙杈捐€块柡灞炬礋瀹曞爼濡搁妷銉︽嚈闁诲孩顔栭崳顕€宕滈悢鑲╁祦鐎广儱顦介弫濠囨煟閿濆懏婀版繛鍫熸倐濮婄粯鎷呴挊澶夋睏闂佺儵鍓濆Λ鍐ㄧ暦瑜版帗鎯炴い鎰剁稻閻濈兘姊虹粔鍡楀濞堟洘銇勯妷銉уⅵ闁哄本鐩獮姗€鎳犻澶嬓滃┑鐐差嚟婵參宕归崼鏇炶摕闁哄洢鍨归獮銏′繆閵堝拑宸ラ柛鎾讳憾閺岋綁濮€閳轰胶浠繝銏㈡嚀濡宓勯梺鍦濠㈡﹢锝為崨瀛樼厽婵炲棗鑻禍鎯р攽閻愯尙婀撮柛濠冩礋濠€渚€姊洪幐搴g畵婵☆偅鐟х划鍫⑩偓锝庡枟閻撳啰鎲稿⿰鍫濈婵﹩鍘鹃埞宥夋煣韫囨凹娼愮€规洘鐓¢弻娑㈠箛閵婏附鐝栧銈傛櫇閸忔﹢寮婚妸銉㈡斀闁糕剝鐟ラ埅闈涒攽閳藉棗鐏犳い鎴濐樀瀵鈽夐姀鐘殿唺闂佺懓顕崕鎰涢敓鐘斥拺閻犲洤寮堕崬澶娾攽椤斿搫鈧鍒掑鑸电劶鐎广儱鎳愰ˇ銊ヮ渻閵堝棙灏靛┑顔惧厴椤㈡瑩骞掑Δ浣叉嫼闁荤姴娲犻埀顒冩珪閻忎線姊洪崨濠冪叆濡ょ姵鎮傞崺銏ゅ箻鐠囪尙顓洪梺鎸庢濡嫬鈻撻妷銉富闁靛牆妫涙晶顒傜磼椤旇偐鐒搁柛鈺傜洴瀵粙顢橀悢鍝勫箞婵犵數鍋涘Λ娆撳礉閺囥垺鍊堕柍鍝勫亞濞堜粙鏌i幇顒€绾ч柛鐘筹耿閺岀喖顢涘姣櫻呪偓娈垮櫘閸o絽鐣烽幒鎳虫梹鎷呯憴鍕絻

10x Genomics闂傚倸鍊风粈渚€骞栭锕€纾归柣鐔煎亰閻斿棙鎱ㄥ璇蹭壕濡ょ姷鍋為悧鐘诲灳閺傝¥鈧帗鍒婇悥鍓坢 HD 闂備浇顕х€涒晠顢欓弽顓炵獥闁圭儤顨呯壕濠氭煙閸撗呭笡闁绘挻娲橀幈銊ノ熼悡搴′粯闂佽绻掓慨鐑藉焵椤掑喚娼愭繛鍙夌矒瀹曚即骞橀懜娈挎綗闂佸湱鍎ら〃鍛寸嵁閵忊剝鍙忔慨妤€妫楁晶顔尖攽椤旂厧鏆f慨濠冩そ瀹曘劍绻濋崒婊呮噯婵犵妲呴崑鍛垝瀹ュ桅闁哄啫鐗嗙粻鐟懊归敐鍥ㄥ殌濞寸姰鍨藉娲箹閻愭彃濮夐梺鍝勬噺缁捇骞冩ィ鍐╃劶鐎广儱妫涢崢閬嶆椤愩垺鎼愭い鎴濇噺閹便劑鍩€椤掆偓閳规垿鎮欑€涙ḿ绋囧┑鈽嗗亝缁挻淇婇悽绋跨疀闁哄鐏濆畵鍡涙⒑缂佹ǘ缂氶柡浣规倐閹剝鎷呴搹鍦紳婵炶揪绲介幉鈥筹耿閻楀牅绻嗛柣鎰煐椤ュ鎽堕悙鐑樼厱鐟滃酣銆冮崨顖滅焼闁糕剝绋掗悡鏇㈡煃閳轰礁鏆堢紓鍌涘哺閺屽秷顧侀柛蹇旂〒閸掓帒鈻庨幘铏€悗骞垮劚椤︿即寮查幖浣圭叆闁绘洖鍊圭€氾拷

婵犵數濮烽弫鎼佸磻濞戞娑欐償閵娿儱鐎梺鍏肩ゴ閺呮粌鐣烽弻銉﹀€甸柨婵嗛娴滅偤鏌嶇紒妯活棃闁诡喗顨婇弫鎰償閳ュ磭顔戠紓鍌欐閼宠泛鈻嶆晶淇皊t闂傚倸鍊风欢姘缚瑜嶈灋婵°倕鎳忛弲婵嬫煥濠靛棙宸濈紒鐘虫煥椤潡鎳滈棃娑橆潓濠碘槅鍋呰摫闁靛洤瀚伴獮妯兼崉鏉炴壆鎹曠紓鍌氬€哥粔宕囨濮樿泛钃熸繛鎴欏灩閸愨偓闂侀潧臎閸愶絾瀚涘┑鐘垫暩閸嬫盯鎮ф繝鍥у偍妞ゃ儳顎怱PR缂傚倸鍊搁崐鐑芥倿閿斿墽鐭欓柟鐑橆殕閸庡孩銇勯弽顐粶闁绘帒鐏氶妵鍕箳閸℃ぞ澹曟俊鐐€х紓姘跺础閹惰棄绠栫憸鏂跨暦椤愶箑唯闁靛牆妫楁刊浼存⒒娓氣偓閳ь剛鍋涢懟顖涙櫠閺夋垟鏀介柍銉﹀墯閸ょ喖鏌嶈閸撱劎绱為崱娑樼婵ǹ娉涘Ч鏌ユ煃閸濆嫭鍣洪柛濠傜仛缁绘盯骞嬮悙鍨櫑婵犳鍠栭崯鎾蓟濞戙垹绫嶉柟鐐綑椤忥拷

闂傚倸鍊风粈渚€骞夐敓鐘偓鍐幢濡炴洖鎼オ浼村川椤撶偟浜伴梻濠庡亜濞诧妇绮欓幒妤€鍚归柛鏇ㄥ灡閻撶喖鏌熼柇锕€澧婚柛銈囧枛閺屾洟宕奸悢绋垮攭濡ょ姷鍋為悧鐘差嚕閸洖绠i柣妯活問閸炲爼姊绘担鍛婂暈闁荤喆鍎辫灋婵犻潧妫ḿ鏍р攽閻樺疇澹橀幆鐔兼⒑闂堟侗妾х紒鑼帶闇夐柣鎴eГ閻撶喖鏌eΟ澶稿惈闁告柨绉堕幉鎼佸级閸喗娈婚梺璇″枔閸庣敻寮幘缁樻櫢闁跨噦鎷� - 婵犵數濮烽弫鎼佸磿閹寸姴绶ら柦妯侯槺閺嗭附銇勯幒鎴濐仼闁活厽顨婇弻娑㈠焺閸愶紕绱板銈傛櫆閻擄繝寮诲☉銏犵労闁告劖鍎冲В鈧梻浣告贡閸庛倝骞愭ィ鍐︹偓鍛存倻閽樺顔愰柡澶婄墕婢х晫绮旈悽鍛婄厱閹兼番鍨归悘銉╂煃閽樺妯€妤犵偞锕㈤、娑橆潩椤愩埄妫滃┑鐘垫暩閸嬬偤宕归崼鏇炵闁冲搫鍊婚々鍙夌節婵犲倸鏆熼柡鍡畵閺岋綁寮崶顭戜哗缂佺偓鍎抽妶鎼佸蓟濞戙垹鐒洪柛鎰靛幖椤ユ繈姊洪崨濠冣拹閻㈩垽绻濋獮鍐ㄎ旈崨顓熷祶濡炪倖鎸鹃崑妯何i幇鐗堚拺缂備焦岣块埊鏇㈡煟閻旀繂娲ょ粻顖炴倵閿濆骸鏋涚紒鐘崇叀閺岀喐瀵肩€涙ɑ閿梺璇″枙缁舵艾顫忓ú顏勫窛濠电姴鍊婚鍌涚節閳封偓閸曞灚鐤侀悗娈垮枟婵炲﹪骞冮姀銈嗗亗閹艰揪缍嗛崬瑙勪繆閻愵亜鈧牠寮婚妸鈺傚€舵繝闈涚墢閻滅粯绻涢幋娆忕仾闁绘挻鐟╅幃褰掑Ω閵夘喗笑闂佺ǹ锕ら…鐑藉箖閻戣棄顫呴柕鍫濇閸樺崬鈹戦悙鍙夘棡闁挎岸鏌h箛瀣姕闁靛洤瀚伴、鏇㈠閳轰礁澹庨柣搴ゎ潐濞叉粍绻涢埀顒傗偓娈垮枙缁瑩銆侀弽顓ф晝闁挎繂鎳忕拠鐐烘倵濞堝灝鏋熼柟顔煎€垮顐﹀箻缂佹ɑ娅㈤梺璺ㄥ櫐閹凤拷

濠电姷鏁搁崑鐐哄垂閸洖绠伴柟闂寸贰閺佸嫰鏌涢锝囪穿鐟滅増甯掗悙濠冦亜閹哄棗浜鹃弶鈺傜箖缁绘繈鎮介棃娴躲垽鎮楀鐓庢珝闁诡垰鏈幆鏃堝Ω閿旀儳骞橀柣搴ゎ潐濞叉牕煤閵堝棛顩锋繝濠傜墛閻撴洟鏌i幇顒傛憼閻忓骏绠撻弻鐔兼寠婢跺ň鍋撴繝姘劦妞ゆ帒锕︾粔鐢告煕閹炬潙鍝烘い銏℃婵¤埖寰勭€n亙鍖栭梻浣筋潐婢瑰寮插☉娆庣箚闁惧繐婀辩壕濂告煏婵炑冨枤閺嗩參姊洪悷鏉挎Щ闁瑰啿閰i妶顏呭閺夋垹顦ㄩ梺闈浤涢埀顒勫磻閹惧绡€婵﹩鍘鹃崢鎼佹煟鎼搭垳绉甸柛瀣閹便劑宕奸妷锔惧幐閻庡厜鍋撻柍褜鍓熷畷鐗堟償閵娿儳鍘洪梺鍝勫暙閻楀棝宕¢幎鑺ョ厽婵☆垱瀵ч悵顏呮叏閿濆懎顏柡宀嬬稻閹棃濮€閳垛晛顫岄梻浣告啞濮婂湱鏁垾宕囨殾婵犻潧顑嗛崑鍕煟閹惧啿顔傞柕澶嗘櫆閻撱儵鏌i弴鐐测偓鍦偓姘炬嫹

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号