不知道大伙们听说没,百度他……登上 Nature 了。
就在几天前,《 Nature 》正刊发表了一篇名叫《 Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity 》的论文,论文里提出 mRNA 序列优化 AI 算法—— LinearDesign 。
说实话,第一时间看到这么多复杂的术语,再加上平常被“突破性成果们”给整得麻木了,差点就让这选题溜过去了。
(相关资料图)
但在我连夜肝完了论文,并咨询了百度的老哥后,只想说:你厉害,我给你大拇哥。
因为凭借这篇论文,百度不仅成为了首个以第一完成单位的身份,正式登上《 Nature 》的中国科技公司,而且 Nature 的专家组们考虑“论文对新冠病毒的研究可能有重大突破”,还给了它顶级论文的待遇,直接就进 VIP 通道了。(被获准成为 Accelerated Article Preview 加速发表论文。)
这让日常担任“百度小黑子”的网友们直呼:这怎么喷啊?
不过,话又说回来了,这样一个优化 mRNA 序列的 AI 算法,怎么就为全人类做出重大贡献了呢?
一切都还得从 mRNA 的最新发展说起。
在这次猝不及防的新冠疫情中, mRNA 可谓是临危受命,大显身手。
由于量产迅速、使用安全等特点, mRNA 疫苗被公认为是遏制 COVID-19 这种突发性病毒的可行工具之一。
但在为全球抗疫立下汗马功劳的同时, mRNA 疫苗却因为受限于 mRNA 分子本身的稳定性问题,饱受非议。
简单来说,新冠的mRNA疫苗在体外、体内都呆不长。
这就意味着,不仅运输过程中需要超低温冷链技术,防止疫苗报废;而且打完针之后也不敢保证长时间有效,为了安全,一年得打好几次。
本来研发、运输成本就高,对人体的保护时间还短,这样的综合成本对于很多国家来说,显然不好接受。
不过一个新技术,出问题是正常的。那我们把 mRNA 优化一下,行不行呢?
答案是,非常困难。
mRNA疫苗优化问题的最大问题其实是:算不过来。
mRNA 这个东西非常特别。它是由碱基组成的,但是其中的有些碱基,叫做同义密码子。
简单来说,这些碱基发生变化,并不影响 mRNA 的功能。
所以一个 mRNA ,会有无数个兄弟姐妹,甲乙丙丁。
虽然功能一样,但因为同义密码子的差异,它们的“体质”也大不相同。
这一大家子中,就只有那么几个mRNA不容易分解,是制作疫苗的“好苗子”。
就拿新冠病毒刺状蛋白的mRNA 疫苗来说吧。
为了找到这些疫苗中的“尖子生”,科学家们可能得找 10832次,才能找到稳定性最好的新冠 mRNA 疫苗。
这种计算量,即使从宇宙诞生开始,每秒计算一个序列,到现在 138 亿年了,可能还没解决亿万分之一。
为了解决这个问题,不少机构都做出了努力。比如斯坦福大学就搭建了一个疫苗设计竞赛平台,让人类设计者以参与游戏的方式设计稳定的 mRNA 序列。
德国科隆大学的研究人员也曾提出过一种对 mRNA 进行双重化学修饰的策略。
可惜,效果都不是十分显著。(相对这一次的成果而言)
但这一回,百度的科学家们脱颖而出,从简便算法和高效工具这两个点上,解决了这个超级难题。
在这多年的研究中,百度的科学家们发现了一个很神奇的现象,“寻找 mRNA 最优序列”的过程其实和“语音转文字”很相近——两者都是在排列组合。
找到最佳的 mRNA 序列,其实是 mRNA 中 4 种碱基的排列组合问题。
而语音转文字,是拼音和对应读音的文字一一配对的过程。
比如说, wo ai ni ,的每个拼音会对应不同的多音字。
wo 可以是:沃、我、窝……由此产生了窝矮腻、沃埃腻、我爱你等一系列的排列组合。
这就我们需要通过语法、逻辑等去判断生成的文字准不准确;而 mRNA 的序列也有一些语法规则——就像某些特定的序列组合会具备什么样的功能一样。
所以语音转文字的技术和 mRNA 寻找最佳序列的技术本质上是共通的。
巧了么, AI 已经把语音转文字做得很好了,那么经过适配,自然也能无缝衔接到 mRNA 的计算中。
这也使得,科学家们可以将语音转文字领域常用的“动态规划算法”,用在 mRNA 的研究过程中以计算效率。
结果就是,好的计算工具—— AI ,加上高效的计算方法——动态规划算法,双管齐下之后,计算新冠疫苗最优 mRNA 序列的时间直接从无穷大缩短到最少 11 分钟。
这么一来,工作量大大减少,即使个人的电脑都可以运行。简直是苦逼生物研究员的福音。
而且,百度这次能登上顶刊,顺便蹭上了加急通道的根源还在于,它是一个能立竿见影帮助我们研发新冠疫苗的成果。
和之前的各种停留在实验室的成果不同,百度的这篇论文,不是一个概念上的突破,而是短时间内就能落地的成果。
并且,它不止能针对新冠,对于其他的 mRNA 疫苗的研发,也有很大帮助。
至于效果么,已经在新冠疫苗的研制中得到印证了。
在新冠 mRNA 疫苗的对照实验中,对比市场上的新冠 mRNA 疫苗, LinearDesign 设计的疫苗序列的稳定性(存在的时间)最多提升 5 倍,蛋白质表达水平(在 48 小时内)最多提升 3 倍,抗体反应最多提升 128 倍。
前段时间,百度更是和全球四大疫苗巨头之一的赛诺菲签订协议,将 LinearDesign 用于优化 mRNA 疫苗的设计研发。
而且根据百度专家的说法,这算法在普通的传染性疫苗研制,甚至是癌症相关药物的研发中,也能起到一定的作用。
加速研发过程、降低成本,可以说对整个药物研发圈儿,都是很有意义的一件事儿。
当然更重要的是,除了疫苗领域之外,这篇论文还让人看到了一种趋势,那就是:AI 和多学科的结合,正在大大拓展科学的边界。
无论是用 AI 发现超级抗生素 Halicin ,还是用 AlphaFold 预测蛋白质结构,或者是这次百度的 LinearDesign 。
都像这次论文的主要作者张鹤所说的那样:一座意想不到的桥梁,将两个乍一看没有明显相似之处的研究领域联系起来。
那些科技圈儿的难题、目前无法到达的禁地,在未来可能也会一一用类似的方式被解决,被一座座桥梁所打通。
所以建议是继续吃瓜等着吧,因为类似的“爆炸性成果”在不久未来,可能会像家常便饭那样,越来越多。
相关稿件
最近更新
• 每日热议!新冠疫苗加强128倍!百度这次干得漂亮 没得喷
• 利物浦下赛季主场球衣售价:球迷版全套1140RMB 球员版1730RMB
• 泛海控股获部分董监高增持 拟增持金额不低于3000万 全球今日报
• prada
• 天天新资讯:数字政通:5月4日公司高管王东减持公司股份合计24万股
• 本川智能:5月4日公司高管周国雄、江东城减持公司股份合计2.5万股
• 鹏辉能源:锂价下跌刺激大储(包括工商业储能)装机需求,公司正继续大力开拓大储业务包括海外大储业务-世界快播
• 焦点信息:美的空调ed故障代码什么意思(美的空调故障代码e6)
• 21年冬季动漫平均分排名,《咒术回战》仅排第三,第一毫无悬念
• 佳力图:4月28日公司高管李林达、叶莉莉、王凌云减持公司股份合计13.39万股
• 焦点播报:美好置业:公司管理层在2023年度将全力提升持续经营能力,切实维护公司和广大投资者利益
• 得润电子:公司OBC产品目前基本为定制产品,需要与厂家一起研发适配 世界时快讯
• 王府井: 通州文旅区配套商业综合体项目目前正在建设中|动态焦点
• 快看点丨三江购物: 公司会在定期报告中披露对应时点的股东人数
• 百合股份:5月4日公司高管郑志海减持公司股份合计6.68万股-全球要闻
• 每日热闻!映翰通:4月28日至5月4日戴义波、张立殷减持公司股份合计1.5万股