查看原文
其他

MIT博士的催化材料征途:用AI4S造一枚化学工业“芯片”|甲子光年

苏霍伊 甲子光年
2024-09-16

追赶化学材料领域的ChatGPT时刻。


作者|苏霍伊


“量子离我们的生活一点都不远。”


“一米是多少距离,一秒是多长时间,而一千克又是多少质量?刚一碰面,深度原理的创始人兼CEO贾皓钧便问了「甲子光年」三个问题。


两千多年前,庄子曾给出答案:一尺之捶,日取其半,万世不竭。与现代物理学中的基本定律不同,庄子和许多古代哲学家都认为物质是连续的,物质可以被无限分割,任何尺度的长度都只是相对和近似的,没有有绝对精确的度量标准,所以“一米”不能用基本物理定律精准定义它长度。


但物质并不是连续的。


“米、千克和秒这样耳熟能详的计量单位,都是用量子力学来标准化的。量子现象更加精准地定义了日常生活中的很多概念。” 深度原理创始人兼CTO段辰儒认为,“量子力学是人类近代最伟大的发现。


数千年来,人们都以太阳定义时间。地球的自转和绕太阳公转的周期稳定性,也由此产生了天、小时、分钟等时间单位。实际上,“一秒”的定义既不是1/60分钟,也不是1/3600小时,现代科学给出了更精确的时间定义:“一秒”是铯-133原子基态的两个超精细能级之间发生9,192,631,770次跃迁的持续时间。


这种定义与地球的自转或公转周期无关,而是基于原子物理的恒定性。


“我们日常工作等精确到分钟就足够了。”贾皓钧说,“然而社会生产、科学研究和国防建设中,需要极其精确的时间测量,精度高达千分之一秒甚至百万分之一秒。对时间极致追求的科学家们在20世纪50年代发明了永久的时间测量标准——铯原子钟。”


铯原子钟,来源:NLP


铯原子钟以原子的运动为基准。当用激光照射铯原子时,铯原子最外层的单个电子会在两个状态之间来回循环,即超精细跃迁,这个速率是恒定的。其精确度在2000万年的时间跨度内,误差仅为一秒钟。


使用铯原子定义的一秒与原来的一秒时长无异,但这种新的定义涉及到铯原子内部电子的量子态变化,正是量子力学研究的核心内容。


“量子力学为我们描述和预测微观粒子的状态及其变化提供了理论框架。这些粒子状态的变化是物质相互转换的基础,深深影响着材料和化学领域。”段辰儒进而表示,“我们的研究就是通过AI for Science(简称AI4S)的方法,结合量子化学和实验解锁新的化学反应,以及发现更高效的催化剂。”


AI4S并不是一个新词。它是使用AI相关的技术和思想来指导科学发现,一个典型的例子是谷歌的DeepMind团队开发的蛋白质折叠模型AlphaFold。无论是科技行业的领头羊如微软、英伟达和字节跳动等,还是化学材料制造的巨头巴斯夫和陶氏、3M等,都在斥巨资布局AI4S领域。


随着AI4S技术朝着规模化和产业化发展,贾皓钧和段辰儒捕捉到了其中的应用潜力——如果在化学领域实现规模化和产业化,就能推动高效且成本低廉的催化材料的研发,还提高能源使用效率和温室气体的转化率。


瞄准时机,两人一拍即合,共同创办深度原理科技公司,专攻化学反应和催化材料。


六月回国后,他们完成了近千万美元的种子轮融资。本轮融资由线性资本领投,真知创投和Taihill Venture跟投,晶泰科技与深势科技作为科技产业方参与。在美国去工业化背景下,中国的材料化学企业正在从生产向研发转型,AI4S在这里前景更加广阔。


2022年,段辰儒获得麻省理工学院(以下称MIT)化学的博士学位,此前曾在微软担任研究科学家,主要研究生成式AI和大模型在化学方面的应用,和微软AI4S研究的产品化;贾皓钧也在今年获得了MIT物理化学博士学位,此前他曾任职陶氏化学的核心研发部门,利用人工智能技术开发催化剂配方和预测化学反应过程。


段辰儒(左一)与贾皓钧(右一)在MIT校园,来源:「甲子光年」拍摄


为什么是催化剂?


能源是人类社会运转的基础,而催化剂则是能源效率的关键之匙,毫不夸张地讲,催化剂就是现代化学材料工业生产中的“芯片”。


“化学反应无处不在。”贾皓钧介绍,“其中90%以上的化学品是通过催化工艺合成制备的,催化所创造的产值约占全球GDP的30%。工业生产中,催化剂贯穿整个化学反应。为了更好地控制这些反应,我们迫切需要关于催化材料的创新。”


以合成氨的生产为例,这一过程每年消耗全球1%至2%的能源,并造成全球约3%的碳排放。通过改进催化剂,若能将合成氨的转化提升1%,那么不仅能节省数十亿美元的成本,还能大幅减少碳排放。


“当AI4S技术将合成氨效率提高5%时,便是我心中化学材料的‘ChatGPT时刻’。”段辰儒说。


但发掘新型催化材料是一个极复杂的多任务问题。过程涉及大量的衡量标准和极大的材料空间。实验设计、数据分析和理论模拟,每一步都需要精确的控制和深刻的化学理解不仅是科学上的难题,更是工程上的挑战。


基础科研不存在捷径。对于基础学科的前沿研究来说,理论知识是基础,未知问题的答案往往不会在课本上出现。而由此科研成果衍生的创业尝试,尽管困难重重,却能真正地重塑能源未来。贾皓钧略带激动地说:“化学改变了世界,现在,我们用人工智能改变化学。”


曾经在MIT化学工程系楼里,贾皓钧和段辰儒占据着实验室一角,埋头于屏幕前,键盘不断发出粗重的颤音,这是大脑与AI同频共振的声音,有时空气中还会弥漫一阵热力推动的电子元件的实验室气味。两个人经常在这里一待就是十几个小时,用字符编织算法,在与数据无声对话。


现在,一个绿色且高效的未来,正在深度原理中,静静孕育。未来的图景如星空璀璨,脚下的征途依然漫长,他们正在一步一步地迈进。




1.催化剂是工业生产的“芯片”


段辰儒和贾皓钧有时觉得自己的工作就像在沙场排兵布阵,对化学结构调兵遣将,而新材料就是队伍中的主力军。他们专攻催化领域,通过催化作用来影响化学反应,控制化学键的断裂和新化学键生成的速度和方向。


比如煤碳转化为石油的自然过程需要数百万到数亿年,但借助催化剂,这一过程显著加速。催化剂能在温和的条件下促使原本难以进行的反应顺利进行,从而改变物质和能源的转化方式。“我们的主要任务是寻找性能优异的新催化剂,并设计和实现新的催化反应过程。”贾皓钧解释道。


从面包烘焙到火箭升天,数千年来人类一直在不知不觉中感受着催化的力量。


化学产品示意图,来源:受访者提供


在化学反应的历史中,每当发现新的催化剂或化学反应,人类合成新化合物的数量都会经历跳跃式增长,为科学发现和工业生产模式带来革命性变化。就像1950年代,齐格勒-纳塔催化剂(Ziegler-Natta Catalysts)的诞生时。它主要用于聚合反应,特别是聚合乙烯和丙烯这类塑料的生产。齐格勒-纳塔催化剂让塑料制品的大规模生产成为可能,极大地推动了现代塑料工业进程,影响了包装、建筑、汽车等多个行业。


催化剂示意图,来源:Oil&Gas


能源是人类社会不可或缺的血液。


工业革命以来,人类大规模开采化石能源。在煤炭、石油与天然气燃烧的灰烬中诞生了高楼大厦与车水马龙。然而这种对化石能源的过度依赖以及二氧化碳的大量排放,也带来了资源枯竭、生态失衡和全球气候变化等一系列问题。


数据显示,自工业革命以来,全球地表平均温度已升高约1.1摄氏度,预计到21世纪中叶将超过2摄氏度。同时全球大气污染正威胁人类生存条件。按照当前消费水平推测,全球煤炭储备将维持不超过200年,石油则可能在50至100年内耗尽。


能源危机兵临城下,探索新型催化材料迫在眉睫。


2017年《Nature》刊登的文章《The Drug-maker’s Guide to the Galaxy》中提到,在整个化学空间中,人类可发现材料(物质)的可能性,是10的60次方。


但筛选10的60次方种材料如是现实中不可能完成的任务。


“用一个最优条件假设,我们就能充分认识到催化材料设计的困难。假设只需 1 微秒即可获得一份候选材料的所有所需信息,且我们拥有与Nvidia总销量相等的1300万台A100 GPU,同时并行、不间断地运行它们。我们每年消耗114大千瓦时的电力(占人类总用电量的 0.5%)。”段辰儒分析,“理想情况下,遍历这些材料需要10的36次方年,宇宙寿命大约为100亿年,这相当于宇宙寿命的10的26方倍。


诚然科技发展早期,新材料的发现易如探囊取物,比如爱迪生通过试验找到灯丝材料钨的过程。


传统化学发现过程依赖于不断的试验和错误,此过程通常涉及实验室中的化学发现,但手工操作准确性不尽人意,整个过程的时间尺度从几个月延伸到几年,费用和时间成本都很高。但这种“大海捞针”式的方法论已无法满足当前新材料研发的需求。


想寻找催化材料的答案,要深入到肉眼不可见的微观世界。原子正等待着从杂乱无章逐渐走向有序,在最适合的微观结构中释放潜力。段辰儒介绍:“借助AI4S,我们能在信息大海中快速定位到最有价值的资源。”


贾皓钧和段辰儒在寻求一种“既有当前又有未来,我们要寻找一些全新的可能”。他们将实验、计算与机器学习三成形成一个循环(Experiment-Computation-ML in a Loop),通过AI决策链结合这些“武器”,从而优化整个化学发现的过程,让“AI炼金术”成为现实。


“现在国内高校和企业越发重视AI4S了,但深入的空间还很大。我们要做的是弥补材料化学和AI结合创新的空白。”贾皓钧说道。




2.“AI计算”炼金术


深度原理的核心算法有4块:


  1. ReactControl:使⽤多种⼯具进⾏即时决策,以提⾼成本准确性权衡,超过⼀半的计算和实验努⼒都因失败的尝试⽽⽩费。 ReactControl 将节省⼀半以上评估催化剂性能的时间;


  2. ReactBO:通过⻉叶斯算法的优化来发掘催化剂并优化反应条件,1000倍加速在拥有32.5M⼤⼩的材料空间中发掘可合成的发⾊团;

  3. Reactify:使⽤推荐引擎来进⾏⽅法选择和改进决策,让误差减少六倍,使⾼通量 DFT ⾸次达到实验精度。

  4. ReactGen:⽣成式⼈⼯智能辅助对新型催化材料和反应的快速采样,采⽤反向设计,无需筛选10的60次方种材料。

总而言之,就是在闭环系统中,通过高通量计算和机器学习减少实验次数和提高数据处理速度,在几秒钟内进行大量的计算和预测,而这些预测通常需要在实验室中花费数月甚至数年的时间。再利用AI进行决策支持,将机器学习、计算核试验的结果整合分析,以确定最有潜力的化学反应路径或材料设计方案。

其中的关键技术是一种基于生成式人工智能技术的扩散模型,名为OA-ReactDiff。

关于OA-ReactDiff论文切片,来源:受访者


OA-ReactDiff能够快速精确地从原子组分直接生成并优化过渡态(TS)结构,并有效支持化学反应的机理研究和反应网络构建,并通过机器学习替代了昂贵的传统量子化学计算。它避开了传统过渡态搜索中常见的复杂步骤,如原子顺序的调整和片段的对齐,而是直接利用反应物和产物的3D几何结构来生成过渡态。

最后聚焦到了过渡态的搜索,让这个过渡态的搜索速度提高了1000倍左右,将原本需要几小时甚至超过一天的过程缩短至十秒内。

在化学领域,寻找过渡态是阐明反应机制和探索反应网络的节点。

过渡态是一种特殊的分子结构,它存在于反应物变为产物的那一刹那。它是化学反应中的桥梁,连接着反应物(起始物质)和产物(最终物质)。好比烘焙过程中蛋糕从液态混合物转变为固体的那个关键时刻,过渡态对于深入理解化学反应的机制至关重要,研究人员依据过渡态的结构和能垒推断反应速率,就能设计更有效的催化剂。

但由于过渡态的瞬态性质,实验上难以观察到过渡态结构加上其势能表面的复杂性,寻找准确的3D过渡态结构需要极大的量子化学计算。比如使用密度泛函理论(DFT)构建详尽的反应网络,用时从数小时到数天不等,其成本高昂又错误频发。

“复杂的反应网络是通过立即迭代枚举当前已知物种可能发生的基本反应。而传统的过渡态搜索方法,如推动弹性带方法(NEB),计算成本高又难以收敛,常常导致大量的计算资源浪费。”段辰儒解释说,近年来越来越多的研究开始探索使用机器学习技术来寻找过渡态,比如把过渡态搜索转换为一个从2D到3D结构的问题,或通过各种网络模型来解决,但此类方法的弊端也很明显——还未能完全达到使用DFT评估的精确度。

对于这个化学领域盘旋已久的难题,2023年年底,段辰儒、贾皓钧和研究团队开发了一个名为OA-ReactDiff的新模型,它是一个能感知对象的SE(3)等变扩散模型,无需长时间的DFT计算,就能生成高精度的三维过渡态结构。同时他们还构建了一个基于置信度评分的推荐系统,让模型能够仅对最具挑战性的反应进行少量的DFT优化,从而接近所需精确度。

而解决问题的灵感来来自于一篇“利用散模型进行小分子药物生成”的论文。

2022年在AI4S的研讨会上,段辰儒与朋友聊起了Diffusion Model在小分子合成和生物学领域的应用前景。他很快意识到,尽管这些技术已被用于生成单个分子,但在化学领域的核心应用却鲜有人涉足。

之前生成式AI模型已被用在了单独的小分子药物设计。“Diffusion Model能够精确产生可以结合到特定蛋白质活性部位的药物。这让我十分好奇,除了生成单一分子或药物,是否能用这种方法生成整个化学反应?”段辰儒讲到。

“想法很新颖,但技术上的挑战也不容忽视。”与生成单一物质不同,化学反应涉及的多物体系统需要考虑更复杂的对称性,其中共涉及三种不同的物质:反应物、产物和过渡态。

在设计包含多种组分的化合物(比如金属-有机框架)或者研究涉及多种不同结构的化学反应时,传统的SE(3)等变扩散模型很难进行,因为它们难以准确处理和表达多个组分协同作用时的对称性。

这就不得不提到化学领域内最关键问题——物质之间的相互转化。

稳定性的定义是物质在势能面上的极小点状态。化学反应本质上是从一个势能极小点转移到另一个极小点的过程。基于这一点,段辰儒决定利用扩散模型来生成化学反应,“过程中困难重重,尤其是之前的Diffusion Model和图神经网络不能保证化学反应中一些特有的对称性。”

“抓耳挠腮”地思考了三个月后,段辰儒他们研发出了一套图神经网络确保化学反应中对称性,同时将该网络与Diffusion Model结构相结合,创建了一个能够生成完整化学反应的系统。“它能正确处理和维持反应物或产物中原子的排列,同时也能确保在处理多线程时,每部分的旋转和移动都是正确的。”贾皓钧说。

“一开始,我想到AI可以做这件事,但没有想到效果、精度会这么好。我们现在生成的过渡态已能与实验中的反应速率不相上下了,虽然反应速率仍会差一个数量级,但已经让我们看到‘计算和AI引导实验’的潜力。”段辰儒语速快了起来:“最令人激动的是,OA-ReactDiff生成的过渡态结构非常精确,与真实结构的差异极小。处理速度也非常快,在单个GPU上只需6秒。”

这一突破性成果已在《Nature Computational Science》杂志上发表,并荣获封面论文,在业内也掀起不小的“风暴”。GAMESS的开发者、哥本哈根大学的化学教授詹·哈尔博格·詹森(Jan Halborg Jensen)称赞这种新方法代表了“在预测化学反应性方面的重大进步”。

该论文的《Nature Computational Science》封面,来源:受访者


整个博士生涯,段辰儒与贾皓钧在Nature大子刊等顶级期刊及NeurIPS等顶级会议上合计发表超过60篇论文,并开创了多个AI for Chemistry新模型。目前,他们有多项专利正在申请流程中。

我们应该是第一批将GenAI放到化学流程里面的创业团队。”段辰儒说,“当时大家已经把Generative AI,尤其是 Diffusion Model 相关的东西运用在了一些纯的小分子生成和生物里面,但这里面其实都只涉及到生成一个分子。”

“「深度原理」也寓意着结合深度学习(Deep Learning)和第一性原理思考(First Principle),用人工智能重新解构分子世界的运作原则。”贾皓钧补充道,“段辰儒是也AI4S领域最早的一批研究者。”



3.创业不是“做饭”


一路从吉林大学读到MIT,贾皓钧的学术生涯还算顺利,也曾想过将学术道路已走到底,但创业的种子在一直在心中未曾泯灭。

贾皓钧和段辰儒同属MIT化学工程系教授、AI化学设计领军人物Heather Kulik教授门下。不同的是,贾皓钧专注于具体的催化反应机理和材料设计,而段辰儒则擅长AI和化学算法。在实验室里,段辰儒是“大师兄”般的存在,他醉心AI4Chemistry,开创了AI决策模型在高通量计算中的整合和应用;贾皓钧更像团队里的“小太阳”,他热情、爽朗、充满能量,总是勇于尝试新的方法和思路。

导师Heather Kulik教授对他们也有着截然不同的评价。她评价段辰儒有着“出色的学术领导力”,对贾皓钧则是“我最勇敢的学生”。

Kulik组的合影,其中Heather Kulik(左一)、段辰儒(左五)和贾皓钧(右一)。来源:受访者


第一次见面时,段辰儒对贾皓钧的印象“不太好”。

2019年秋天,刚到MIT读博的贾皓钧写邮件给段辰儒,咨询选择导师的问题。“见面时感觉这孩子有点‘轴’,咨询得都是好不好毕业、哪个研究方向更有前景等目的性很强的问题,但我做科研是出于热爱,不太聊得来。”段辰儒回忆。

但贾皓钧对段辰儒的第一印象却“好极了”。

“辰儒耐心地解答了我提出的问题,对学术很热爱也很有见解。当时就下定决心一定要抱住这条‘大腿’。”事实也证明了贾皓钧的“眼光”独到,整个博士期间,段辰儒共发表了50多篇文章,其中一作20篇。

几次合作后,段辰儒对贾皓钧印象有了彻底地改观:“皓钧在博士五年间坚持做了一个组内从来没人探索过的方向,当时连导师都劝他换个方向,他却坚持下来了,并小有成绩,这种‘虽千万人吾往矣’的勇气非常人能及。”

段辰儒与贾皓钧的合作时间,基本贯穿了彼此的博士生涯,也建立了十足的默契。“我们是和而不同的创业者,我骨子里是很悲观的人,辰儒乐观的态度让我倍受鼓舞。”贾皓钧说,“但我们对AI4S的认知是相同的。”

段辰儒在微软工作期间意识到自己的研究在工业界的实用性,但现实问题也接踵而来:材料化学公司的科研方式过于保守,而采用和更新AI4S工具的门槛又太高。

这些“门槛”也成了激发了他继续深耕AI4S的动力。“因为创业和我最初想做学术的初衷是一致的。我热爱的是研究和解决问题的过程,初创公司这个形式非常适合去实现它。”段辰儒坚定地表示。

段辰儒在微软总部的留影,来源:受访者


最初,创业的想法是由贾皓钧提出的。“不瞒你说,我从小对‘搞钱’就十分感兴趣。幼儿园学算术时,你问‘15+27’等于多少我未必能答对,但问‘15元’+‘27元’等于多少元我一定能马上答对。”贾皓钧逐渐严肃起来,“‘搞钱’一度是我的追求,但后随着对物理、化学的深入研究,我逐渐认识到有更重要的事业等着我去做:作为一名青年科学家和创业者,我们应该敢于面对国家的技术需求,探索能解决瓶颈问题的基础研究。”

对于AI4S的创业方法论,他们认为AI4S初创公司必须依赖技术创新才能脱颖而出。

AI4S类别的创业公司虽然是技术驱动,但终极目标仍是通过创新满足市场需求。科技创业需要平衡市场与技术的不确定性。

Instagram在技术上的风险较低,但最大的不确定因素,人们是否愿意公开分享自己的照片;与之相比Commonwealth Fusion Systems,虽然在可控核聚变方面遇到了很多技术挑战,一旦成功,他们就能清楚地知道如何在有组织的市场中销售他们提供的廉价且清洁的热能和电力。

市场与技术的不确定性,来源:The Engine Ventures 


贾皓钧表示:“大部分硬科技公司都处于这两个极端之间,他们需要在资金有限的情况下,同时推进市场和技术的试验和探索。”

在公司发展的早期阶段,技术是核心竞争力。随着公司发展至后期,重点逐渐转向市场和产品开发,技术的直接表现可能不如之前显眼,因为目标转为满足客户需求而非单纯展示技术。虽然可乐的制作涉及复杂技术,如罐装和储存技术,消费者却只关心其基本功能——解渴。这些背后的技术虽然关键,但对消费者而言是不可见的。

深度原理的目标是将技术转化为产品发动机,特别是在快速迭代的化学材料领域,这更亲环保的能源解决方案和更合理的能源分配。“我们希望通过创新来实现这一目标。虽然可以使用各种工具和方法,如AI或传统化学直觉,但我们认为使用AI4S来开发这些解决方案可能性最大。”段辰儒表示。

在实现这些目标的过程中,体系化的方法非常关键。

相比于依赖随机的直觉或偶然的发现,体系化的方法提供了一个更可靠的框架,能够有效地迭代和优化策略。这种方法在创业、思考问题,以及执行任何计划时都是一种强大的能力。

“毕竟创业不是做饭。”贾皓钧说

贾皓钧在MIT博士毕业典礼上,来源:受访者


他认为创业的方法理论固然重要,但创业一定不是一个循规蹈矩的过程。“因为创业不像做饭,只有指导原则,没有固定配方全靠探索。”

从出发到现在,他们未曾忘记深藏心中的愿景:将人工智能、量子化学和高通量实验技术应用于化学材料领域,让化学材料创新的工作流程得以改善,加速研发创新的效率。

段辰儒分享了自己在计算机顶级会议ICML和NeurIPS上组织AI4S社群和会议的体验,“从参加人数的急剧增加可以看出社区的兴盛和AI在科学中应用的热度上升。”段辰儒说,“AI4S是一个兴起的领域。作为最顶尖的研究者时,我们最擅长的就是重塑问题并解决它们;那在创业时,我们为什么不挖掘工业界催化材料的研发生产问题并解决他们呢?作为CTO,我最重要的使命就是找到AI4S在化学材料领域最顶尖的研究者和工程师,把他们聚集在深度原理,和他们一起在工业界真实的应用场景上‘打怪’。”


“我希望深度原理不仅成为一个成功的公司,更是一个科技创新的象征,吸引全球顶尖的科学家和工程师来此大展身手。”贾皓钧憧憬着。


毋庸置疑,这是最好的时机。

2020年,我国提出了“2030年全面现碳达峰”的宏伟目标,将能源效率的战略意义提升到前所未有的高度。

贾皓钧表示:“降低碳排放的最有效的方式是提高能源效率。”催化研究的核心目标是促进能源转型,优化能源结构,实现低碳化,并为国家能源安全提供技术保障。

(封面图来源:「甲子光年」拍摄)





END.






继续滑动看下一个
甲子光年
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存