“我们研究了 6 个反应体系,分析了数万个反应条件,其中经历了好奇、兴奋、迷惑与疲惫股升网,但始终坚持不懈。这个工作提醒我们,有机反应在产率低和不典型的实验条件下,往往也潜藏着值得探索的机制、反应路径和独特的中间体。而论文上线,更多的是对这个方向未来发展的期待。”在 Nature 论文上线的当天,韩国基础科学研究所高级研究员贾延凯在朋友圈写下了这样的感慨。
结合自动化平台与人工智能的“自主驾驶实验室”(Self-Driving Lab)技术,近年来已在化学与材料研究领域发挥着重要作用。近期,贾延凯与所在团队搭建了一个低成本、速度快和高稳定性的机器人实验平台。他们将自动化实验手段和快速解谱算法相结合,绘制了多种有机反应在条件空间中的产率分布。并且,据此反推出各种反应网络的构形,揭示反应产率的平滑性,为发现反应路径提供了全新研究手段。
图丨贾延凯(来源:贾延凯)
与传统的分析技术相比,该平台最显著的优势是它的快捷性——每天最多可执行和表征约 1000 个反应。平台另一个优势是低成本:为将所有器件集成于同一通风橱中,该系统核心仅由一个平面移动台、一支电子移液器、一个微型紫外光谱仪和一块控制电路板组成,其余零件大多通过3D 打印完成。据了解,平台的整体成本控制在 2.5 万美元以内(每个数据点成本低于 1 美元),相较于传统方法降低约 1 个数量级,使得普通实验室也可自主搭建。
展开剩余88%这种数据驱动的研究方法,对于构建支撑 AI 化学大模型训练的高质量数据集具有重要意义。并且,其还革新了人们对有机反应的固有认识。以往研究中通常认为反应是单一线性的(例如 A+B—>C),而该研究通过高通量的反应空间扫描发现,反应往往是一个复杂的反应网络。
审稿人之一对该研究评价称:“这项出色的工作,不仅开辟了全新的研究方向,也展现了机器人技术、数据挖掘、数学与化学洞察力之间巧妙的协同作用。”另一位审稿人则认为,作者们展示了一个用高通量表征来驱动化学发现的研究范式,对推动化学发展具有重要作用。
近日,相关论文以《机器人辅助绘制化学反应超空间和网络》(Robot-assisted mapping of chemical reaction hyperspaces and networks)为题发表在 Nature[1]。韩国基础科学研究所贾延凯是第一作者,高级研究员姜炎秋和巴托什·A·格里布夫斯基(Bartosz A. Grzybowski)教授担任共同通讯作者。
图丨相关论文(来源:Nature)
用高通量机器人手段对反应空间进行系统化探索
在有机化学领域,如果想准确测量反应结果股升网,通常需要液/气相色谱、核磁共振谱和质谱等分析手段,经历包括产物的分离、提纯和表征在内的一整套流程。其过程不仅耗时,而且需要投入大量人力与资源:仅测量一个反应的产率可能就需要 3 到 5 个小时。因此,科学家在多维反应条件空间(如底物浓度、催化剂浓度和反应温度等)上进行系统性探索充满挑战。
传统方法由于缺少高通量和自动化手段,研究人员依赖于直接从已有文献中寻找“标准反应条件”,然后基于此条件进行反应,而忽视在该反应的不同实验条件下,反应的产率、副产物、中间产物等究竟会呈现出怎样的分布。这就像是在一张地图上只看到了几个坐标点,却很难画出整体的地形轮廓。
因此,化学家对一个具体反应在其“超空间”中的产率分布,往往只有局部片面的认知。事实上,这些“被遗忘的角落”中蕴含着许多值得探究的科学问题,比如:一个反应的产率只存在一个极值点,还是有多个局部最优?产率在不同条件下的变化是连续平滑的,还是会出现突变和临界点?不同反应产物之间是否可以通过改变条件实现调控?
需要了解的是,绘制反应超空间形态需要大量标定不同反应条件下不同产物的产率。例如,对一个简单的 A+B—>C 反应,如果希望在 10 个 A 的浓度、10 个 B 的浓度和 10 个温度点的组合下,全面扫描反应空间就需要进行 10X10X10=1000 次独立实验。贾延凯对 DeepTech 解释说道:“这种规模的实验数据采集工作已经远超人工实验的承载范围,因此必须基于高通量机器人手段才能对反应空间进行系统探索。”
图丨液体进样平台(来源:贾延凯)
反应结果检测的决速步骤往往是反应产物的分离提纯。在研究初期,他提出一种设想:是否能“跳过”分离提纯的步骤,对反应混合物直接测量光谱,然后通过算法对混合物光谱进行解谱,从而得到各种产物和中间体的浓度?
这好比听交响乐,人们可以通过训练自己的耳朵,在乐曲中识别出小提琴、大提琴、长笛等各自的旋律。“我们希望机器学习算法也能够‘听懂’反应混合物的光谱,从中分辨出各个产物和中间体的‘声音’,而不必先将它们分离提纯出来。”贾延凯说。
紫外光谱检测具有速度快、图谱简洁和稳定性高等优点,因此被用作本研究的主要检测手段。研究中,首先测量底物和预期产物的标准光谱,然后测量混合物光谱,最后通过机器学习算法解析出各个底物和产物的浓度。另外,这种方案还可以检测出意外产物和反应中间体。
图丨自动反应平台和光学产率测定(来源:Nature)
研究人员在反应超空间的绘制过程中提出并验证了一些全新的观点:第一,研究揭示了反应产率的平滑性。该平台得以全面探索各类反应超空间的产率形态。研究团队发现,反应产率在不同反应条件下通常呈现连续和平缓的变化趋势,极少出现突变,类似于缓缓起伏的丘陵地形,而非断裂突变的尖峰或悬崖。第二,超空间的绘制可以帮助研究人员反推出包含多种产物与中间体的完整反应网络,即超空间—>产物+中间体—>反应网络。第三,在超空间的不同位置可能出现不同主产物,为主产物的调控提供了方法。
仪器运行的“嘀嘀”声,成为动听的旋律
该研究共历经约三年半时间。研究团队面临的首个挑战是需要“从 0 到 1”搭建起整个系统。该研究聚焦于有机反应研究,然而由于有机溶剂相比于水溶液的复杂性和多样性,市面上并没有适用于有机溶剂的自动化移液设备。而现成的电子移液枪多用于生物液体,他们不得不“拿着生物界的工具,做化学界的事”。为保障实验的准确性和稳定性,贾延凯对研究中所使用的每种有机溶剂都进行了移液体积校准。“这部分工作虽然繁琐,但也将设备的性能发挥到了极致,为后续的反应和检测打下了坚实的基础。”贾延凯说。
图丨E1 和 SN1 反应空间上的产率分布(来源:Nature)
另一个挑战在算法开发层面。起初,当反应体系中只有两个到三个产物时,解谱算法表现还算良好。但很快研究人员就发现了算法存在的不足:一旦产物成分超过 5 个,算法便容易出现两种物质互相分不清楚的现象,导致其输出错误的浓度。如前所述,算法在这项研究中扮演的角色犹如训练有素的听音师,可以在复杂的交响乐中,单独听出某个乐器的旋律。研究人员的策略是:反复调试算法结构,自定义损失函数,并通过谱图残差提供反馈,最终提升了模型分辨度和稳定性,这种方式突破了传统“先分离、再定量”的检测方式。
图丨催化剂组合物的五维空间(来源:Nature)
回忆起研究中让贾延凯最难忘的事,他表示:“这个领域对我来说是个全新的挑战,项目起初我常常在实验室沉浸式写代码、调试硬件,一坐就是好几个小时。当我看到机器运转起来时,那种开心和激动让人难忘。”
此外,研究中还有一个有趣的插曲。贾延凯在做实验时,进行了一种系统设置:每做一次实验,电脑都会发出频率为 600 赫兹的“嘀”声,从而使得实验用在远离设备的地方也能听到设备是否在正常运行。由于每天要做几百甚至上千个反应,因此在实验室会经常听到仪器发出的“嘀嘀”声。在贾延凯看来,这并不是噪音而是一种美妙的声音,因为每一次“嘀”声都代表又得到了一个成功的数据点。“有意思的是,我的合作导师也喜欢上了这个声音,每次他来到实验室,如果发现设备是安静的状态,他就会说:‘机器人的动听歌曲怎么停止了?’”贾延凯表示。
有望用于新催化策略或药物研发等领域
该团队所建立的反应空间绘图平台不需要对产物进行提纯分离,而是通过检测它的光谱直接得出最终反应结果。并且,其突破了传统研究中高度依赖文献已有的“成功案例”范式,从更长远的角度看,该研究为“可导航反应空间”奠定了概念基础。
在该研究中,研究人员将该平台用于的经典 Hantzsch 吡啶合成反应。值得关注的是,它不仅涵盖了七种已知物种,还包括了九种此前在 Hantzsch 反应中尚未报道过的新物种,并显示出在生物活性方面的研究价值。可预见的是,未来该平台有望在更广阔的多维条件空间中系统性地探索反应行为,发现隐藏的反应路径、异常产物或具有潜力的新机制,进而为新催化策略或药物研发等领域提供重要线索。
另一方面,该自动化探索平台为 AI 化学发展提供了关键支撑,特别是在数据获取方面弥补了长期以来的短板,为建立高质量的化学 AI 训练数据集提供了方案。
图丨贾延凯在调试实验设备(来源:贾延凯)
贾延凯在哈尔滨工业大学机械工程专业获得博士学位,博士期间在美国宾夕法尼亚大学化学工程系进行访问,之后来到目前课题组从事研究工作。
他选择该研究方向,最初是受英国利物浦大学安德鲁·库伯(Andrew I.Cooper)教授团队在 2020 年发表在 Nature 的一篇开创性的论文 [2](DeepTech 此前报道:它工作一周堪比博士 4 年科研生涯!机器“化学家”诞生,中国市场商业化前景巨大)的启发。在那项研究中,库伯团队提出“机器人化学家”的概念——人在家中,机器人在实验室帮助研究人员做实验。
实验室自动化和智能化是材料与化学研究的必然发展趋势。贾延凯表示,其所在的算法与机器人合成研究中心的咖啡室有一个有趣的标语——“请多喝咖啡,这样当你在做无意义的事情时,就会有更多能量”。“这个诙谐的标语提醒我们,自动化平台是一个很好的工具,它解放了研究人员的双手,但并没有解放我们的大脑。科学研究最重要的是发现有意义的问题去解决,因此机器人与化学家只有密切配合才能加速解决药物合成和材料发现等领域的关键问题。”贾延凯表示。
尽管此研究方案优势显著,但研究人员也坦诚地指出了现阶段它的局限性:一方面,对结构复杂的有机分子,紫外光谱分辨率太低,这时候需要更复杂的步骤或精度更高的设备(比如核磁共振仪)来检测;另一方面,该平台目前还不具备处理固体粉末反应底物的能力。
因此在未来的研究阶段中,研究团队希望通过升级硬件、调整算法和扩展表征方法等策略来解决这些问题。与此同时,他们还打算利用自动化智能平台,去探索针对复杂有机反应的新型高效催化剂。
参考资料:
1.Jia, Y., Frydrych, R., Sobolev, Y.I. et al. Robot-assisted mapping of chemical reaction hyperspaces and networks. Nature 645, 922–931 (2025). https://doi.org/10.1038/s41586-025-09490-1
2.Burger, B., Maffettone, P.M., Gusev, V.V. et al. A mobile robotic chemist. Nature 583, 237–241 (2020). https://doi.org/10.1038/s41586-020-2442-2
运营/排版:何晨龙股升网
发布于:北京市配资指数平台提示:文章来自网络,不代表本站观点。