1. 引言
过量的二氧化碳(CO2)排放,引发了全球气候变暖和能源危机。工业活动排放和燃油车辆尾气是大气中CO2的主要来源[1]。目前,通过储存方法可以处理部分CO2排放,但这种储存技术存在失败风险,储存的CO2也可能再次释放。而将CO2重新利用,将其转化为有价值的化学品或碳基燃料,就可以实现碳循环并达到碳中和的目标[2][3]。然而,鉴于CO2分子的极高稳定性,有效将CO2转化为碳基燃料仍然面临着多项科学挑战。近年来,电催化方法在将CO2转化为碳基燃料方面受到了最广泛的关注[4]。电催化CO2还原是在水溶液中由电力驱动的,涉及多质子耦合电子转移的过程[5]。电催化CO2还原反应是多电子还原途径,产生C1产品,包括一氧化碳(CO),甲酸盐/甲酸(HCOOH),甲醇(CH3OH)和甲烷(CH4);C2产品,包括乙烯(C2H4)、乙醇(C2H5OH)和乙酸盐(CH3咕咕);C3产品如丙烯(C3H6)和正丙醇(C3H7)和长链产品[6]。这种技术具有独特的优势,包括温和的反应条件、廉价的反应来源、环保的过程和潜在的高效性。水溶液中CO2还原过程涉及多个半反应,每个半反应都需要一定的电势,即还原半电位,来推动电子转移。这些半电位可视为预测在不同电极上发生的还原半反应可能性的指标。表1提供了不同还原产物的半电位信息,为实现特定CO2还原路径和产物选择性提供了重要参考。
金属有机框架(MOFs)是由金属离子或团簇和有机配体组成的,由中等强度的配位键连接起来的具有分子内孔隙的有机–无机杂化材料[7]。其中,有机配体通常为由含氧、氮等的多齿有机配体,无机金属簇一般是由过渡金属离子所构成。由于MOFs材料具有良好的结构、较高的孔隙率、大的比表面积和好的化学稳定性,其在催化领域,如化学催化[8],光催化[9]和电催化[10]等领域得到了广泛的研究和应用。MOFs由模块化的分子构建块构建,通常为金属簇和有机连接体。这些构建块可以组装成几乎无限数量的MOFs[11]。为了实现对高性能MOFs材料性能的预测,从而能够有效的探索出所需的MOFs材料,只依靠实验合成费时低效。基于机器学习(ML)的高通量计算预测逐渐受到关注。在复杂数据分析领域,机器学习(ML)正迅速崭露头角,并逐渐成为环境科学中处理复杂数据的有力工具[12]。一个训练优秀的ML模型能够精确预测我们所关注的性能指标,相对于传统的性能计算方法,更有效地减少了计算时间。Panapitiya等人通过应用机器学习中的随机森林算法成功地建立了合金纳米团簇上CO分子吸附能与纳米团簇结构之间的关系。通过从材料的结构出发,准确地预测了CO在材料上的吸附能[13]。Pardakhti等人采用了化学描述符进行吸附结构分析和评估,结合了决策树、泊松回归法、支持向量机和随机森林等多种机器学习算法,对金属有机框架的甲烷吸附性能进行了预测。这一方法显著提高了预测的准确性[14]。谢晨等人通过机器学习预测多孔碳材料(PC)吸附CO2能力,应用Shapley Additive Explanations揭示其物化性质与吸附能力的关系,为碳捕集与储存的高性能PC设计提供了指导[15]。行缪娟采用机器学习(ML)模型的梯度提升回归(GBR)算法,针对CO2还原反应中的Cu基合金催化剂,实现了高效的催化剂筛选和关键中间体吸附能的快速预测,为CO2RR的合金催化剂探索提供了有前途的方法。这种模型在设计其他类型催化剂方面也具有潜在应用价值[16]。张青等人[17]利用已发表的实验数据构建二氧化碳还原催化数据库,使用机器学习模型预测针状结构的Cu2O(110)与铜氢氧化物、N掺杂碳黑的复合对CO2还原制乙烯的法拉第效率有利,为高效铜基催化剂的快速筛选提供了数据驱动的替代方法。孙哲浩等人[18]研究关注于机器学习在电催化二氧化碳还原中的应用,以提高能量转化效率。通过密度泛函理论和活性机器学习相结合,开发了Cu-Al催化剂,实现高效将CO2还原为乙烯。在多重实验条件下,该催化剂在高电流密度下表现出超过80%的法拉第效率,较纯Cu有显著提升。研究还优化了电解液pH和阳离子浓度,以获得更佳的性能。通过原位实验和计算分析,揭示了Cu-Al合金提供的多个优化CO结合位点和表面取向,以促进高效和选择性的CO2还原。这一研究表明机器学习可引导多金属催化剂的设计,以实现电化学CO2转化的突破性提升。以上所有这些研究都在材料分析中成功地应用了ML方法,并取得了令人满意的成果。显然,利用ML进行材料的分析和选择是一种可行的途径。但机器学习关于金属有机框架(MOFs)电催化二氧化碳方面的报道鲜为人知。
Table 1.Potentials required for possible half-reactions during CO2reduction in aqueous solution
表1.在水溶液中CO2还原过程中可能发生的半反应所需的电势
CO2reduction reations |
(V VS RHE) |
|
−1.90 |
|
−0.20 |
|
−0.11 |
|
−0.07 |
|
0.03 |
|
0.17 |
|
0.08 |
|
0.09 |
根据金属有机框架材料(MOFs)在电催化还原二氧化碳领域的最新应用进展,我们发现,MOFs作为催化剂在促进二氧化碳电催化中具有巨大的潜力。此外,我们详细介绍了机器学习的核心概念和方法,并探讨了机器学习在预测和筛选二氧化碳还原电催化剂方面的功能和最新进展。这项研究强调了引入机器学习技术对于MOFs的电催化性能预测和催化剂筛选具有重要的潜力,并对机器学习在二氧化碳还原领域的未来前景进行了展望。
2. MOFs电催化还原二氧化碳的应用
金属有机框架材料(MOFs)是一种新兴的晶体杂化多孔材料,由有机配体和金属节点/簇组装而成,形成了由三维周期网络构成的结构。由于其高表面积、良好的稳定性、可回收性、永久孔隙率和多个活性中心等特点,在电催化二氧化碳转化反应中得到广泛应用。目前已有许多工作报道金属有机框架作为催化剂电催化二氧化碳。Nakata等人在海水和MOF(掺硼金刚石)存在的情况下对CO2的电化学反应进行了实验研究,产生了相当数量的甲酸和甲醛,其法拉第效率高达74%[19]。Albo等人在0.5 mol/LKHCO3水溶液存在下,研究了基于Cu(II)和Bi(III)的MOFs(HKUST-1和CAU-17)用于CO2还原生成包括甲酸在内的细小烃类化合物[20]。王等人报道了一种含钴的沸石咪唑醇框架(Co-ZIF-9),它作为稳健的金属有机框架协同催化剂,与一种基于钌的光敏剂合作,实现了CO2的还原[21]。Lamagni团队合成并应用了基于铋的金属–有机框架Bi(btb),实现了选择性电催化CO2还原制甲酸。在广泛电位范围内,Bi(btb)显示高达95(3)%的甲酸法拉第效率,并以高达261(13) A g−1的电流密度表现,相对于铋载荷。研究还表明,Bi(btb)在与其他基于铋的材料相比具有卓越性能[22]。金属纳米颗粒基MOFs在电催化CO2还原制甲酸和甲酸盐方面具有卓越性能。Kung等人用NU-1000 MOF薄膜制备的铜纳米颗粒表现出有希望的CO2还原电催化活性,Cu基MOF在电位为−0.82 V vs. 可逆氢电极(RHE)时的法拉第效率达到31%,以甲酸为主要产物[23]。
2.1. 反应活性中心的设计
MOFs的高度可调性使其成为优秀的催化剂载体。通过调整金属离子的种类、有机配体的结构以及孔结构,可以创造出具有特定反应活性中心的MOFs,有利于促进CO2的催化转化。这些活性中心可以提供活化CO2的能力,从而实现高效的催化反应。
2.1.1. 金属离子种类和有机配体的结构
MOFs的金属离子种类在二氧化碳的电催化还原反应中涉及一种重要的原理,即过渡金属的催化活性。不同金属离子具有不同的电子结构和能级分布,这将直接影响它们与反应底物(如二氧化碳)之间的相互作用,有机配体的功能在于为金属中心提供配位环境,可以调整催化剂的电子状态和配位结构。这些因素直接影响了反应过程中催化剂与反应物之间的相互作用。有机配体的配位键可以与金属离子进行配位,其结构也可以调节MOFs催化活性位点的酸碱性和电子亲和性,从而影响催化反应的速率和选择性。乔世璋等人研究单原子催化剂(SACs)的不同金属离子的电子结构和能级分布在催化反应中起着关键作用,通过调整金属原子和配位结构,实现了高选择性的氧还原反应(ORR)催化,为多电子电催化提供了新的调控机会[24]。过渡金属在催化中的活性归因于其d电子轨道的特殊性质。不同金属的d电子数、分布和能级会影响其在反应中参与电子转移和配位的能力。例如,袁明鉴课题组研究发现在独特的graphdiyne平台上合理设计Cu单原子的化学键构建,实现了调控反应中间体,可以更有效地吸附和活化CO2分子,从而促进CO2的催化转化。这项工作为提高CO2RR的选择性提供了新的原子水平的见解。
因此,通过选择适当的金属离子,选择合适的有机配体的为金属中心提供配位环境。通过调节催化剂的活性和选择性,从而实现更高效和可选择的二氧化碳催化转化。这种调节金属离子种类的策略在设计和优化催化剂的性能方面具有重要的应用价值。
2.1.2. 不饱和的金属位点
在金属有机框架(MOFs)的电催化二氧化碳转化过程中,MOFs的不饱和金属位点扮演着重要角色。不饱和金属位点是指在MOF结构中,金属离子周围存在未被饱和的配体位点,通常表现为配体分子上的功能基团。这些不饱和金属位点能够吸附和激活反应物,从而促进CO2的转化为有用的产物。不饱和金属位点可以通过配体的功能基团与CO2分子进行吸附和相互作用。这种相互作用可以改变CO2分子的电子分布和活性,从而使其更容易参与催化反应。不饱和金属位点能够进行电子转移,从而调节反应物的电荷状态,有助于提高反应效率和产物选择性;它们还可以催化CO2分子形成活性中间体,如氧化物或碳酸盐,进一步参与产物生成的反应过程;此外,不饱和金属位点可以作为电子传递的中继站,将电子从外部电极输送到催化中心,维持反应进行并控制反应速率。
2.1.3. 孔结构
金属有机框架材料(MOFs)的孔结构在电催化二氧化碳还原反应中的原理是通过提供多样化的微孔和介孔结构,有效地增加了反应物与催化剂之间的接触面积,促进了反应物的吸附和扩散。这些孔道可以作为微小的反应室,容纳CO2分子,并提供足够的活性位点,有利于反应分子的吸附、解离和转化。通过调控孔径大小、表面化学性质以及孔壁的材料组成,可以实现对反应中间体的选择性吸附和催化活性的调控,从而优化二氧化碳的转化过程,提高产物选择性。Mohamed K. Albolkany等人通过分子尺度的合成策略,实现了在微孔金属有机框架中可逆可控的介孔生成和更新,为分级多孔材料的设计提供了新思路。气相刻蚀和MOF前体溶液的应用使得介孔尺寸和体积得以调控,为精确调控材料性能提供了有效方法[25]。
2.1.4. 选择性和稳定性的优化
通过调整MOFs的成分和结构,可以实现对特定产物的选择性提高以及反应稳定性的增强。这种优化可以通过设计具有特定孔结构和功能基团的MOFs来实现,从而实现所需的反应路径和产物分布。金属有机框架(MOFs) 是由金属离子或簇团与有机配体构建而成的晶体材料。它们的成分可以通过选择不同的金属离子和有机配体来实现精确的调控。例如,庞欢教授研究发现在储能方面,MOFs的成分可控性使其具备优势,可以根据需要设计具有特定性能和功能的材料。在电池和超级电容器等能量存储领域具有重要应用潜力,并总结了MOF复合材料在多种电池和超级电容器中的应用[26]。
MOFs作为相对新颖的材料,为电催化CO2转化领域带来了新的催化机制的探索。其独特的结构和电子性质可能引发新的催化途径,从而为CO2转化提供更多创新思路。
3. 机器学习在碳捕集的应用
3.1. 机器学习过程
3.1.1. 数据收集
在经典的机器学习流程中,首要步骤是从原始数据中识别出独立的变量。近年来,一些数据库已经建立并积累了过去一个世纪的大量材料数据,这为机器学习提供了丰富的原始信息,从而极大地促进了机器学习的发展。当前,关于金属有机框架(MOFs)的数据库基本上可以分为两类,一类是由实验合成的MOFs (eMOFs)组成的数据库,另一类是由计算机合成的MOFs (hMOFs)组成的数据库。不过,许多研究者目前仍然采取手动从文献中搜集所需的相关数据点,以创建适合自己研究需求的数据集。
3.1.2. 特征工程
在收集充足数据后,将原始数据转化为所需的定量参数成为构建精确预测目标性质模型的关键步骤。特征工程是机器学习的一个过程,选择与所关注性质特点相关的输入参数(特征)。对于催化材料,特征与晶体结构、元素组成和电子性质有关,这些特征可用于揭示和预测活性、稳定性和选择性等指定性质。为了预测材料性质,将特征转化为适用于机器学习算法的值(描述符)是必要的,通常以数字、向量、矩阵或字符字符串形式呈现。这些描述符应具备通用性和有效性。重要的描述符包括电催化剂在电催化二氧化碳反应中的性能,它反映了催化剂与反应物之间的关系。由于特征用于构建多种机器学习模型,因此找到适当的特征选择方法对于获得准确且高效的模型至关重要。在先前的研究中,研究人员通过选择不同维度和类型的特征构建了多样的机器学习模型。
3.1.3. 机器学习模型
良好的机器学习方法应该在尽可能少的计算资源下,能够快速准确的预测广泛覆盖的材料的性能。因此选择合适的机器学习模型对于获得更为合理的预测结果具有重要作用。目前,一些广泛应用于催化剂的性能的预测和筛选的流行方法包括线性回归(linear regression, LR),决策树(Decision Tree, DT)、集成算法(Ensemble Algorithm, EA)、支持向量机(Support Vector Machine, SVM)以及人工神经网络(Artificial Neural Network, ANN)。
(1) 线性回归(linear regression, LR)
线性回归用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量的值也随之发生变化。回归模型正是表示从输入变量到输出变量之间映射的函数。具体目标如图1找到一条直线使得尽可能符合数据的分布,从而有一个新的样本点时,可利用学习得到的这条直线进行预测。
(2) 决策树(Decision Tree, DT)
此算法主要是指决策树进行创建中进行树分裂(划分数据集)的时候选取最优特征的算法,他的主要目的就是要选取一个特征能够将分开的数据集尽量的规整,也就是尽可能的纯。最大的原则就是:将无序的数据变得更加有序,如图2。
(3) 集成学习算法(Ensemble Algorithm, EA)
通过构建并结合多个机器学习器来完成学习任务。可以说是集百家之所长,能在机器学习算法中拥有较高的准确率,不足之处就是模型的训练过程可能比较复杂,效率不是很高。目前常见的集成学习算法主要有2种:基于Bagging的算法和基于Boosting的算法,基于Bagging的代表算法有随机森林,而基于Boosting的代表算法则有Adaboost、GBDT、XGBOOST等。
(4) 支持向量机(SVM)
一种用来解决二分类问题的机器学习算法,它通过在样本空间中找到一个划分超平面,将不同类别的样本分开,同时使得两个点集到此平面的最小距离最大,两个点集中的边缘点到此平面的距离最大。如下图所示,图中有方形和圆形两类样本,支持向量机的目标就是找到一条直线,将圆形和方形分开,同时所有圆形和方形到这条直线的距离加起来的值最大。图3中直线H和直线H3都可以将两类样本分开,但所有点到H的距离之和更大,所以H更适合分类任务,距离H最近的几个样本点叫做支持向量。之所以选择距离最大的超平面是因为距离最大的超平面具有最好的泛化性能。
(5) 人工神经网络(ANN)
人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。神经网络具有三种层:输入层、隐藏层和输出层[27](图4)。每个节点都包含一个输出函数。先已被证明是高效和准确的深度学习方法来寻找新材料。然而,神经网络模型通常需要大量的训练数据,这将消耗大量时间。此外,ANN中现有的“黑匣子”导致理解模型如何做出特定决策是困难的[27]。在某些情况下,在模拟过程中会出现过拟合[28]。
Figure 1.Linear regression
图1.线性回归
Figure2.Decision tree
图2.决策树
Figure3.Support vector machine
图3.支持向量机
Figure4.Neural network
图4.神经网络
3.1.4. 模型验证
模型验证是确保训练出的模型能够在新数据上具有良好泛化能力的重要步骤。这一过程通常分为两个关键阶段:训练集和测试集划分。首先,通过将数据分成训练集和测试集,模型可以在训练集上学习数据的模式和特征。其次,在测试集上对模型进行评估,模型将对测试集进行预测,预测结果与测试集的真实标签进行比较,从而评估模型的性能。
模型验证的目标是避免过度拟合和高偏差。过度拟合指模型在训练数据上表现很好,但在新数据上表现较差,这是因为模型过于复杂,学习了训练数据中的噪声。而高偏差则表示模型过于简单,未能捕捉数据中的复杂关系,导致在训练和测试数据上都表现不佳。交叉验证是一种常用的验证方法,旨在更准确地评估模型的性能和稳定性。它将数据集分成多个子集,多次进行训练和验证。在每次迭代中,一个子集被作为测试集,其余子集作为训练集,从而保证了每个子集都被用于测试和训练。交叉验证能够有效减少模型性能的随机波动,提供更可靠的评估结果。
验证结果有助于选择最佳模型并优化其性能,以确保在新数据上的准确预测。通过合理的模型验证,可以提高模型的泛化能力,使其在实际应用中能够产生可信赖的预测结果。现有机器学习的基本流程如图5所示,其相对于以往传统的机器学习而言,增加了模型的验证阶段,通过对原始数据集中不存在的数据进行预测,以实现对材料更加精确的预测效果。
Figure5.Machine learning process
图5.机器学习流程
3.2. 机器学习在预测和筛选催化剂方面的应用
Beyza_Yılmaz等人[29]通过机器学习分析了包含4051个数据点的数据集,来自100篇已发表的文章中的527个不同实验,这些实验涉及催化CO2甲烷化反应。研究构建了一个随机森林模型,以23个描述符预测CO2转化率。模型训练和测试的均方根误差分别为6.4和12.7,训练的R2为0.95,测试的R2为0.87。分析结果显示,Ni是最常见的活性金属,通常以5~25 wt.%的负载最优,常用支撑材料中,CeO2和ZrO2的转化率最高。最常用的制备方法是WI和IWI,而DP方法导致最高的转化率。此外,研究发现,反应温度是最具影响力的描述符,支撑材料、制备方法、金属负载和金属基类型等也在CO2转化率中具有显著影响。本研究通过重新计算测试集中100个实验的CO2转化值,并与实验值进行比较,验证模型是否能够预测特定实验中的CO2转化趋势如图6所示。大多数实验的预测结果相当准确,且模型捕捉到了不同温度下的不同趋势。通过验证可得出,该研究为催化CO2甲烷化反应的设计和优化提供了有力工具和方法。由此可见,机器学习在预测电催化还原二氧化碳的催化性能方面已经得到了可靠的研究。
Figure6.Comparison between machine learning model predicted values and experimental real values[29]
图6.机器学习模型预测值和实验真实值之间的比较[29]
张宁等人[30]通过结合密度泛函理论(DFT)数据库和机器学习方法,成功地建立了一个预测模型,在建立的预测模型基础上,可以进一步进行筛选材料。能够快速发现潜在的二氧化碳电还原催化剂。经过建立DFT数据库、进行特征工程和模型训练,最终采用XGBR模型获得了最佳预测准确性。利用这一模型,预测了包含1060个设计的单原子催化剂(SACs)的候选材料,这些SACs由20种过渡金属原子和53种不同的非金属键合环境组成。通过结合二氧化碳电还原和氢析出反应(HER)的预测结果,通过机器学习预测的ΔGCO热图。将可用优良电催化剂中的ΔGCO值作为参考,此外,在考虑到CO2电还原过程中伴随的HER反应时,也预测了ΔGH热图。将两个预测热图重叠在一起后,通过重叠筛选出了94种潜在的CO2电还原SACs。这种方法大幅提高了效率,相较于传统的高通量方法。建立的预测模型框架为初步研究提供了有力工具,研究人员可以从预测热图中快速找到潜在的材料如图7所示。例如Co-CS3、Ti-C2S2、Fe-C2S2、V-NP3、Ni-C2NP、Zr-CN2S和Sc-CN3等。这样的机器学习研究为优化SACs催化剂的组成提供了一种高效的方法,将指导CO2还原电催化剂的实验探索。
Figure7.Predicted thermograms of ΔGCO and ΔGH overlap for the designed SACs[30]
图7.设计的SACs的ΔGCO和ΔGH重叠的预测热图[30]
Hirofumi Hazama等人[31]通过构建基于机器学习的模型,加速了锂离子电池电极材料iMOFs的发现过程。通过合成和评估26对Li/iMOF电池,采用不同比例的水相苯二甲酸、2,6-萘二羧酸和4,4’-联苯二甲酸为基础的溶液,我们发现选定的材料混合物产生的电极具有比最佳性能的2,6-萘二羧酸二锂纯材料更高的比容量和更低的极化。借助整理的电化学性能和机器学习插值,我们能够在2,6-萘二羧酸富集的三元图中找到最佳原料溶液混合比例,适用于C/10条件。该预测基于不同iMOFs的X射线衍射图谱,使得能够评估加热温度、材料合成气氛/气体以及合成方法等处理参数,正如通过研究加热温度与不同iMOFs的电化学性能关系所示。此研究还展示了在iMOF合成后准备电极的浆料对电极电化学性能的影响。因此,这些研究表明实验和机器学习相结合,可以加速寻找最佳组成、合成条件和制备过程,以设计新材料,研究过程如图8所示。
李淑媛等[32]研究人员从已发表的关于用金属有机骨架(MOFs)作为催化剂将CO2固定为环状碳酸酯的一百篇相关文献中提取需要的MOFs结构特征和催化活性,构建了一个数据集。选用了SVM、K最近邻分类、决策树、随机梯度下降(SGD)和神经网络这五种机器学习算法对其进行分类器训练,通过集成学习方法将三种分类器组合起来,在训练和测试过程中,SVC、KNN和SGD表现出色,特别是SGD在测试中的准确率高达86.4%,成功预测了1311个新型MOFs的结构如图9所示。结果显示,机器学习模型可以根据其结构特征预测MOF的催化性能。对数据进行了训练,从而预测MOFs的催化性能。在训练和测试过程中,SVC、NN和SGD表现出色,特别是SGD在测试中的准确率高达86.4%。随后进一步运用精确度、召回率和F1分数等指标进行了评估,发现SVC、SGD和NN的精确度均超过92%,召回率为82%。其中,SGD的召回率最高,达到0.864,这意味着86.4%的优秀MOFs也被SGD成功预测出来。通过经过训练的模型进行预测分析,研究团队最终确定了六种最佳金属离子(Mn、V、Cu、Ni、Zr和Y)和四种最佳配体(tactmb、tdcbpp、TCPP、H3L)。这些金属和配体的组合能够生成24种高性能的MOFs。随后,再利用已训练好的模型对这24种MOFs进行了催化性能的预测,结果显示这些材料在固定CO2方面具有强大的催化潜力。通过机器学习探索具有高催化活性的MOFs的基本框架如图10所示。总体而言,机器学习方法在MOFs催化剂方面展现出巨大的潜力。
Figure8.Schematic representation of the MOF optimization procedure including synthesis, evaluation and prediction of machine learning[31]
图8.MOF优化程序的示意图,包括机器学习的综合、评估和预测[31]
Figure9.General catalytic activity of 1311 hypothetical MOFs[32]
图9.1311个假设MOFs的一般催化活性[32]
Figure10.Current working framework for exploring MOFs with high catalytic activity through machine learning[32]
图10.通过机器学习探索具有高催化活性的MOFs的当前工作框架[32]
4. 总结与展望
本篇综述旨在详细介绍了机器学习方法在预测电催化剂性能方面的最新研究进展,并侧重于电催化二氧化碳领域中金属有机框架(MOFs)的应用前景。(1) 首先,全面阐述金属有机框架在电催化还原二氧化碳领域的研究进展,MOFs以其可精确设计的反应活性位点、可变金属离子类型、有机配体结构、不饱和配位位点、多孔结构和可调整的组成结构电催化领域中具有巨大潜力。然后,详细解释了机器学习的核心过程,强调了合适机器学习算法的选择对于准确性至关重要。其中涵盖了多种机器学习算法,包括但不限于人工神经网络、k最近邻算法、决策树和核方法。这些算法可用于构建预测模型,以预测MOFs的电催化性能。(2) 综述了机器学习在金属有机框架电催化领域的应用。通过引入机器学习,能够更迅速的理解电催化剂的性能,特别是在不同条件下的性能预测。这有助于加速MOFs新材料的发现和设计过程。并通过研究表明,机器学习模型能够高度准确地预测实验结果,并捕捉到在不同实验条件下的性能变化趋势。这些模型还可用于快速筛选潜在的电催化还原二氧化碳催化剂。(3) 回顾了机器学习在MOFs电催化还原二氧化碳领域的研究,发现之前研究的催化剂大多为过渡金属和合金材料,而MOFs作为潜在的催化剂材料却受到了较少的关注。这可能是因为MOFs的物理性质更为复杂,需要考虑更多的特征,如带隙、电荷转移和配位数等。然而,随着MOFs电催化领域的不断成熟,引入机器学习为该领域带来了巨大的潜力,有望加速对MOFs电催化性能的理解以及所需催化剂的筛选,这将对可持续能源和环境保护产生积极影响。
尽管在将机器学习应用于电催化的自动发现和开发方面取得了显著进展,但仍然存在一些具有挑战性的问题如下。(1) 构建准确且广泛适用的机器学习模型需要大量高质量的数据集,然而获取这些数据集通常具有文献中数据缺失和成本较高的阻碍。比如,已发表的文献中可能包含了构建机器学习模型所需的关键数据,但催化反应的结果不仅受实验参数(如温度、电解液浓度、压力和通入气体的流速)影响,还受其他可能被忽视的条件敏感,如反应器的种类(如H-cell、double-cell等)和搅拌速度。这种差异性可能会导致无法准确的对不同的已发表结果的比较。为了解决这个问题,更加严格地记录实验中的所有相关数据以及使用的器械和材料来标准化实验条件将变得至关重要。(2) 数据的可靠性也是一个重要问题。因此,在将已发表数据添加到训练集之前,由催化剂领域的专家对这些数据进行关键分析和验证显得至关重要。此外,机器学习模型可能存在偏见,因为通常只有评估指标较高的的结果才会被输出,对于性能较差或者无活性的材料也包含在机器学习训练的有用信息中。针对这一问题,未来广泛采用高通量合成方法更全面地探索高效的催化剂,有望解决对无效信息的收集,包括那些可能在传统实验中被忽略的材料和反应。
NOTES
*通讯作者。