1. 引言
21世纪以来,冠状病毒已导致严重急性呼吸综合征、中东呼吸综合征以及新型冠状病毒感染等疾病的大规模传播,给人类生命健康带来极大威胁,并可能会在未来作为季节性流感定期爆发 [1] 。且毒株的变异使得疫苗产生耐药性,抗冠状病毒药物的研发也更具挑战。
核衣壳蛋白(Nucleocapsid Protein,N蛋白)作为构成具有感染性的病毒颗粒所必需的结构蛋白,在病毒基因组稳定及病毒生命周期调控中,发挥至关重要的作用 [2] [3] 。首先,该蛋白能够识别病毒RNA并将其包装成核糖核蛋白复合体(RNP)以避免RNA讲解,从而稳定病毒基因组。其次,该蛋白具有与RNA发生“液–液”相分离的能力,为病毒复制提供场所,有助于病毒粒的组装 [4] 。此外,N蛋白还能通过与宿主蛋白的结合,调节细胞骨架,参与免疫调节和应激反应等 [5] 。基于上述重要功能,N蛋白被认为是重要的抗冠状病毒药物靶点。
N蛋白结构包括内在无序序列、N端结构域(NTD)、C端结构域(CTD)以及两者之间的柔性链。其中,其NTD可与病毒RNA形成复合物,进而参与病毒复制与组装。靶向NTD的RNA结合位点(NTD-RNA),通过干扰N蛋白与RNA的结合而抑制病毒基因组的组装及复制,已被证明是抗病毒药物研发的创新策略 [6] 。NTD-RNA结合位点的关键残基多数为正电性氨基酸,如A90,R92,K102,R107,Y109,R149等,这些氨基酸的识别为新型靶向NTD-RNA结合位点的抗冠状病毒抑制剂的发现提供了结构基础。
整合药效团模型和分子对接技术的数据库虚拟筛选,即利用针对重要疾病特定靶标生物大分子的三维结构,从现有小分子数据库中,搜寻与靶标生物大分子结合的苗头化合物。近年来,该方法已经成为一种与高通量筛选互补的实用化工具,在创新药物研发中发挥着重要的作用。首先基于含有药效基团信息的药效团模型,保证化合物与药效团模型具有一定的匹配度,同时结合类药性评价预测等方法进行再次筛选,然后基于受体结构特征,运用分子对接方法,确定化合物与受体的结合构象,并评价小分子与受体的结合强度,挑选出苗头化合物,再进行生物活性测试,从而获得具有活性的先导化合物。其目的是从几十到上百万个分子中发现有潜在可能性的化合物,大大降低实验筛选化合物数量,缩短研究周期。
为获得新型N蛋白抑制剂,开发出用于治疗冠状病毒的候选药物,本研究将药效团模型和分子对接研究相结合,提出虚拟筛选方案。利用该方案快速筛选出具有成药潜质的N蛋白抑制剂,为后续的实验研究和临床应用提供参考。
2. 方法
2.1. 药效团模型的构建
2.1.1. NTD-RNA结合位点关键残基的确定
从RCSB PDB数据库(Protein RCSB Data Bank, https://www.rcsb.org/)中下载SARS-CoV-2 (PDB ID: 6VYO),SARS-CoV (PDB ID: 2OFZ),HCoV-OC43 (PDB ID: 4LI4,与AMP的复合结构)以及MERS-CoV (PDB ID: 4UD1)的N-NTD晶体结构,利用PyMOL软件中的align功能进行分析,对比RNA结合位点的差异,得到不同冠状病毒的氨基酸对比序列均方根偏差(RMSD值),并结合各晶体结构的分辨率,确定用于构建药效团模型的最佳受体结构(本研究选用的晶体结构PDB ID:6VYO)。最后,根据NTD与AMP结合的关键残基确定药效团模型构建的活性位点。
2.1.2. 基于受体的药效团模型构建
药效团利用受体蛋白得到可以与之产生相互作用的位点信息,并将其转化为可以用于检索数据库的药效团模型。选取冠状病毒SARS-CoV-2核衣壳蛋白N端RNA结合域为受体蛋白(PDB ID: 6VYO),对其进行预处理并定义为受体分子,运用Discovery Studio (DS)软件将NTD-RNA结合位点关键残基定义为活性位点,利用Pharmacophore模块产生药效团模型,包括氢键供体特征(Hydrogen Bond Donor, HBD)、氢键受体特征(Hydrogen Bond Acceptor, HBA)和疏水特征(Hydrophobic, HY)。初次构建药效团模型时,20个药效团特征元素是一个比较合理的数目,但上述程序运行结束后会产生几百个特征元素,因此需要对药效团模型进行聚类分析。通过对3种特征元素分别进行聚类分析,保留包含7个HBD、5个HBA以及6个HY在内的18个特征元素。
2.1.3. 最优药效团模型的选取及验证
有效的药效团模型一般包含3~5个特征元素 [7] ,收集已报导的NTD-RNA抑制剂作为测试集(图1),包括活性与非活性抑制剂 [8] [9] [10] [11] ,以筛选药物特征元素,并选择最佳药效团模型。利用测试集活性化合物针对18个特征元素做进一步筛选,根据活性化合物和特征元素的匹配热图,选择最优药效特征元素,活性化合物匹配的频次越高,非活性化合物匹配频次越低,则说明该特征元素区分能力强,将其保留并确定为最终药效团模型。
本研究将最终保留的特征元素进行基于配体和基于受体的验证。基于配体的验证:将对NTD-RNA抑制剂与药效团模型匹配,评价活性化合物与药效特征元素的匹配度,以进行基于配体的验证。例如HBA与羰基相对应,HBD与氨基相对应,HY与甲基、乙基、苯环等疏水基团相对应等。
基于受体的验证:构建的药效团模型与N-NTD RNA结合位点关键氨基酸残基进行叠合,以评价两者都匹配情况。例如,HBA和残基上的氨基匹配;HBD和残基上的羰基,羧基,氧原子匹配;HY和苯环或疏水残基构成的疏水口袋匹配等,从而验证药效团所含有的特征元素是否可靠。
图1. 测试集化合物结构式(化合物1-7为非活性化合物;其余为活性化物)
2.2. 小分子片段库的准备
本研究中采用的小分子片段库由百灵威科技有限公司(https://www.jkchemical.com/)提供。小分子片段具有分子量小,无效基团少,配体率高,后续优化空间大等优点,包含34,398个片段分子。为摒除不适合成为药物的分子,利用里宾斯基规则(Lipinski’s Five Rules)对小分子片段库进行类药性初筛 [12] 。
2.3. 蛋白质靶点的准备
蛋白受体采用构建药效团模型所使用的晶体结构(PDB ID: 6VYO)用于虚拟筛选过程中的分子对接,针对受体结构进行删除无关水分子,补全缺失的残基,加上氢原子并添加CHARM力场等预处理,选取RNA结合位点关键残基为活性位点。
2.4. 基于药效团模型和分子对接的虚拟筛选
本研究整合了常用的两种药物筛选策略,首先进行基于药效团模型的初步筛选,再进行基于分子对接的精细筛选。在基于药效团的虚拟筛选中,将最佳药效团模型作为三维提问结构对小分子数据库进行筛选,根据化合物构象与药效团特征匹配叠合程度,计算其拟合值(Fit Values),其值越高,则代表小分子化合物与药效团模型匹配越好。在基于分子对接的虚拟筛选中,使用DS软件中的CDOCKER程序进行半柔性对接,采用高温动力学搜索配体分子的柔性构象空间,考虑到配体分子的自由扭曲和旋转过程,增加了对配体灵活性和多样性的考虑 [13] 。经药效团筛选出的小分子产生不同的构象,并对接到NTD活性位点中,基于NTD-RNA结合关键残基定义活性位点,设置半径为6 Å,其他参数设置为默认值。综合考虑对接打分及结合模式,选取对接打分高于已知抑制剂且与已知抑制剂结合模式相似的分子作为潜在的N蛋白抑制剂。
3. 结果与讨论
3.1. 关键残基的确定
经蛋白晶体结构叠合(紫色:SARS-CoV-2;橙色:SARS-CoV;靛色:HCoV-OC43;绿色:MERS-CoV)发现(图2),四种冠状病毒N-NTD总体结构非常相似,RMSD在0.17~0.76 Å范围内,说明蛋白结构差异较小,也再次证明N蛋白结构的保守性。
Figure 2. N-NTD crystal structure stacking and comparison of specific interacting amino acid residues for AMP of four coronaviruses (SARS-CoV-2, PDB ID: 6VYO, violet; SARS-CoV, PDB ID: 2OFZ, orange; HCoV-OC43, PDB ID: 4LI4, indigo; MERS-CoV, PDB ID: 4UD1, green)
图2. 四种冠状病毒(SARS-CoV-2,PDB ID:6VYO,紫色;SARS-CoV,PDB ID:2OFZ,橙色:HCoV-OC43,PDB ID:4LI4,靛色;MERS-CoV,PDB ID:4UD1,绿色)N蛋白N端晶体结构叠合与AMP相互作用氨基酸残基对比
NTD-RNA结合位点位于N端结构域的核心区域,多数为正电性氨基酸。在HCoV-OC43 NTD与AMP的复合晶体结构中,口袋底部的Ser64骨架羰基氧与碱基氮形成氢键,Tyr126的酚羟基与腺嘌呤环上的氨基形成氢键,Arg164侧链、Phe66与AMP核糖羟基通过氢键相互作用;口袋侧壁上的残基Tyr124的酚羟基通过氢键与AMP腺嘌呤环相互作用,Gly68的主链与AMP的磷酸基团形成氢键,从而进一步稳定结合。通过比较不同冠状病毒中参与AMP结合的残基,发现SARS-CoV-2、SARS-CoV和MERS-CoV 的NTD与HCoV-OC43相似,关键氨基酸并无显著差异,说明这四种冠状病毒与RNA结合的模式相同,并将其与RNA结合的氨基酸残基作为活性位点。
综上验证,根据蛋白解析程度和分辨率,本研究中选用了SARS-CoV-2 N蛋白RNA结合域晶体结构(PDB ID: 6VYO)来构建基于受体的药效团模型及后续的虚拟筛选研究,并保留以上氨基酸残基(Ser51、Phe53、Ala55、Tyr109、Tyr111、Arg149,SARS-CoV-2 N-NTD编号)作为活性位点。
3.2. 药效团模型的选择与验证
基于上述所得到18个药效特征元素,运用11个对RNA结合位点有亲和力和8个NTD无活性的分子组成的测试集,通过探究药效特征元素与活性化合物的匹配频次,进而提取关键药效特征元素以确立药效团模型。匹配结果以热图形式呈现(图3(a)),共垂钓出1个非活性化合物(化合物7)和8个活性化合物(化合物PJ34、8、16、17、5817、ZINC5169973、ZINC257324845、ZINC9913056)。HY4作为必选特征元素,能和8个活性分子以及1个非活性分子匹配;疏水特征HY24和氢键受体特征HBA73、HBA83能够结合7个活性分子,且在此基础上,氢键受体特征并未匹配非活性分子。模型匹配出的化合物中有活性的越多,非活性的越少,表明模型的区分能力越强,以上4个特征元素对活性分子和非活性分子具有良好的区分能力,因此保留疏水特征HY4、HY24,氢键受体特征HBA73、HBA83作为最后的药效团模型,最终结果如图3(b)所示。
Figure 3. The heat map of test set inhibitors matching with preliminary pharmacophore modeling (a) and the best pharmacophore model (Green: HBA; Blue: HY) (b)
图3. 初步药效团模型和测试集活性化合物匹配热图(a)和最佳药效团模型(绿色:氢键受体;蓝色:疏水特征) (b)
Figure 4. Overlay of the best pharmacophore model and the eight active compounds
图4. 最佳药效团模型与8个活性化合物的叠合图
为验证药效团模型是否可靠,将药效团模型特征元素分别与测试集8个活性分子进行匹配分析,如图4所示。化合物PJ34与四个特征元素完全匹配,其主链上的羰基和菲啶酮环上的羰基分别与氢键受体HBA83、HBA73 (绿色)具有较高的匹配度,菲啶环和疏水中心HY4、HY24 (蓝色)特征元素相匹配。PJ34和N-NTD的相互作用模式显示,其菲啶酮环上的羰基氧可以和NTD Ser64上的主链酰胺基之间形成氢键,还可以通过水分子与Phe66的骨架羰基形成氢键,菲啶环则与Tyr124产生堆叠作用。这些参与相互作用的基团和药效团模型匹配的关键基团基本一致,说明最终药效团模型具有可靠性。PJ34作为菲啶类竞争性抑制剂,具有较好的抗病毒活性,以菲啶环为骨架核心设计了一系列衍生物,包括活性化合物8、16、17。化合物16的甲氧基分别与N-NTD Ala50和Tyr111形成氢键,且氟原子还可与Asn153、Asn154形成卤素相互作用。从药效团匹配程度来看,由于化合物8整体骨架过大,菲啶环并没有很好的和疏水特征相匹配,但两个氢键受体都和烷基有较高的匹配度;化合物16和17的菲啶环都和疏水特征高度匹配,HBA83和化合物16的羰基及化合物17的烷基相匹配,HBA73和化合物16的甲氧基及化合物17菲啶环上的乙基匹配。
化合物5817、ZINC9913056、ZINC257324845和ZINC5169973是经Asinex数据库和ZINC数据库筛选得到的活性化合物,它们都具有较高的匹配度,也再次验证了构建的药效团模型具有可靠性,可用于下一阶段的虚拟筛选。HBA83、HBA73分别与化合物5817的主链羰基和嘧啶环上的羰基相匹配,HY4与苯环完全吻合;从ZINC数据库筛选的化合物中,除ZINC5169973骨架较大,HBA83未能匹配以外,其余特征元素都能够和化合物的关键基团相吻合。
Figure 5. The pharmacophore model mapped with the key residues of the NTD-RNA binding pocket
图5. 药效团模型和NTD-RNA结合位点关键氨基酸的匹配情况
在基于受体结构的验证中,药效团模型应与受体结构互补,如在氢键受体特征处提供供体基团,在疏水中心处具有非极性氨基酸组成的疏水空腔。将药效团模型在受体N-NTD RNA结合口袋显示(图5),HBA73指向Tyr111的骨架氨基,HBA83指向Arg149的侧链氨基;两个疏水特征则落入由残基Ala50、Ser51、Phe53、Ala55、Tyr109组成的疏水空腔中,说明药效团与活性位点的特性相吻合。基于上述验证结果,采用基于受体结构构建的药效团模型合理可靠,可用于后续的虚拟筛选。
3.3. 虚拟筛选结果
根据类药规则初筛,得到34,380个小分子。经过验证的药效团模型用于从34,380个小分子中搜索有效的N蛋白抑制剂,可以匹配最佳药效团模型且匹配度大于3.0的有1685个。继续将经药效团模型筛选得到的化合物对接到NTD-RNA结合位点,根据对接结果,选取了打分值高于PJ34 (−CDOCKER_ENGE RY = 9.16887)且骨架新颖的8个化合物进一步进行结合模式研究。
3.4. 分子对接研究
进一步分析了化合物与N蛋白NTD-RNA结合位点的相互作用,选择了2个化合物作为最终的虚拟筛选命中分子,其结构如图6所示,与氢键和疏水相互作用有关的氨基酸残基主要集中在残基Ser51、Arg107、Arg149。通过与药效团的叠合情况可以发现,化合物14,575的苯环和烷基与疏水作用吻合,甲氧基团中的氧和羧基中的氧分别与两个氢键受体相匹配,Fit value为3.1413,相互作用模式分析显示该化合物可以与残基Ser51、Arg107、Tyr111和Arg149形成氢键相互作用,与Ala50、Tyr109和Arg149形成疏水相互作用(图6(a))。化合物33,268在与药效团的匹配中,匹配情况与化合物14,575相似,苯环和烷基与两个疏水作用相匹配,苯环上甲氧基团的氧和杂环上的羰基氧分别与氢键受体相吻合,Fit value为3.3172,在与NTD的相互作用中羰基氧与关键残基Ser51、Tyr111和Arg149形成氢键相互作用,与Ala50、Tyr109、Arg149等形成广泛的疏水相互作用(图6(b))。且2个化合物分子的相互作用模式与PJ34相似,这表明候选化合物可作为潜在的N蛋白抑制剂。
Figure 6. Compound 14,575 (a) and compound 33,268 (b) interaction modes with NTD and pharmacophore matching patterns
图6. 化合物14,575 (a)和化合物33,268 (b)与NTD相互作用模式及药效团匹配模式
4. 结论
冠状病毒N蛋白作为多功能保守蛋白,是抗病毒药物的关键靶点,小分子抑制剂因其渗透率高,储存及运输成本较低等优点已成为研发热点。利用虚拟筛选策略可以从大量的有机化合物中有效地遴选出理论苗头化合物,避免盲目的活性筛选。本文基于N蛋白NTD-RNA结合位点构建了一个基于受体结构的药效团模型,包含两个疏水作用和两个氢键受体,验证结果表明该模型具有较高的置信度。将药效团模型作为筛选条件对小分子片段库进行搜索,结合分子对接方法,从小分子片段库中鉴定出8个骨架新颖的N蛋白抑制剂。根据结合模式分析选择了2个化合物作为最终命中分子,代表性化合物的结合模式可以与NTD-RNA关键残基形成相互作用,与药效团模型具有良好的匹配度,且分子对接打分值高于已知的抑制剂,可为新型N蛋白抑制剂的开发提供研究思路及理论参考。
NOTES
*通讯作者。