乙烯对植物的生长发育具有重要的调节作用,尤其在植物抵抗逆境胁迫过程中扮演着重要角色。ACO1 (1-aminocyclopropane-1-carboxylate oxidase 1)是乙烯合成过程中的一个限速酶,对乙烯的生物合成具有调控作用。菜籽油是我国居民的主要植物食用油之一,提高油菜抗逆性和产品品质是保证我国植物油持续供应的重要育种环节。本文利用生物信息学的方法,对油菜ACO1基因家族进行全基因组鉴定,并从基因的基本信息、蛋白质的亚细胞定位、保守结构域、蛋白质高级结构以及进化关系等方面对油菜ACO1基因家族进行了分析研究。结果显示,在油菜基因组中,ACO1基因家族包含7个基因位点,其中1个为不编码假基因,其余6个基因位点各编码1个蛋白质,这些基因在A基因组和C基因组上都存在,编码的蛋白质均定位于细胞质中。油菜ACO1蛋白质序列长度均为310AA,其氨基酸组成差异较小,均属于PLN02403超家族,行使氨基环丙烷羧酸氧化酶的功能。在油菜ACO1蛋白质的二级结构中, α-螺旋和 β-折叠都较多, α-螺旋数量在11~13个之间, β-折叠的数量在13~14个之间,蛋白质序列中间段的二级结构差异极其微小,为保守区,而N端和C端的二级结构差异较中间段的大,或许在功能上有一定的差异。同源建模法所得到的空间结构中N端和中间部分的空间结构差异微小,较保守,而C末端序列的空间结构差异较明显,为可变区,可能是活性位点,与酶的催化活性有关。 Ethylene plays an important role in regulating the growth and development of plants, especially in the process of plant resistance to adversity stress. ACO1 (1-aminocyclopropane-1-carboxylate oxidase 1) is a rate-limiting enzyme in the process of ethylene synthesis and has a regulatory effect on ethylene biosynthesis. Rapeseed oil is one of the main vegetable edible oils for Chinese residents, and improving the stress-resistance and product quality of rapeseed is an important breeding step to ensure the continuous supply of vegetable oil in our country. This article uses bioinformatics methods to identify the ACO1 gene family members in Brassica napus L., and analyzes them from the basic information of genes, protein subcellular location, conserved domains, protein structure, and evolutionary relationships. The results showed that the ACO1 gene family in Brassica napus L. contains 7 genetic locus, one of which is a non-coding pseudogene, and the remaining 6 gene loci each encode a protein. These genes exist on both the A genome and the C genome. The encoded proteins are all located in the cytoplasm. The length of ACO1 protein sequence is all 310 amino acid (AA), and the difference of their amino acid composition is small, all belong to the PLN02403 superfamily, and perform the function of aminocyclopropane carboxylic acid oxidase. In the secondary structure of rape ACO1 proteins, there are more α-helices and β-sheets. The number of α-helices is between 11 to 13, and the number of β-sheets is between 13 to 14. The secondary structure difference in the middle segment of the sequence is extremely small, which is a conserved region, while the secondary structure difference between the N-terminal and C-terminal is larger than that of the middle segment, and there may be a certain difference in function. The spatial structure difference between the N-terminal and the middle part of the spatial structure obtained by the homology modeling method is small and conservative, while the spatial structure of the C-terminal sequence is more obvious. It is a variable region, which may be the active site, related to the catalytic activity of the enzyme.
乙烯对植物的生长发育具有重要的调节作用,尤其在植物抵抗逆境胁迫过程中扮演着重要角色。ACO1 (1-aminocyclopropane-1-carboxylate oxidase 1)是乙烯合成过程中的一个限速酶,对乙烯的生物合成具有调控作用。菜籽油是我国居民的主要植物食用油之一,提高油菜抗逆性和产品品质是保证我国植物油持续供应的重要育种环节。本文利用生物信息学的方法,对油菜ACO1基因家族进行全基因组鉴定,并从基因的基本信息、蛋白质的亚细胞定位、保守结构域、蛋白质高级结构以及进化关系等方面对油菜ACO1基因家族进行了分析研究。结果显示,在油菜基因组中,ACO1基因家族包含7个基因位点,其中1个为不编码假基因,其余6个基因位点各编码1个蛋白质,这些基因在A基因组和C基因组上都存在,编码的蛋白质均定位于细胞质中。油菜ACO1蛋白质序列长度均为310AA,其氨基酸组成差异较小,均属于PLN02403超家族,行使氨基环丙烷羧酸氧化酶的功能。在油菜ACO1蛋白质的二级结构中,α-螺旋和β-折叠都较多,α-螺旋数量在11~13个之间,β-折叠的数量在13~14个之间,蛋白质序列中间段的二级结构差异极其微小,为保守区,而N端和C端的二级结构差异较中间段的大,或许在功能上有一定的差异。同源建模法所得到的空间结构中N端和中间部分的空间结构差异微小,较保守,而C末端序列的空间结构差异较明显,为可变区,可能是活性位点,与酶的催化活性有关。
油菜,ACO1基因,基因家族,高级结构
Chenlin Zhu
College of Life Sciences, Zhejiang Normal University, Jinhua Zhejiang
Received: Feb. 28th, 2024; accepted: Apr. 22nd, 2024; published: Apr. 30th, 2024
Ethylene plays an important role in regulating the growth and development of plants, especially in the process of plant resistance to adversity stress. ACO1 (1-aminocyclopropane-1-carboxylate oxidase 1) is a rate-limiting enzyme in the process of ethylene synthesis and has a regulatory effect on ethylene biosynthesis. Rapeseed oil is one of the main vegetable edible oils for Chinese residents, and improving the stress-resistance and product quality of rapeseed is an important breeding step to ensure the continuous supply of vegetable oil in our country. This article uses bioinformatics methods to identify the ACO1 gene family members in Brassica napus L., and analyzes them from the basic information of genes, protein subcellular location, conserved domains, protein structure, and evolutionary relationships. The results showed that the ACO1 gene family in Brassica napus L. contains 7 genetic locus, one of which is a non-coding pseudogene, and the remaining 6 gene loci each encode a protein. These genes exist on both the A genome and the C genome. The encoded proteins are all located in the cytoplasm. The length of ACO1 protein sequence is all 310 amino acid (AA), and the difference of their amino acid composition is small, all belong to the PLN02403 superfamily, and perform the function of aminocyclopropane carboxylic acid oxidase. In the secondary structure of rape ACO1 proteins, there are more α-helices and β-sheets. The number of α-helices is between 11 to 13, and the number of β-sheets is between 13 to 14. The secondary structure difference in the middle segment of the sequence is extremely small, which is a conserved region, while the secondary structure difference between the N-terminal and C-terminal is larger than that of the middle segment, and there may be a certain difference in function. The spatial structure difference between the N-terminal and the middle part of the spatial structure obtained by the homology modeling method is small and conservative, while the spatial structure of the C-terminal sequence is more obvious. It is a variable region, which may be the active site, related to the catalytic activity of the enzyme.
Keywords:Brassica napus L., ACO1 Gene, Gene Family, Advanced Structure
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
乙烯是一种挥发性植物激素,它能够调节植物的种子萌发、花和叶的衰老、果实的成熟等生长发育过程,并能够对逆境做出胁迫反应。乙烯还可以作为信号分子,在植物生命周期的某些阶段诱导基因表达的特定变化,因此,植物能否在时间和空间上精确控制乙烯的生产水平是至关重要的。在乙烯合成过程中,ACC合成酶(ACS)首先催化S-腺苷甲硫氨酸(SAM)形成1-氨基环丙烷-1-羧酸(ACC),ACC氧化酶(ACO)再催化ACC生成乙烯 [
ACO作为一种只参与乙烯合成途径的酶,已从许多植物中获得,如番茄 [
有研究表明,水杨酸 [
由ACO相关理论指导的生物技术在植物中的应用很广泛,其中之一是在果实成熟和采后贮藏时减少乙烯的产生。反义RNA技术下调ACO的表达,从而降低乙烯产量,进而控制果实的成熟和采后的贮藏,而这一成果已被广泛应用于延缓果实成熟、延长果实的货架期以及蔬菜营养组织的保质期。用转基因的方法沉默ACO的表达在石斛兰、石竹、康乃馨等花卉栽培中也有很大的应用 [
油菜是我国的四大油料作物之一,油菜籽的含油量较高,并且具有丰富的营养价值,是我国的主要油料作物之一。除此之外,油菜在化工、医药、纺织和造纸业等方面也有很大的用途。虽然我国是油菜籽生产大国,但是近年来国内植物油的生产量还是不能满足消费所需的量,还有很大一部分需要从国外进口。因此,如何在低成本条件下,通过提高油菜的抗逆性保证其单产水平提高,进而提高油菜生产总量至关重要 [
植物ACO基因家族包含多个亚家族,如番茄ACO基因家族包含ACO1、ACO2和ACO3亚家族 [
本研究用生物信息学的技术和方法,对油菜ACO1基因家族进行全基因组鉴定,并从基因的基本信息、蛋白质的亚细胞定位、保守结构域、蛋白质高级结构以及进化关系等方面对油菜ACO1基因家族进行研究,希望对油菜的育种提供参考。
在NCBI (https://www.ncbi.nlm.nih.gov/)的Gene数据库中搜索油菜ACO1 (1-aminocyclopropane-1-carboxylate oxidase 1)基因,共获得7个成员,点击每一条Gene ID以获得各个成员的基本信息,如基因定位、外显子数目、所编码的蛋白质长度等,并下载相应的蛋白质序列。
分别利用Plant-mPLoc、Psort、TargetP-2.0、CELLO v.2.5和Euk-mPLoc 2.0 server共同分析ACO1蛋白质家族各成员的亚细胞定位,采用统计学原则获得一致性结论。
打开DNAMAN软件,点击Multiple Sequence Alignment,在默认参数下对油菜ACO1蛋白质家族成员进行多序列比对;进一步生成距离进化树状图并显示为有根树(Rooted Tree)。
在NCBI中搜寻并下载十字花科的甘蓝、白菜、芥菜、萝卜、花菜,茄科的番茄、烟草,蔷薇科的苹果的ACO1氨基酸序列,把这些同源蛋白氨基酸序列进行比对并构建进化树。
进入NCBI中的保守结构域分析页面,点击Batch CD-Search,复制各条蛋白质序列于粘贴框内,提交数据获得预测结果并绘图。
利用PRABI (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)中的SOPMA工具预测油菜ACO1蛋白质家族成员的二级结构。通过同源建模法进行蛋白质的三级结构预测,所用软件为SWISS-MODEL (https://swissmodel.expasy.org/interactive),并对所建模的结构进行可靠性评价。
通过搜索NCBI基因数据库,共获得了7个ACO1基因家族成员,分析可知(见表1),其中有1个为假基因(LOC106363716),不编码蛋白质,定位于C1染色体上;另外6个基因分别编码6条油菜ACO1蛋白质序列,其中LOC106436068定位于A9染色体上、LOC106365298定位于C8染色体上,然而LOC106400855、LOC106376208、LOC106374519和LOC111210370这4个基因的染色体定位尚不清楚。所有6个编码基因均有3个外显子。由这些基因编码得到的6个蛋白质中,2个为ACO1,4个为ACO1类似物,但这6个蛋白质的序列长度(Length)均为310AA,长度一致。
基因号 | 蛋白序列 | 染色体定位 | 外显子 | 长度 | 蛋白质描述 |
---|---|---|---|---|---|
LOC106436068 | XP_013732481.1 | A9NC_027774.2 (39021231..39023906) | 3 | 310 aa | ACO1 |
LOC106365298 | XP_013660201.1 | C8NC_027765.1 (42110823..42113479) | 3 | 310 aa | ACO1 |
LOC106400855 | XP_013696699.1 | UnNW_019168613.1 (81934..83382) | 3 | 310 aa | ACO1-like |
LOC106376208 | XP_013671730.2 | UnNW_019169472.1 (1723..3258) | 3 | 310 aa | ACO1-like |
LOC106374519 | XP_013669979.1 | UnNW_019168571.1 (355287..356788) | 3 | 310 aa | ACO1-like |
LOC111210370 | XP_022566418.1 | UnNW_019168571.1 (364398..365937) | 3 | 310 aa | ACO1-like |
LOC106363716 | 假基因 | C1 | - | - | - |
表1. 油菜ACO1基因家族成员基本信息
注:Un (Unplaced Scaffold):表示基因序列的染色体定位还不清楚;ACO1: 1-aminocyclopropane-1-car boxylate oxidase 1
蛋白质序列 | Psort | TargetP-2.0 | CELLO v.2.5 | Euk-mPLoc 2.0 server | Plant-mPLoc | 结论 |
---|---|---|---|---|---|---|
XP_013732481.1 | cyto: 8, nucl: 3, chlo: 1, cysk: 1, golg: 1 | Other:2 | Cyto:3.501 | Cyto | Cyto | Cyto |
XP_013660201.1 | cyto: 8, nucl: 4, chlo: 1, cysk: 1 | Other:2 | Cyto:2.336, Nucl:2.108 | Cyto | Cyto | Cyto |
XP_013696699.1 | cysk:12, nucl: 2 | Other:2 | Cyto:2.891 | Cyto | Cyto | Cyto |
XP_013671730.2 | cysk:12, nucl: 2 | Other:2 | Cyto:2.941 | Cyto | Cyto | Cyto |
XP_013669979.1 | cysk:12, nucl: 2 | Other:2 | Cyto:3.014 | Cyto | Cyto | Cyto |
XP_022566418.1 | cysk:12, nucl: 2 | Other:2 | Cyto:3.029 | Cyto | Cyto | Cyto |
表2. 油菜ACO1蛋白质家族成员的亚细胞定位
注:Cyto:细胞质;Nucl:细胞核;Chlo:叶绿体;Cysk:细胞骨架;Golg:高尔基体;Other:其他部位(除叶绿体、线粒体、分泌蛋白外);TargetP-2.0、CELLO v.2.5的数值:可靠性级别
综合5个在线分析软件得出的ACO1蛋白质家族各个成员的亚细胞定位结果(表2),Psort分析结果为XP_013732481.1和XP_013660201.1这两种蛋白质定位于细胞质中,其他的四个蛋白质定位于细胞骨架上;而利用TargetP-2.0预测出所有蛋白质均定位于除叶绿体、线粒体、分泌蛋白外的其他部位,该软件是基于蛋白质序列的N端信号,利用神经网络的方法来预测的;CELLO v.2.5、Euk-mPLoc 2.0 serve和Plant-mPLoc这三个软件分析结果表明,6条蛋白质序列均定位于细胞质中,这与TargetP-2.0预测的结果相符合。按照统计学中少数服从多数原则,油菜ACO1蛋白质家族各成员大概率定位在细胞质内。
图1. 油菜ACO1蛋白质家族的多序列比对
图2. 油菜ACO1蛋白质家族进化树
利用DNAMAN对油菜ACO1蛋白质家族的所有蛋白质进行多序列对比,从比对结果(图1)来看,这6个蛋白质序列的平均相似性为95.38%,序列分化较小,总体相似性极高,表明它们执行的功能都非常相似。然后根据它们的同缘关系的远近生成有根进化树(图2),通过分析所得的有根进化树,将6个蛋白质分为两个大分支,分别为CLASSI和CLASSII,CLASSI包含XP_013732481.1和XP_013660201.1两个蛋白质,CLASSII包含XP_013696699.1、XP_013671730.2、XP_013669979.1、XP_022566418.1这4个蛋白质。在进化树的每一个大分支里,都既包含A基因组表达的蛋白质序列,又包含C基因组表达的蛋白质序列,而甘蓝型油菜是由白菜(AA, n = 10)与甘蓝(CC, n = 9)通过自然种间杂交后双二倍化进化而来的一种复合种,表明油菜ACO1所包含的基因在最早期就已经出现了分化。
以XP_013660201.1序列对非冗余蛋白质数据库进行搜索,下载十字花科中甘蓝、白菜、拟南芥、萝卜、花菜、芥菜,茄科的番茄、烟草,蔷薇科的苹果的ACO1氨基酸序列,把这些同源蛋白氨基酸序列进行比对,结果显示,这些序列的相似性达到72.44%,将这些序列构建进化树,结果(图3)表明,甘蓝型油菜与甘蓝、白菜和萝卜的进化距离最近,首先聚为一类,其次与拟南芥为一类,均为十字花科植物,分为一大类Class I;与十字花科的芥菜、花菜,蔷薇科的苹果,茄科的番茄、烟草的进化距离较远,分为另一大类Class II。
图3. 不同物种ACO1蛋白的氨基酸序列的进化树
通过分析油菜ACO1家族6个蛋白质序列的结构域所对应的超家族(superfamily),结果表明(表3、图4),这6条蛋白质序列的保守结构域在氨基酸序列上的位置都为9~309,都属于PLN02403超家族,行使相似的功能。PLN02403超家族结构域内还含有两个结构域,分别为2OG-FeII_Oxy和PcbC。
2OG-FeII_Oxy即2OG-Fe (II)加氧酶超家族,包含2-氧戊二酸酯和Fe2+依赖性加氧酶超家族的成员 [
PcbC即异青霉素N合酶和相关的双加氧酶超家族 [
Query | From | To | E-Value | Bitscore | Accession | Short name | Super family |
---|---|---|---|---|---|---|---|
XP_013660201.1 | 9 | 309 | 0 | 596.453 | PLN02403 | PLN02403 | cl31875 |
XP_013669979.1 | 9 | 309 | 0 | 576.037 | PLN02403 | PLN02403 | cl31875 |
XP_013671730.2 | 9 | 309 | 0 | 581.815 | PLN02403 | PLN02403 | cl31875 |
XP_013696699.1 | 9 | 309 | 0 | 581.045 | PLN02403 | PLN02403 | cl31875 |
XP_013732481.1 | 9 | 309 | 0 | 589.904 | PLN02403 | PLN02403 | cl31875 |
XP_022566418.1 | 9 | 309 | 0 | 581.430 | PLN02403 | PLN02403 | cl31875 |
表3. 油菜ACO1蛋白质家族的保守结构域
图4. 油菜ACO1蛋白质家族的保守结构域
Protein sequence蛋白序列 | Alpha helixα螺旋 | Extended strand延伸链 | Beta turn β-转角 | Random coil随机卷曲 |
---|---|---|---|---|
XP_013732481.1 | 115 : 37.10% | 60 : 19.35% | 23 : 7.42% | 112 : 36.13% |
XP_013660201.1 | 114 : 36.77% | 61 : 19.68% | 19 : 6.13% | 116 : 37.42% |
XP_013671730.2 | 120 : 38.71% | 57 : 18.39% | 17 : 5.48% | 116 : 37.42% |
XP_022566418.1 | 120 : 38.71% | 58 : 18.71% | 20 : 6.45% | 112 : 36.13% |
XP_013696699.1 | 115 : 37.10% | 58 : 18.71% | 20 : 6.45% | 117 : 37.74% |
XP_013669979.1 | 124 : 40.00% | 55 : 17.74% | 25 : 8.06% | 106 : 34.19% |
表4. 油菜ACO1蛋白质家族的二级结构预测
注:“:”前表示氨基酸数,“:”后表示这些氨基酸占总氨基酸数的百分比。
利用PRABI中的SOPMA工具对油菜ACO1蛋白质家族成员进行二级结构分析,结果表明(表4、图5),ACO1蛋白质家族的二级结构中α-螺旋和β-折叠较多,为α + β蛋白,各个蛋白质二级结构组成上相似性较高,α-螺旋的个数在11~13个之间,其中XP_013732481.1、XP_013696699.1、XP_013671730.2和XP_022566418.1这4个蛋白质含11个,XP_013669979.1含12个,XP_013660201.1含13个。β-折叠的个数在13~14个之间,其中XP_013732481.1、XP_013660201.1和XP_022566418.1含14个,其余的都含有13个。每个β-转角的氨基酸数都不超过4个,因此都不会形成环(Loop)结构。对比各蛋白质的二级结构预测图可以发现蛋白质序列中间段的二级结构差异极其微小,保守性高,为保守区,而N端和C端的二级结构差异较中间段的大,或许功能上有一定的差异。
图5. 油菜ACO1蛋白质家族的二级结构预测图
图6. 油菜ACO1蛋白质家族的三级结构
利用SWISS-MODEL软件对6条编码蛋白质进行三级结构建模,本次建模所选的模板序列为5gja.1.A,是拟南芥的一条ACO2蛋白质序列,与每条蛋白质序列的相似性在47%~51%之间,具有可靠的同源性关系,以此为参考模板建模获得各个蛋白的三级结构(图6)并下载为PDB格式,用视图软件RasMol打开,通过观察比对发现各个蛋白质的三级结构的N端和中间部分的空间结构均非常相似,C末端部分(275A之后)的空间结构有所不同,XP_013732481.1、XP_013671730.2和XP_013696699.1的三级结构的重叠性极高,非常相似,XP_022566418.1和XP_013669979.1的空间结构也极其相似,XP_013660201.1的三级结构与其他蛋白的都略有不同,因此,ACO1的C端部分为可变区,或许指导各蛋白质行使不同的功能。
利用VERIFY3D和Procheck两个在线分析软件对建模的结果进行质量评估,根据VERIFY3D评价所得的结果(表5)表明,每个蛋白质中平均3D-1D得分 ≥ 0.2的氨基酸残基占建模氨基酸总数的百分比都大于80%,多数高达90%以上,说明此次建模所得的空间结构较为稳定,可靠性高。根据Procheck程序对建模结果的拉氏散点图检测结果(表6)可知,每个蛋白质中位于最支持区域的氨基酸都占总氨基酸数的92.5%以上,没有氨基酸位于不允许区,表明此模型结构符合立体化学规则,建模结果较理想。
蛋白质序列 | VERIFY3D |
---|---|
XP_013732481.1 | 93.52% |
XP_013660201.1 | 95.22% |
XP_013696699.1 | 89.38% |
XP_013671730.2 | 91.10% |
XP_013669979.1 | 91.50% |
XP_022566418.1 | 92.52% |
表5. VERIFY3D程序的建模质量评估结果
注:百分比数代表平均3D-1D得分 ≥ 0.2的氨基酸残基占氨基酸总数的百分比。
残基分布区 | XP_013732481.1 | XP_013660201.1 | XP_013696699.1 | XP_013671730.2 | XP_013669979.1 | XP_022566418.1 |
---|---|---|---|---|---|---|
最支持区域 (A, B, L) | 92.6% | 92.5% | 92.6% | 92.5% | 94.2% | 94.2% |
额外允许区 (a, b, l, p) | 7.4% | 7.5% | 7.0% | 7.1% | 5.0% | 5.1% |
勉强允许区(−a, −b, −l, −p) | 0.0% | 0.0% | 0.4% | 0.4% | 0.8% | 0.8% |
表6. Procheck程序的建模质量评估结果
注:该表中的各个区域指建模评估中拉氏散点图上的不同区域,百分比数指每个区域的氨基酸数占全部氨基酸的百分比。
本研究用生物信息学的方法对甘蓝型油菜ACO1基因家族进行了挖掘并对蛋白质高级结构、保守结构域、亚细胞定位、进化关系等方面进行了对比分析,结果发现,油菜ACO1基因家族成员存在于多条染色体上,在A基因组和C基因组中都有,共挖掘出7条基因,其中有1条为假基因,另外6条分别编码6个蛋白质,氨基酸序列长度均为310AA。ACO1的亚细胞定位一直存在争议 [
祝晨琳. 油菜ACO1基因家族成员及其蛋白质高级结构比较Comparison of ACO1 Gene Family Members and Their Protein Higher Structure in Brassica napus L.[J]. 生物医学, 2024, 14(02): 331-341. https://doi.org/10.12677/hjbm.2024.142037
https://doi.org/10.1146/annurev.pp.35.060184.001103
https://doi.org/10.1104/pp.109.4.1435
https://doi.org/10.1016/j.phytochem.2009.01.002
https://doi.org/10.1105/tpc.105.040303
https://doi.org/10.1016/j.scienta.2022.111061
https://doi.org/10.1016/S0176-1617(96)80151-9
https://doi.org/10.3390/molecules19068350
https://doi.org/10.1016/j.bbrc.2018.06.036
https://doi.org/10.1016/j.molp.2016.06.018
https://doi.org/10.3389/fpls.2019.00695
https://doi.org/10.1007/s11248-020-00209-8
https://doi.org/10.1042/bj20031762
https://doi.org/10.3390/molecules24061128
https://doi.org/10.1073/pnas.0811660106