为准确评价大豆蛋白质含量在不同环境的稳定性和适应性,本研究应用GGE双标图对2002年到2011年种植于哈尔滨试验点的147个F10-19代重组自交系材料及其亲本Charleston (♀)和东农594 (♂)的10个年份(环境)蛋白数据进行分析和评价。结果表明,第1主成分解释了37.7%的效应,第2主成分解释了15.3%的效应,第1主成分和第2主成分共解释G与GE互作效应的53.0%。10个环境被分为4个区域,第一个区域主要有2003HRB环境,株系80的蛋白质含量表现最好;第二个区域有2002HRB、2004HRB、2006HRB和2008HRB共4个环境,株系24的蛋白质含量表现最好;第三个区域主要有2011HRB,株系10的蛋白质含量表现最好。第四个区域有2007HRB、2009HRB和2010HRB,株系23位于顶点,蛋白质含量表现最好。通过环境的代表性和鉴别能力分析,得出2008HRB最具有代表性,2002HRB鉴别能力最好。在连续10年哈尔滨环境下,环境因子对蛋白质含量的影响顺序为:日照时数 > 降水量 > 平均温度。该结果对多环境下指导大豆栽培及地区适宜气象因子的评估具有重要意义。 To increase the evaluation accuracy of stability and adaptability of soybean protein content in multiple environments, GGE-biplot method was used to analyze and evaluate the recombinant inbred lines (RILs) dataset including 147 F10-19RILs and their parents Charleston (♀) and Dongnong 594 (♂) planted in Harbin from 2002 to 2011 year. The results showed that the first principal component explained 37.7% effect, the second principal components explained 15.3% effect, and PC1 and PC2 were explained totally 53.0% on interaction effects. Ten environments could be divided into four groups, 2003HRB was in the first group, and Line No. 80 was the best inside the group; 2002HRB, 2004HRB, 2006HRB and 2008HRB were in the second group, and Line No. 24 was the best inside the group; 2011HRB was in the third group, and Line No. 10 was the best inside the group. 2007HRB, 2009HRB and 2010HRB were in the second group, and Line No. 23 was the best inside the group. Based on discrimination ability and environmental representativeness, 2008HRB was the best representative environment and 2002HRB was the best discriminating ability envi-ronment. Based 10 years data in Harbin environment, environmental factors impacted on the soy-bean protein content are sequenced as: Sunshine > precipitation > average temperature. The results were important implications for guiding soybean cultivation in multiple environments and evaluation of the suitable environmental factors.
韩雪1,齐慧冬2,齐照明2*,陈庆山2
1北大荒垦丰种业有限公司,黑龙江 哈尔滨
2东北农业大学,黑龙江 哈尔滨
收稿日期:2018年7月4日;录用日期:2018年7月19日;发布日期:2018年7月26日
为准确评价大豆蛋白质含量在不同环境的稳定性和适应性,本研究应用GGE双标图对2002年到2011年种植于哈尔滨试验点的147个F10-19代重组自交系材料及其亲本Charleston (♀)和东农594 (♂)的10个年份(环境)蛋白数据进行分析和评价。结果表明,第1主成分解释了37.7%的效应,第2主成分解释了15.3%的效应,第1主成分和第2主成分共解释G与GE互作效应的53.0%。10个环境被分为4个区域,第一个区域主要有2003HRB环境,株系80的蛋白质含量表现最好;第二个区域有2002HRB、2004HRB、2006HRB和2008HRB共4个环境,株系24的蛋白质含量表现最好;第三个区域主要有2011HRB,株系10的蛋白质含量表现最好。第四个区域有2007HRB、2009HRB和2010HRB,株系23位于顶点,蛋白质含量表现最好。通过环境的代表性和鉴别能力分析,得出2008HRB最具有代表性,2002HRB鉴别能力最好。在连续10年哈尔滨环境下,环境因子对蛋白质含量的影响顺序为:日照时数 > 降水量 > 平均温度。该结果对多环境下指导大豆栽培及地区适宜气象因子的评估具有重要意义。
关键词 :大豆,蛋白质含量,环境因子,GGE双标图
Copyright © 2018 by authors and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
大豆发源地于亚洲,是重要的粮食作物之一,大豆的蛋白质提供了人体蛋白的主要来源。含有20多种自然界普遍存在的氨基酸,营养价值比较高,与动物蛋白相比不含有胆固醇,为很好的保健食品,豆类蛋白还具有降血压,降血脂,减少心脑血管病以及促进营养吸收等功效 [
目前,基于环境因子与表型的分析研究相对较少,大多数都是研究QTL与环境的互作分析效应,研究多采用QTL与环境互作的分析软件 [
近些年来,GGE-Biplot双标图分析方法应用广泛。在小麦 [
本研究利用GGE双标图分析软件(GGE biplot)针对以Charleston和东农594为亲本的147个F10-19重组自交系群体,分析其连续10年的蛋白质含量数据。揭示RIL群体147个株系在多环境下的品质性状表现及其稳定性,同时评价环境的区分力与代表性,能够为大豆栽培生产提供指导性依据。
本研究以美国半矮杆品种Charleston (♀)和东农594 (♂)构建的RIL群体繁殖得到的147个F10-19代重组自交系为试验材料,其中Charleston是高油材料,其油分含量为22.7%;东农594是高蛋白材料,蛋白质含量为44.3%。
将Charleston (♀)和东农594 (♂)及其147个F10-19代重组自交系材料从2002年到2011年种植于黑龙江省农垦科研育种中心试验地(哈尔滨,126˚38'E,45˚45'N)。2002~2006年间种植两次重复,2007~2011年间种植三次重复,田间管理同常规大田。
通过FOSS-1241红外线谷物分析仪对RIL群体147个F10-19代重组自交系进行蛋白含量测定,每个株系随机取5株,保证其在安全含水量范围内测定蛋白质含量,取其均值作为该行的蛋白质含量,三次重复种植的均值作为该环境下蛋白质含量表型值。
平均温度、降水量和日照时数等主要环境因子是影响大豆蛋白含量的主要因素。《中国地面气候资料日值数据集数据格式》统计记录哈尔滨10年(2002年~2011年)的环境因子平均温度、降水量和日照时数等数据。
采用GGE-Biplot软件 [
GGE双标图采用平均环境坐标(Average environment coordinate, ACE)法能够使两向数据表中的信息清晰、全面的显示出来。AEC是用圆圈表示的环境平均值,AEC的PC1和PC2得分分别等于所有指标的PC1和PC2的平均得分。AEA (Average-environment axis)即AEC的横轴,通过原点和AEC,AEC的纵轴就是通过原点垂直于AEA的直线。GGE双标图上同时给出蛋白质性状和环境图标,可更直观地进行蛋白质性状品质的分析,AEA表示大豆的平均含油量,箭头方向为正,各株系在AEA上的投影越靠右,其蛋白质品质越高,纵轴代表了株系的稳定性,箭头方向株系的稳定性差,AEA上垂线的长短显示稳定性的大小,长短越短,稳定性越好。
将GGE双标图结果中显示出的各环境最优定点点用直线连接起来,形成一个多边形囊括所有环境。以原点为顶点向各边出发,作各边垂线将图分为若干区域,每个环境自然落于某个区域内,靠近原点的株系对环境变化迟钝,而“顶点”所代表的株系是该区域内在每个环境都表现最优的株系。并解析大豆蛋白质性状品质在哈尔滨10年环境受主要环境因子(平均温度、降水量和日照时数)的影响,找出影响大豆蛋白质含量的最优环境因子。
对哈尔滨10年(2002~2011年)间的环境因子数据进行分析,其中,大豆生育期降雨量的变化范围为356.9 mm~529.2 mm,其中2002年的降雨量较高,其余年份近于平稳;生育期日照时数的变化范围为1104 h~1439.5 h,2003年日照时数最少为1104 h。2002和2004年日照时数偏高,在1400 h左右,其余年份稳定在1300 h左右;生育期的平均气温较为平稳,在17℃到18℃之间,变动幅度接近于1℃ (表1)。
重组自交系群体蛋白质性状表型分析列于表2中。母本Charleston的蛋白质含量变化范围在38.06%到42.38%之间,父本东农594的蛋白质含量变化范围在41.80%到43.94%之间。群体的均值变化范围在36.24%到42.24%之间。该群体在各年份/环境的变幅较大,适合做QE分析。
通过分析哈尔滨10年10个环境得到GGE双标图,其中横坐标为表型值增大的方向,纵向坐标轴
2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | |
---|---|---|---|---|---|---|---|---|---|---|
生育期降雨量GP (mm) | 529.2 | 466.6 | 447.8 | 408.6 | 454.6 | 356.9 | 368 | 441.3 | 455.5 | 401 |
生育期日照时数ASH (h) | 1377.3 | 1104 | 1439.5 | 1233 | 1347.9 | 1385.9 | 1318.2 | 1316.1 | 1308.6 | 1298 |
生育期平均气温AT (℃) | 16.9 | 17.4 | 18.1 | 17.5 | 17.8 | 18.1 | 18.2 | 17.4 | 18.3 | 17.9 |
表1. 哈尔滨2002~2011年环境因子
亲本Parent | RIL重组自交系RIL population | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
环境 | 东农594 | Charleston | 均值 | 标准差 | 变异系数 | 偏度 | 峰度 | 最小值 | 最大值 | 变幅 |
Environment | dongnong594 | Charleston | Average | SD | CV | Steve | Kurt | Min | Max | Range |
2002HRB | 42.38 | 40.35 | 39.30 | 1.56 | 0.04 | 0.52 | 0.80 | 35.75 | 44.45 | 8.71 |
2003HRB | 42.95 | 41.21 | 36.24 | 2.52 | 0.07 | 0.04 | 0.52 | 29.86 | 43.55 | 13.69 |
2004HRB | 43.94 | 42.38 | 36.31 | 1.61 | 0.04 | 0.70 | 1.40 | 31.48 | 42.09 | 10.61 |
2005HRB | 42.68 | 41.21 | 39.66 | 1.48 | 0.04 | 0.74 | 0.38 | 36.84 | 44.71 | 7.87 |
2006HRB | 41.80 | 40.20 | 39.02 | 1.50 | 0.04 | 0.42 | −0.06 | 35.82 | 43.06 | 7.24 |
2007HRB | 42.93 | 38.43 | 42.24 | 1.62 | 0.04 | 0.09 | −0.43 | 38.43 | 46.42 | 7.99 |
2008HRB | 43.04 | 38.06 | 39.17 | 1.57 | 0.04 | 0.42 | −0.43 | 35.90 | 43.06 | 7.16 |
2009HRB | 43.37 | 38.78 | 41.60 | 1.10 | 0.03 | −0.02 | −0.55 | 38.98 | 44.36 | 5.38 |
2010HRB | 42.42 | 40.72 | 41.90 | 0.95 | 0.02 | −0.24 | −0.38 | 39.74 | 44.00 | 4.29 |
2011HRB | 42.13 | 40.80 | 41.35 | 0.99 | 0.02 | −0.09 | −0.26 | 38.97 | 43.63 | 4.66 |
表2. 重组自交系群体及亲本蛋白含量总结
为整体数据的均值,群体内多年数据均匀分布。其中AEA代表株系的蛋白质含量均值,以箭头方向表示正方向,所有株系均向AEA轴上投影,各个材料的垂线越靠近箭头方向表示其蛋白质品质含量越高,反之亦然。如图1所示,株系24和株系10都位于AEC纵轴的最右侧,其蛋白含量远大于均值。株系10与株系24相比更接近横坐标,所以株系10的蛋白含量年度间的稳定性更高。
应用环境最适个体模型,将位于边缘的株系标志位点用直线连接起来,形成一个封闭的多边形。从原点出发对各个材料做垂线,所有10个环境分成了4个区域,每个多边形的顶点为最优个体。环境向量与箭头所在向量夹角越大表示环境代表性越弱。应用主成分分析,其中第1主成分解释了37.7%的效应,第2主成分解释了15.3%的效应,PC1和PC2共解释G与GE互作效应的53.0%,推断具有较大的可靠性(图2,图3)。
图1. RIL群体蛋白性状在HRB 10个环境表型分布图
图2. IL群体蛋白性状在HRB 10环境的分组
如图4所示,SUNSHINE的向量与目标向量夹角最小,其对蛋白质品质影响最大;RAINFALL的夹角略大于SUNSHINE,说明其对品质影响相对较小;AT对蛋白质的影响最小。对哈尔滨10年的环境来说,环境因子对品质数据的影响顺序为:日照时数 > 降水量 > 平均温度。第1主成分解释了55.8%的效应,第2主成分解释了31%的效应,PC1和PC2共解释环境因子影响效应的86.8%,据此,推断分析的可靠性较大。
图3. RIL群体蛋白性状在HRB 10环境的区分力和代表性图
图4. HRB环境的环境因子的GGE-biplot分析
大豆蛋白质含量是数量性状,外界环境影响因素众多,若利用传统的二维数据,很难解释出性状与各个环境的关系,而GGE双标图法可把各环境因素与性状之间的复杂关系直观的表现出来。对多环境及多品种进行整体性评价,能够清晰鉴别筛选出高品质性状的大豆品系,为目标区域筛选出高产优产的大豆新品种提供参照依据,为推广优质、优质新品种提供指导依据。
作物多点测验(或试验)是农业实验的基础,是最经常使用的实验设计。各个省市的农作物管理部门每年都会组织各育种单位和种子公司进行各种农作物品种试验,为育种提供依据和数据,并通过审定。由于存在品种和环境之间的相互作用(GE),因此多点试验是必要的。双标图法不用关注模型的适应性等问题,可以于直接比较品种的稳定性。考虑到一年内的数据多是平衡的(相同的品种出现在所有试验点),而年际间数据大多不平衡,通常先每年逐一分析,最后整合分析的思路 [
本研究利用GGE双标图法对连续10年的147个RIL群体的油分含量数据进行分析,筛选出蛋白质含量较高的5个株系是株系5、株系10、株系24、株系80和株系102,其中株系5和株系10的稳定性也较好,这些株系的表型远优于双亲,可以为大豆品种性状遗传育种提供丰富类型的材料,可以进一步挖掘应用。大豆参试环境中的2008HRB的代表性最好,2010HRB代表性最差;2002HRB的鉴别能力最好,2011HRB的鉴别能力最差。环境因子对大豆蛋白质含量品质数据的影响顺序为:日照时数 > 降水量 > 平均温度,针对该蛋白质含量数据来说,各环境因素中日照时数相对最重要,应用同一群体,通过环境的代表性和鉴别能力分析,在连续10年哈尔滨环境下,环境因子对油分含量的影响顺序为:日照时 > 数降水量 > 平均温度,与本文获得的研究结果完全一致 [
在RIL群体的多年环境品质性状分析中,株系10、23、24与80的蛋白质品质好,株系10具有较高的稳定性。就环境的代表性而言,2008HRB最好,环境的鉴别能力是2002HRB最好。在哈尔滨环境下,环境因子对品质数据的影响顺序为:日照时数 > 降水量 > 平均温度。
韩 雪,齐慧冬,齐照明,陈庆山. 基于GGE双标图的大豆蛋白质多环境的稳定性分析 Analysis of Soybean Protein Content for Environment Stability Based on GGE Biplot[J]. 农业科学, 2018, 08(07): 801-808. https://doi.org/10.12677/HJAS.2018.87118
https://doi.org/10.1093/bioinformatics/btm494
https://doi.org/10.1007/s00299-009-0804-1