植物开花机制是一个复杂而精密的调控网络。组学分析表明,几乎所有光周期开花途径的相关基因或蛋白的昼夜节律性表达都受到生物钟的调控,其中一些关键基因, CYCLING DOF FACTOR 1 ( CDF1)、 CONSTANS ( CO)和 FLOWERING LOCUS T ( FT)等在光周期条件下发挥着重要作用。本研究根据拟南芥生物钟对开花相关基因的调控关系,建立光周期开花路径的微分方程模型。模拟结果表明,在长日照下开花相关基因保持着昼夜节律振荡, FT积累到一定阈值,植物才能开花。此外,基于模型残差的平稳性和纯随机性检验的修正模型,再现了 FT的积累量的变化趋势,为预测开花时间提供了一个可靠的分析工具。 Plant flowering mechanism is a complex and sophisticatedregulatory network. Omics analysis showed that the circadian rhythmicexpression of almost all genes or proteins related to photoperiodic flowering pathway is regulated by the circadianclock, and some key genes, CYCLING DOF FACTOR 1 ( CDF1), CONSTANS ( CO) and FLOWERING LOCUS T ( FT) play important rolesunder photoperiodic conditions. In this study, adifferential equationmodel for photoperiodic flowering pathway was developed based on the regulatory relationship of flowering genes in Arabidopsis thaliana. The simulation results showed that the flowering related genes maintained circadian oscillations under long-day. FT must accumulate to a certain threshold before plants could flower. In addition, the modified model based on the stationarity and pure randomness test of model residuals simulated the trend of FT accumulation, which provided a reliable analytical tool for predicting flowering time.
植物开花机制是一个复杂而精密的调控网络。组学分析表明,几乎所有光周期开花途径的相关基因或蛋白的昼夜节律性表达都受到生物钟的调控,其中一些关键基因,CYCLING DOF FACTOR 1 (CDF1)、CONSTANS (CO)和FLOWERING LOCUS T (FT)等在光周期条件下发挥着重要作用。本研究根据拟南芥生物钟对开花相关基因的调控关系,建立光周期开花路径的微分方程模型。模拟结果表明,在长日照下开花相关基因保持着昼夜节律振荡,FT积累到一定阈值,植物才能开花。此外,基于模型残差的平稳性和纯随机性检验的修正模型,再现了FT的积累量的变化趋势,为预测开花时间提供了一个可靠的分析工具。
生物钟,光周期开花,微分方程模型,FT
Minhao Liu, Yue Wu, Zhixuan Niu, Yue Sun, Xiong You*
Department of Mathematics, Faculty of Science, Nanjing Agricultural University, Nanjing Jiangsu
Received: Feb. 20th, 2024; accepted: Mar. 20th, 2024; published: Mar. 29th, 2024
Plant flowering mechanism is a complex and sophisticatedregulatory network. Omics analysis showed that the circadian rhythmicexpression of almost all genes or proteins related to photoperiodic flowering pathway is regulated by the circadianclock, and some key genes, CYCLING DOF FACTOR 1 (CDF1), CONSTANS (CO) and FLOWERING LOCUS T (FT) play important rolesunder photoperiodic conditions. In this study, adifferential equationmodel for photoperiodic flowering pathway was developed based on the regulatory relationship of flowering genes in Arabidopsis thaliana. The simulation results showed that the flowering related genes maintained circadian oscillations under long-day. FT must accumulate to a certain threshold before plants could flower. In addition, the modified model based on the stationarity and pure randomness test of model residuals simulated the trend of FT accumulation, which provided a reliable analytical tool for predicting flowering time.
Keywords:Circadian Clock, Photoperiodic Flowering, Differential Equation Model, FT
Copyright © 2023 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
昼夜节律也称为生物钟,是一个周期大约为24小时的振荡器,它的存在是为了适应在地球上生存,对植物的生长和发育有深远的影响 [
生物钟基因主要包括CIRCADIAN CLOCK-ASSOCIATED 1 (CCA1)、LATE ELONGATED HYPOCOTYL (LHY)、PSEUDO-RESPONSE REGULATOR 9 (PRR9)、PSEUDO-RESPONSE REGULATOR 7 (PRR7)、PSEUDO-RESPONSE REGULATOR 5 (PRR5)、TIMING OF CAB EXPRESSION 1 (TOC1)、EARLY FLOWERING 4 (ELF4)、LUX ARRHYTHMO (LUX)以及GIGANTEA (GI),它们mRNA的节律性表达受到彼此蛋白的调控。晨间基因CCA1和LHY抑制PRR9、PRR7 [
开花时间决是生物钟系统的一个主要输出途径,由复杂的基因网络控制,生物钟通过协调内部生理和外部环境因素来精准调整植物开花。FT的表达对拟南芥的开花时间起到关键性作用。CO作为FT的上游基因,其蛋白促进FT的表达。同时,CDF家族作为CO的上游基因,不仅抑制CO的转录,其自身的表达还受到多个核心生物钟成分的调节 [
植物生物钟的数学模型经历了从初创到发展完善的过程。Locke等 [
现有的数学模型描述了光与生物钟对植物下胚轴伸长的调节,虽然光周期开花通路中的分子机制已有实验验证,但尚未出现相应的数学模型。本文主要模式植物拟南芥为研究对象,基于Caluwé等 [
研究表明,在调控植物开花的过程中,CO作为一个网络枢纽,将各种外部和内部信号整合到光周期开花途径。同时,作为生物钟和CO、FT开花相关基因桥梁的CDF家族,主要受到晨间基因CCA1和LHY的诱导 [
我们根据开花相关基因与生物钟基因之间的分子机制,建立了植物生物钟光周期开花通路的基因调控网络,如图1所示:
图1. 光周期开花通路基因调控网络
在图1基因调控网络的基础上我们建立了数学模型。模型由16个微分方程组成,包含63个参数。方程(1)~(10)分别表示五个生物钟成分的mRNA和蛋白:CL (CCA1和LHY)、P97 (PRR9和PRR7)、P51 (PRR5和TOC1)、EL (ELF4和LUX)和GI,变量下标m和p分别表示mRNA和蛋白。方程(11)表示光敏蛋白P。方程(12)~(15)分别表示CDF1和CO的mRNA和蛋白。方程(16)表示FT mRNA。L和D分别代表白光以及黑暗两种光照处理条件:
L ( t ) = { 1 , 光 照 时 , 0 , 黑 暗 时 , D ( t ) = 1 − L ( t ) = { 0 , 光 照 时 , 1 , 黑 暗 时 .
微分方程模型如下:
d [ C L ] m d t = ( v 1 + v 1 L × L ( t ) × P ) × 1 1 + ( [ C L ] p K 0 ) 2 + ( [ P 97 ] p K 1 ) 2 + ( [ P 51 ] p K 2 ) 2 − ( k 1 L × L ( t ) + k 1 D × D ( t ) ) × [ C L ] m (1)
d [ C L ] p d t = ( p 1 + p 1 L × L ( t ) ) × [ C L ] m − d 1 × [ C L ] p (2)
d [ P 97 ] m d t = ( v 2 + v 2 L × L ( t ) × P ) × 1 1 + ( [ P 51 ] p K 4 ) 2 + ( [ E L ] p K 5 ) 2 + ( [ C L ] p K 5 A ) 2 − k 2 × [ P 97 ] m (3)
d [ P 97 ] p d t = p 2 × [ P 97 ] m − ( d 2 D × D ( t ) + d 2 L × L ( t ) ) × [ P 97 ] p (4)
d [ P 51 ] m d t = v 3 × 1 1 + ( [ C L ] p K 6 ) 2 + ( [ P 51 ] p K 7 ) 2 − k 3 × [ P 51 ] m (5)
d [ P 51 ] p d t = p 3 × [ P 51 ] m − ( d 3 D × D ( t ) + d 3 L × L ( t ) ) × [ P 51 ] p (6)
d [ E L ] m d t = v 4 × L ( t ) × 1 1 + ( [ C L ] p K 8 ) 2 + ( [ P 51 ] p K 9 ) 2 + ( [ E L ] p K 10 ) 2 − k 4 × [ E L ] m (7)
d [ E L ] p d t = p 4 × [ E L ] m − ( d 4 D × D ( t ) + d 4 L × L ( t ) ) × [ E L ] p (8)
d [ G I ] m d t = v 5 × 1 1 + ( [ C L ] p K 11 ) 2 + ( [ P 51 ] p K 12 ) 2 + ( [ E L ] p K 13 ) 2 − k 5 × [ G I ] m (9)
d [ G I ] p d t = p 5 × [ G I ] m − ( d 5 D × D ( t ) + d 5 L × L ( t ) ) × [ G I ] p (10)
d P d t = 0.3 × ( 1 − P ) × D ( t ) − P × L ( t ) (11)
d [ C D F 1 ] m d t = ( v 6 + v 6 A × [ C L ] p 2 K 14 2 + [ C L ] p 2 ) × 1 1 + ( [ P 97 ] p K 15 ) 2 + ( [ P 51 ] p K 16 ) 2 − k 6 × [ C D F 1 ] m (12)
d [ C D F 1 ] p d t = p 6 × [ C D F 1 ] m − ( d 6 × ( 1 − A ( t ) ) + d 6 A × A ( t ) ) × [ C D F 1 ] p (13)
d [ C O ] m d t = v 7 × 1 1 + ( [ C D F 1 ] p K 17 ) 2 − k 7 × [ C O ] m (14)
d [ C O ] p d t = p 7 × [ C O ] m − ( d 7 D × D ( t ) + d 7 M × M ( t ) + d 7 A × A ( t ) ) × [ C O ] p (15)
d [ F T ] m d t = ( v 8 + v 8 A × [ C O ] p 2 K 18 2 + [ C O ] p 2 ) × 1 1 + ( [ C D F 1 ] p K 19 ) 2 − k 8 × [ F T ] m (16)
我们的模型中保留了Caluwé等模型 [
δ = δ 1 + δ 2 + δ 3 = w ∑ i = 1 n ( [ G I ] ( i ) − [ G I ] * ( i ) ) 2 + ( p [ G I ] − p [ G I ] * ) 2 + ( t [ G I ] − t [ G I ] * ) 2 (17)
式中上标*表示实验值,无上标*表示模拟值,w表示权重,n表示实验数据的个数,p[GI]表示GI的周期,t[GI]表示GI的波峰相位。为了平衡实验数据中各成分的量级,我们将误差平方和项的权重取为10。输入的参数应用拉丁超立方抽样 [
图2. 代价函数流程图
根据Col-0型拟南芥GI、CDF1、CO和FT四个基因经过480小时短日照(光照时间:黑暗时间 = 8 h:16 h)驯化后进入长日照的相对表达实验数据 [
参数 | 参数定义 | 参数取值(单位) | 参数 | 参数定义 | 参数取值(单位) |
---|---|---|---|---|---|
v1 | CL的转录速率 | 4.58 nM·h−1 | d3D | 黑暗下P51的降解速率 | 0.48 h−1 |
v1L | 光照诱导CL的转录速率 | 3.0 nM·h−1 | d3L | 光照下P51的降解速率 | 0.38 h−1 |
v2 | P97的最大转录速率 | 1.27 nM·h−1 | d4D | 黑暗下EL的降解速率 | 1.21 h−1 |
v2L | 光照诱导P97的转录速率 | 5.0 nM·h−1 | d4L | 光照下EL的降解速率 | 0.38 h−1 |
v3 | P51的转录速率 | 1.0 nM·h−1 | d5D | 黑暗下GI的降解速率 | 1.13 h−1 |
v4 | EL的转录速率 | 1.47 nM·h−1 | d5L | 光照下GI的降解速率 | 0.58 h−1 |
v5 | GI的转录速率 | 4.89 nM·h−1 | d6 | CDF1的降解速率 | 1.49 h−1 |
v6 | CDF1的转录速率 | 2.75 nM·h−1 | d6A | 下午CDF1的降解速率 | 2.0 h−1 |
v6A | CL诱导CDF1的转录速率 | 2.48 nM·h−1 | d7D | 黑暗下CO的降解速率 | 1.9 h−1 |
v7 | CO的转录速率 | 3.13 nM·h−1 | d7M | 上午CO的降解速率 | 0.54 h−1 |
v8 | FT的转录速率 | 0.1 nM·h−1 | d7A | 下午CO的降解速率 | 0.12 h−1 |
v8A | CO诱导FT的转录速率 | 4.89 nM·h−1 | K0 | CL对自身的抑制 | 2.8 nM |
k1D | 光照下CL的降解速率 | 0.21 h−1 | K1 | P97对CL的抑制 | 0.16 nM |
k1L | 黑暗下CL的降解速率 | 0.53 h−1 | K2 | P51对CL的抑制 | 1.18 nM |
k2 | P97的降解速率 | 0.35 h−1 | K4 | P51对P97的抑制 | 0.28 nM |
k3 | P51的降解速率 | 0.56 h−1 | K5 | EL对P97的抑制 | 0.16 nM |
k4 | EL的降解速率 | 0.57 h−1 | K5A | CL对P97的抑制 | 1.18 nM |
k5 | GI的降解速率 | 0.96 h−1 | K6 | CL对P51的抑制 | 0.28 nM |
k6 | CDF1的降解速率 | 1.48 h−1 | K7 | P51对自身的抑制 | 2.0 nM |
k7 | CO的降解速率 | 0.22 h−1 | K8 | CL对EL的抑制 | 0.36 nM |
k8 | FT的降解速率 | 0.83 h−1 | K9 | P51对EL的抑制 | 1.9 nM |
p1 | CL的翻译速率 | 0.76 h−1 | K10 | EL对自身的抑制 | 1.9 nM |
p1L | 光照诱导CL的翻译速率 | 0.42 h−1 | K11 | CL对GI的抑制 | 0.27 nM |
p2 | P97的翻译速率 | 1.01 h−1 | K12 | P51对GI的抑制 | 0.2 nM |
p3 | P51的翻译速率 | 0.64 h−1 | K13 | EL对GI的抑制 | 1.92 nM |
p4 | EL的翻译速率 | 1.01 h−1 | K14 | CL对CDF1的促进 | 1.63 nM |
p5 | GI的翻译速率 | 0.65 h−1 | K15 | P97对CDF1的抑制 | 1.38 nM |
p6 | CDF1的翻译速率 | 1.7 h−1 | K16 | P51对CDF1的抑制 | 0.38 nM |
p7 | CO的翻译速率 | 0.02 h−1 | K17 | CDF1对CO的促进 | 0.19 nM |
d1 | CL的降解速率 | 0.68 h−1 | K18 | CO对FT的促进 | 0.34 nM |
d2D | 黑暗下P97的降解速率 | 0.5 h−1 | K19 | CDF1对FT的抑制 | 1.19 nM |
d2L | 光照下P97的降解速率 | 0.29 h−1 |
表1. 模型参数定义及其取值
在经筛选得到的这组参数下,模型模拟的基因表达趋势与实验结果基本一致。从图3可以看出,CDF1的表达峰值出现在上午,由于长日照下GI蛋白与FKF1蛋白同时在下午达到峰值,使得二者之间的复合蛋白的浓度增加,抑制了CDF1在下午的合成速率。然而,CO的表达峰值出现在夜晚,FT的表达水平则在黄昏附近达到顶峰。从模拟结果可以看到,在长日照条件下一天之内FT出现两次波峰。研究表明,第一个波峰水平的高低与光照中红光和远红光的比例有关 [
除了生物钟成分GI保持着以24小时为周期的振荡,其他三个与光周期开花相关的基因也保持着昼夜节律振荡。经短日照驯化进入长日照后,由于光照条件的改变,CO和FT在第一个周期的表达水平突然增加,随后趋于稳定,如图3(c)和图3(d)所示。这表明植物虽然受到多种外部环境条件的影响,但是,由于生物钟的调控,CO和FT基因的表达也能保持稳定振荡。
图3. 长日照下GI、CDF1、CO和FT的相对表达水平
实验和模拟结果都表明,随着白天光照时间的延长,FT的整体表达水平随之增加。此外,我们还发现,一个周期内FT的第一个波峰相位与进入黑暗的时刻无关,然而第二个波峰相位随着光照时间的增加而变大。该基因mRNA的表达主要受到CO蛋白的促进,CO蛋白的稳定性在下午得到加强以及在黑暗中蛋白被快速降解,使得FT相对表达水平在进入黑暗后也逐渐下降。结果说明,光照时间的长短调控着拟南芥的开花时间,对于类似于拟南芥这种长日照植物而言,光照时长的增加有助于开花的提早发生,加速营养生长到生殖生长的转换(图4)。
图4. 不同光周期下FT的相对表达水平:(a) 实验;(b) 模拟
FT的表达与积累,不仅与光周期有关,还与春化、自主等途径相关。在生物钟调控的这一途径中,FT的表达呈周期性振荡,而拟南芥开花时间与FT在一天中的积累量相关。因此我们假设,在进入长日照后FT的转录速率随在长日照中的生长时间而增加。于是我们将(16)式修正为:
d [ F T ] m d t = ( v 8 + v 8 A × [ C O ] p 2 K 18 2 + [ C O ] p 2 ) × 1 1 + ( [ C D F 1 ] p K 19 ) 2 × ( t − 480 ) − k 8 × [ F T ] m (18)
在修正后模型中,FT的模拟结果如图5(a)所示,随着在长日照条件下生长时间的增加,FT的表达趋
图5. FT mRNA原模型与修正模型的拟合结果(a)和残差序列(b)
势也逐渐升高。为了检验模型的合理性,在图5(b)中我们计算了与实验数据时刻对应的残差,从图中我们可以看出,从短日照进入长日照后的前几天,即植物在对周围环境作出反应的时间阶段,FT的实验表达数据峰值呈现下降的趋势,导致模拟结果出现较大的偏差。随后植物适应了长日照环境,FT的表达逐渐规律,呈现上升趋势,残差也逐渐减小。
为了进一步检验模型提取FT表达信息的充分性,我们首先去除了进入长日照后的前2天的数据,然后对残差序列进行了平稳性和纯随机性检验。根据Augmented Dickey-Fuller (ADF)检验 [
FT模型 | t值 | p值 | 延迟阶数 |
---|---|---|---|
修正前 | 2.422752 | 0.999021 | 5 |
修正后 | −3.943634 | 0.001736 | 5 |
表2. FT模型残差序列ADF检验
随后,我们用Ljung-Box (LB)检验 [
延迟阶数 | p值(修正前) | p值(修正后) |
---|---|---|
6 | 0.00094321 | 0.06245551 |
12 | 0.00035499 | 0.15638903 |
表3. FT模型残差序列LB检验
生物钟调控机制是影响拟南芥开花时间的重要途径之一。在本研究中,不同于Caluwé的基因调控网络 [
在实际太阳光中光质的比例会随着时间的变化而变化。当太阳超过地平线10˚以上,太阳光谱相对恒定,然而在黎明或黄昏时,也就是太阳高度在+10˚或−10˚的时候,呈现出丰富的蓝色光谱 [
本研究受到南京农业大学创新训练计划项目(202323XX016)的资助。
刘旻昊,吴 越,牛之瑄,孙 越,游 雄. 拟南芥光周期开花路径的建模与分析Modeling and Analysis of Photoperiodic Flowering in Arabidopsis thaliana[J]. 计算生物学, 2023, 13(03): 23-34. https://doi.org/10.12677/hjcb.2023.133003
https://doi.org/10.1126/science.abc9141
https://doi.org/10.1101/cshperspect.a034611
https://doi.org/10.1371/journal.pone.0143943
https://doi.org/10.1105/tpc.15.00737
https://doi.org/10.1104/pp.111.189670
https://doi.org/10.1016/j.jtbi.2004.11.038
https://doi.org/10.1111/j.1365-313X.2005.02531.x
https://doi.org/10.1073/pnas.0503029102
https://doi.org/10.1105/tpc.109.072892
https://doi.org/10.1073/pnas.1200355109
https://doi.org/10.1126/science.1219075
https://doi.org/10.1093/pcp/pcn198
https://doi.org/10.1093/pcp/pcu030
https://doi.org/10.1146/annurev-arplant-043014-115555
https://doi.org/10.1016/j.pbi.2009.09.007
https://doi.org/10.1038/s41477-018-0253-3
https://doi.org/10.1038/msb4100102
https://doi.org/10.1038/msb.2010.69
https://doi.org/10.1038/msb.2012.6
https://doi.org/10.1186/1752-0509-7-23
https://doi.org/10.3389/fpls.2016.00074
https://doi.org/10.15252/msb.202010140
https://doi.org/10.1105/tpc.113.109355
https://doi.org/10.1371/journal.pone.0116973
https://doi.org/10.1093/insilicoplants/diz006
https://doi.org/10.1093/pcp/pcm067
https://doi.org/10.1073/pnas.1205156109
https://doi.org/10.1126/science.1146994
https://doi.org/10.1105/tpc.110.081885
https://doi.org/10.1126/science.1219644
https://doi.org/10.1242/dev.02691
https://doi.org/10.1016/S0951-8320(03)00058-9
https://doi.org/10.1101/sqb.2007.72.006
https://doi.org/10.1111/nph.13883
https://doi.org/10.1146/annurev.pp.33.060182.002405
https://doi.org/10.3390/biology11101479