OJFR Open Journal of Fisheries Research 2373-1443 Scientific Research Publishing 10.12677/OJFR.2017.44020 OJFR-22696 OJFR20170400000_98085414.pdf 地球与环境 基于2b-RAD简化基因组测序的半滑舌鳎群体遗传多样性分析 Analysis of Population Genetic Diversity of Cynoglossus cynoglossus Based on 2b-RAD Simplified Genome Sequencing 2 1 2 * 克奉 2 1 德斌 2 1 笑宇 2 1 中国水产科学研究院渤海水产研究中心,天津渤海水产研究所,天津 null * E-mail: zb611273@163.com(张博) ; 16 11 2017 04 04 125 133 © Copyright 2014 by authors and Scientific Research Publishing Inc. 2014 This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

以天津野生、天津养殖和海阳养殖群体三个半滑舌鳎群体为材料,利用2b-RAD测序筛选得到的32,746个SNP位点,利用SNP标记,进行群体遗传结构、遗传多样性和类群间遗传关系分析。每个SNP位点在所有群体内遗传变异(Fis),群体间的遗传变异(Fst),总变异(Fit)以及综合多位点的Fis,Fst和Fit估计值,表明3个群体两两群体间的Fst值从0.0731~0.1635不等。天津养殖群体和天津野生群体的遗传分化最小,天津养殖群体和海阳养殖群体以及天津野生群体和海阳养殖群体的遗传分化大。选择消除分析结果显示3个群体的θπ在0.118~0.206之间,Tajima’D值在0.448~1.457之间:天津野生群体种群多态程度最高,天津养殖群体次之,海阳养殖群体最低。分别统计海阳、天津、天津野生三个群体中每个SNP位点的多态信息含量(PIC),天津野生最高为0.220,天津养殖次之,海阳养殖最低,为0.175,天津野生和天津养殖差异并不显著。利用软件GCTA进行主成分分析,PCA结果显示,前两个主成分PC1和PC2贡献率分别为16.25%和9.54%,累积贡献25.79%。二维聚类结果显示,天津野生少部分区域与天津养殖间隔较小,但是两个主成分大体上还是可以明显区分为两大类,且二者与海阳养殖群体分类界限明显。综合以上SNP位点多样性、多态性信息含量、群体遗传多样性比较结果,所取的半滑舌鳎天津群体较海阳群体具有较高的遗传多样性和种群多态程度,其中天津野生群体和天津养殖群体虽较海阳养殖群体有差异,但前两者之间差异并不显著,揭示天津野生和养殖群体可能有一定程度的混杂,不排除野生群体中混杂有经养殖放流的养殖个体的可能性。 Taking the cultured and wild populations of Cynoglossus semilaevis in Tianjin coast and cultured populations in Haiyang as study objects, there were 32,746 SNP locis screened by 2b-RAD se-quencing. The genetic relationship, genetic structure, genetic diversity in these three groups were also analyzed by SNP markers. The genetic variation within populations (Fis), the genetic variation between groups (Fst), and total variation (Fit) in each SNP locus in these three groups were estimated, which shown that Fst value was ranged from 0.0731 - 0.1635. The genetic differentiation between Tianjin culture population and Tianjin wild population is the smallest, and the genetic differentiation between Tianjin and Haiyang culture populations, Tianjin wild population and Haiyang culture population is great. The results of selective sweep showed that the polymorphism of wild population was highest in Tianjin, followed by Tianjin culture population, and lowest in Haiyang breeding population. The polymorphism information content (PIC) statistics of Haiyang, Tianjin wild and Tianjin cultured populations respectively in each SNP site shown that Tianjin wild was up to 0.220, followed by Haiyang cultured and Tianjin breeding; the lowest is 0.175. The differentiation between Tianjin wild and Tianjin culture populations is not significant. Principal component analysis was carried out by using software GCTA, and PCA showed that the contribution rates of the first two principal components PC1 and PC2 were 16.25% and 9.54%, respectively, and the cumulative contribution was 25.79%. Two dimensional clustering results show that a small part of the region in Tianjin wild population had a small intervals with that of Tianjin cultured population, but the two principal components generally can be clearly divided into two categories, and these two populations had a clear boundaries with Haiyang cultured one. Based on the above SNP locus diversity, polymorphism information content, genetic diversity comparison, the genetic diversity of Tianjin wild population is higher than Haiyang farming groups, but not significant difference between wild and cultured populations in Tianjin. It revealed that Tianjin populations may have a certain extent mixture, which means the possibility of population mixture between wild and culture individuals may exist.

半滑舌鳎,2b-RAD,SNP,遗传多样性, Cynoglossus semilaevis 2b-RAD SNP Genetic Diversity
基于2b-RAD简化基因组测序的半滑舌鳎群体遗传多样性分析<sup> </sup>

贾磊,张博*,刘克奉,郑德斌,汪笑宇

中国水产科学研究院渤海水产研究中心,天津渤海水产研究所,天津

收稿日期:2017年10月21日;录用日期:2017年11月3日;发布日期:2017年11月16日

摘 要

以天津野生、天津养殖和海阳养殖群体三个半滑舌鳎群体为材料,利用2b-RAD测序筛选得到的32,746个SNP位点,利用SNP标记,进行群体遗传结构、遗传多样性和类群间遗传关系分析。每个SNP位点在所有群体内遗传变异(Fis),群体间的遗传变异(Fst),总变异(Fit)以及综合多位点的Fis,Fst和Fit估计值,表明3个群体两两群体间的Fst值从0.0731~0.1635不等。天津养殖群体和天津野生群体的遗传分化最小,天津养殖群体和海阳养殖群体以及天津野生群体和海阳养殖群体的遗传分化大。选择消除分析结果显示3个群体的θπ在0.118~0.206之间,Tajima’D值在0.448~1.457之间:天津野生群体种群多态程度最高,天津养殖群体次之,海阳养殖群体最低。分别统计海阳、天津、天津野生三个群体中每个SNP位点的多态信息含量(PIC),天津野生最高为0.220,天津养殖次之,海阳养殖最低,为0.175,天津野生和天津养殖差异并不显著。利用软件GCTA进行主成分分析,PCA结果显示,前两个主成分PC1和PC2贡献率分别为16.25%和9.54%,累积贡献25.79%。二维聚类结果显示,天津野生少部分区域与天津养殖间隔较小,但是两个主成分大体上还是可以明显区分为两大类,且二者与海阳养殖群体分类界限明显。综合以上SNP位点多样性、多态性信息含量、群体遗传多样性比较结果,所取的半滑舌鳎天津群体较海阳群体具有较高的遗传多样性和种群多态程度,其中天津野生群体和天津养殖群体虽较海阳养殖群体有差异,但前两者之间差异并不显著,揭示天津野生和养殖群体可能有一定程度的混杂,不排除野生群体中混杂有经养殖放流的养殖个体的可能性。

关键词 :半滑舌鳎,2b-RAD,SNP,遗传多样性

Copyright © 2017 by authors and beplay安卓登录

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

针对鱼类养殖业发展现状和可持续发展要求,通过开展鱼类生长和抗性等主要经济性状的功能基因组研究,高通量地筛选进行分子设计育种的关键基因和分子标记,建立分子标记辅助育种的技术是近几年鱼类分子育种研究领域的焦点和热点。随着生物技术的发展,RPAD、RFLP、SSR和SNP等不同分子标记手段被用来辅助分子育种,开发标记的手段也在进一步发展。全基因组测序的完成带来了海量的可利用的分子标记,利用这些分子标记对目标研究群体多样性进行分析、群体结构分析、亲缘关系以及连锁不平衡程度估计,掌握物种的群体遗传结构、遗传多样性和种群间遗传关系,能使育种思路更加清晰,育种目标更易实现 [ 1 ] 。

2b-RAD技术是指基于IIB型限制性核酸内切酶的简化基因组测序技术。通过对IIB型内切酶酶切基因组产生的等长tag进行高通量测序,可以大幅降低基因组的复杂度,同时不受有无参考基因组的限制,快速进行全基因组范围内大规模SNP标记的开发与分型。2b-RAD技术获得的标记数目更多、分型准确率更高,可用于群体遗传多样性分析、群体进化研究、辅助基因组的组装、全基因组选择育种等领域 [ 2 ] [ 3 ] 。本研究利用该技术在半滑舌鳎的三个群体中筛选到32,746个分型结果,通过群体遗传多样性分析和SNP多态性等分析,揭示了半滑舌鳎天津群体较海阳群体具有较高的遗传多样性和种群多态程度,其中天津野生群体和天津养殖群体虽较海阳养殖群体有差异,但是差异不显著,不排除野生群体中混杂有经养殖放流的养殖个体的可能性。

2. 材料与方法 2.1. 实验材料

半滑舌鳎3个群体,天津自然群体取于2015年10月,共10尾,体长12.3~14.6 cm,山东海阳(HY)养殖群体取于2015年10月,共10尾,体长12.6~15.1 cm。天津养殖群体取于2015年9月,共10尾,体长11.2~15.2 cm。所有样品均为活体,充氧加冰运送至实验室,立即存于−80˚C冰箱保存。

2.2. DNA提取与基因型检测

DNA提取。采用TIANamp Marine Animals DNA Kit提取半滑舌鳎雌核发育鱼苗基因组DNA,DNA产物置于−20˚C保存备用,通过琼脂糖检测和Nanodrop2000进行质量和浓度检测。简并基因组测定由上海欧易生物技术有限公司Illumina Hiseq Xten平台完成,基因分型与质量控制由本实验室完成。

2.3. 测序及测序质量分析

利用2b-RAD技术构建舌鳎30个个体的标签测序文库,30个样品在HiSeq X-Ten平台进行Paired-end测序,采用标准型NNN接头建库。将原始reads按照以下条件进行过滤:

剔除不含有BsaXI酶切识别位点的序列,剔除低质量序列(低质量序列定义:大于10个碱基的质量分数小于20),剔除有10个以上连续相同碱基的序列,将原始reads进行过滤,结果表1可见:

30个测序文库中含有酶切位点的高质量reads与测序原始reads之比平均在75%以上,标签深度在14~25之间,平均深度是20,表明本次舌鳎文库的测序质量较好。

2.4. 全基因组范围SNP筛查和分型分析

对于有参照基因组的标记分型,依据RAD-typing的分型策略(Fu等,2013),标记分型如下

构建参考序列:从舌鳎参考基因组序列中提取包含BsaXI酶切位点的标签作为参考序列。

半滑舌鳎(Cynoglossus semilaevis)参考基因组:

https://www.ncbi.nlm.nih.gov/genome/?term=Cynoglossus+semilaevis 个体SNP标记分型:将个体的高质量reads利用SOAP软件(Li等,2009) (参数设置为:-M 4-v 2-r 0) mapping到参考序列上。利用最大似然法ML进行位点的分型。为了保证SNP位点分型的准确性和严谨性,进行以下条件的过滤:在个体内标签深度在500以上的不进行分型。只留取标签内最多有3个SNP的标签位点;标记在80%的个体中可以

Information of sequencing librar
References 张文静, 余育, 沈韫芬. 微卫星DNA遗传分析在原生动物学中的研究进展[J]. 水生生物学报, 2003, 27(2): 185-190. 陆丽君, 马爱军, 王新安, 等. 5个红鳍东方鲀养殖群体微卫星DNA遗传多态性分析[J]. 渔业科学进展, 2013, 34(4): 27-34. Delphine, V.I., Albrecht, E.M., Claude, L., et al. (2010) Population Structure and Genetic Diversity in a Commercial Maize Breeding Program Assessed with SSR and SNP Markers. Theoretical and Applied Genetics, 120, 1289-1299.
https://doi.org/10.1007/s00122-009-1256-2
Fu, X., Dou, J., Mao, J., et al. (2013) RADtyping: An Integrated Package for Accurate De Novo Codominant and Dominant RAD Genotyping in Mapping Populations. PLoS ONE, 8, e79960.
https://doi.org/10.1371/journal.pone.0079960
Gerdes, J.T., Behr, C.F., Coors, J.G., et al. (1994) Compilation of North American Maize Breeding Germplasm. CSSA, Madison. 武菲, 胡文革, 王翠华, 等. 河鲈养殖与野生群体遗传多样性比较分析[J]. 水生生物学报, 2016, 40(1): 182-188 毛守康, 马爱军, 丁福红, 等. 梭鱼(Liza haematocheila) 4个野生地理群体遗传多样性的微卫星分析[J]. 渔业科学进展, 2016, 37(2): 67-75.
Baidu
map