mauve-基因组共线性软件安装?

比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。

比较基因组学应用: 揭示非编码功能序列 发现新基因,揭示基因功能 发掘功能SNP 阐述进化史 

种间比较基因组学:共线性分析、系统发生的进化关系分析
种内比较基因组学:单核苷酸多态性( SNP)、Core-pan基因分析
共线性又称同线性,是一个物种的基因组中相互连锁的基因,在另一物种的基因组中也是连锁关系, 而且在两个物种的遗传图上的位置也是相同的 。

宏观共线性:遗传连锁图上锚定标记排列次序的一致性 微观共线性:物理图上基因序列的一致排列 进化距离非常近的物种间保持很好的微观共线性 在进化过程中,基因共线性被各种因素所破坏, 进化距离越远的物种之间基因共线性越差, 两个物种之间的共线性程度可以作为衡量它们之

破坏基因组共线性的因素: 转座:DNA的转座,亦称移位( transposition);是由可移动因子介导的遗传物质重排现象。 插入和缺失:插入和缺失( insertion and deletion)是DNA和蛋白质在进化过程中发生的序列长度上的改变,由于缺乏祖先序列的信息,不能肯定其到底是插入事件还是缺失事件,故统称之为增减( indel) 倒置:倒臵是指的基因组中的一段序列发生了颠倒倒臵,与其反向互补链序列进行了交换 染色体易位 :染色体片段位臵的改变称为易位( translocation)。它伴有基因位臵的改变。易位发生在一条染色体内时称为移位或染色体内易位;易位发生在两条同源或非同源染色体之间时称为染色体间易位。 

往往基因组共线性会同时呈现出各种类型变异,通过共线性分析可以直观的找到同源保守区块( block),以及特异性区域。同源保守区可以用来进行细致比较,比如SNP等。特异性区域可以用来检测特异性功能组分的预测。

共线性分析对于亲缘关系较近的物种一般使用核苷酸序列来进行分析,如果在核苷酸水平不能呈现出很好的共线性的话,还可以换用编码基因水平的共线性(更适用于真核物
除了全基因组共线性外,常见的还有功能基因簇的局部共线性分析



异所引起的DNA序列多态性。
SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失( InDel)所致。但通常所说的SNP并不包括后两种情况
在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在编码基因序列内,也有可能在基因以外的非编码
序列
上。 总的来说,位于编码区内的SNP( coding SNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5。但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。
从对生物的遗传性状的影响上来看, cSNP又可分为2种: 同义cSNP( synonymous cSNP):即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同; 非同义cSNP( non-synonymous cSNP):指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响
了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。

分析方法: 在共线性比对得到的同源区域中,检索SNP位点  如果有原始测序数据,还可以进行初步的过滤,筛除不可

信SNP位点; 提取参考序列SNP位点两边的序列,然后使用BLAT软件将提取的序列和组装结果进行比对,验证SNP位点可信度。如果比对的长度太小,则认为是不可信的SNP,将去除;比对上多次,认为是重复区域的SNP,也将被去除; 最后用BLAST、 TRF、 Repeatmask软件预测参考序列的重复序列区,过滤位于重复区的SNP。 

结合SNP的位臵信息和参考基因组的注释信息,对SNP进行注释分析。 

KaKs_Calculator 是一套用于计算非同义替换率(通常用 Ka 表示)和同义替换率(通常用 Ks 表示)的软件程序包, 利用他可以计算基因的KA、KS及其比值。需要提供给他一个相对于模版序列比对好的编码基因序列文件,然后通过分析得出该基因的KA、 KS及其比值等信息。 

下游分析: 变异位点富集:基因富集。功能富集 cgMLST:核心基因组多位点序列分型

根据物种的泛基因组大小与菌株数目的关系,将物种的泛基因组分为开放型泛基因组( open)和闭合型泛基因组( close)。开放型的泛基因组是指,随着测序的基因组数目的增加,物种的泛基因组大小也不断增加。闭合性的泛基因组是指,随着测序的基因组数目增加,物种的泛基因组大小增加到一定的程度后收敛于某一值 。

本发明涉及一种菊花叶绿体基因组ssr标记库、其获得方法及其应用,属于分子生物学技术领域。

菊花在花类资源的探索进程中扮演着主导角色、在观赏、食用和药用生产中发挥着巨大作用。对于菊花品种及分类,在传统形态学,数量分类学、细胞学、聚类分析等领域均有相关的研究,为我们了解菊花分类差异和品种亲缘关系提供了参考,但是这些研究仅针对少部分菊花品种进行实验分析,尚不能帮助我们去正确有效地鉴别菊花。虽然通过表型鉴定菊花具有方便和直接的优点,但是由于菊花品种繁多、品种之间差异较小、形态性状的平行进化、发育变异受到自然选择、长期杂交培育情况下导致遗传情况变得十分复杂,导致鉴别效率低,阻碍了植物繁殖和国际交流,因此在菊花分类方面一直存在争议,无法单纯凭借形态学特征、细胞学等方法快速有效地鉴别菊花品种。

目前已有学者开发和利用分子标记技术对菊花进行了不同层面的研究,但是这些研究计算过程复杂、适用于样品数量少、引物不充分或研究位点少,尚不能有效、正确、快速地鉴别和区分大部分菊花品种。因此需要完善全面统一的分类鉴定方法仍是非常困难的,在品种分类和遗传关系研究都存在着不足和局限性。一是菊花的栽培育种大都从表型出发,由于各品种表型存在相似性,影响对遗传性状的接收,导致新品种育出效率低。二是菊花表型存在同化性,品种间差异小,鉴别准确率低,严重混淆菊花品种,阻碍了品种之间的交流与培育。三是栽培菊花的自交不亲和和近交导致其具有杂合性,进而致使遗传改良延迟。四是菊花分类和鉴定系统不完善,影响对其遗传关系及起源的追溯,加上菊花易杂交产生新的变异,致使其发育系统更加复杂。亟需解决的正是菊花研究现存的问题,使得菊花分类鉴别工作变得如此重要。

为了克服现有技术的不足,本发明的第一个目的在于提供一种菊花叶绿体基因组ssr标记库,可以用于有效而准确地鉴定菊花品种,进行菊花遗传学研究和育种亲本选择。

本发明的第二个目的在于提供一种上述菊花叶绿体基因组ssr标记库的获得方法;该方法减少外源dna的扩散,没有基因沉默现象及位置效应的影响,具有定点整合、高效表达及安全性好,实验周期短、劳动强度小、结果信息丰富等优势。

本发明的第三个目的在于提供一种上述菊花叶绿体基因组ssr标记库的应用构建系统发育树和鉴别菊花的品种。

实现本发明的第一个目的可以通过采取如下技术方案达到:一种菊花叶绿体基因组ssr标记库,ssr标记库包括ssr标记序列seqidno.1,还包括seqidno.2-40中的至少一个。

实现本发明的第二个目的可以通过采取如下技术方案达到:一种菊花叶绿体基因组ssr标记库的获得方法,包括,将菊花品种叶绿体基因组dna,进行ssr分析,获得ssr标记,将同一品种的ssr标记拼接为ssr标记序列,得到ssr标记库;菊花品种包括野菊c.indicum,通过野菊c.indicum获得ssr标记序列为seqidno.1。

进一步地,ssr分析中设置单核苷酸到六核苷酸单元的重复数最小值依次设为:10,6,5,5,5,5。

实现本发明的第三个目的可以通过采取如下技术方案达到:一种菊花叶绿体基因组ssr标记库的应用,将ssr标记库用于构建系统发育树。

进一步地,构建系统发育树的步骤包括:

1)将ssr标记序列进行多序列比对;

2)区分不同品种,对花序大小、舌状小花形态、头状花序重瓣性和花色指标进行统计分类。

进一步地,多序列比对包括步骤:

最大似然法:jmodeltestversion2.1.10对比对好的物种序列进行最适模型检测;

实现本发明的第三个目的也可以通过采取如下技术方案达到:一种菊花叶绿体基因组ssr标记库的应用,将ssr标记库用于鉴别菊花的品种。

相比现有技术,本发明的有益效果在于:

1、由于菊花是多倍体植物,利用全基因组进行研究具有一定困难和挑战性,本发明以ssr标记为材料,通过生物信息学对测序数据进行编辑和分析,对其进行测序研究;

2、本发明减少外源dna的扩散,没有基因沉默现象及位置效应的影响,具有定点整合、高效表达及安全性好,实验周期短、劳动强度小、结果信息丰富等优势,同时避免了叶绿体dna分离等高难度实验,也不需要设计特异性引物;

3、通过ssr标记库,有效而准确地鉴定菊花品种,显著提高菊花品种的系统分类效率,研究主栽菊花品种的杂交起源,从而为菊花的系统发育,物种起源,以及揭示系统发育问题的整个进化过程,真正打开菊花遗传学研究的大门,并且加快了遗传界研究的进度,因此,开展对ssr标记库应用研究,对探究菊属种间及种内的起源、遗传多样性以及对园艺植物进行种质创新和品种的改良都具有非常重要的意义;

4、本发明对菊花品种的亲缘关系进行研究,构建了系统发育树,对其起源和菊花品种之间的进化关系进行分析,从ssr标记水平上探索它们的亲缘关系和栽培起源问题,获得了ssr标记库,用于菊花的遗传研究并区分不同品种的多态性。针对ssr标记进行分析,鉴别菊花品种及种源的关系,从而深入了解菊花叶绿体的母系遗传规律。另外,本发明将为菊花的引种栽培和资源评价、种质资源保护提供科学依据,为完善菊花dna条形码提供参考数据,对后期菊花品种改良及新品种杂交选育具有重要指导价值。

图1-2为ir边界扩张收缩比较;

图3为分散重复序列比较分析;

图6为mauve比较分析;

图7为bi和ml系统发育分析。

下面,结合附图以及具体实施方式,对本发明做进一步描述:

基因组比较分析及共线性分析

表格239个菊花品种与c.indicum叶绿体基因组基本特征比较

叶绿体基因组ir边界分析

如图3所示,在39个菊花品种与c.indicum的叶绿体基因组中共检测到了39(huanglongyan)~45(juhuanao)个ssrs,并仅检测到3种核苷酸重复类型,即单核苷酸,双核苷酸和三核苷酸,均未检测到四核苷酸、五核苷酸和六核苷酸ssr。单核苷酸ssr含量最高,具37(huanglongyan)~43(juhuanao)个。双核苷酸ssr的含量除c.indicum和juhuanao大于1,其余38个品种的叶绿体基因组均只含1个。仅juhuanao不含三核苷酸ssr,此外,c.indicum及huanglongyan的三核苷酸类型含量为1,其余37个品种的含量均为2。

基于c.indicumssr标记序列,利用mvista软件对测定的39个菊花品种进行了比较分析(图4和图5),结果表明,39个菊花品种的ssr标记序列具有高度相似性,相比之下,编码区比非编码区更为保守,且差异主要存在于基因间隔区,而编码区的主要差异存在于ycf1。

通过mauve进行比较发现,39个菊花品种与c.indicum的叶绿体所含的所有trna,rrna及蛋白编码基因均表现出高度共线性,未观察到基因重排现象(图6)。

基于39个菊花品种与c.indicum的ssr标记序列,利用贝叶斯法bi和最大似然法ml分别构建了发育树,bi系统树和ml系统树的拓扑结构大致相似,本文基于贝叶斯树的结构进行系统发育分析(图7)。结果显示,40份材料分为3大类群,第ⅰ类群由c.indicum单独形成,第ⅱ类群由近野生种juhuanao和huanglongyan组成,第ⅲ类群则包括自育新品种ziyan、中国传统品种zilongtanzhua、荷兰品种mundoorange以及日本品种taipinghonglian等37个品种,并形成两大平行结构,这表明第ⅲ类群的品种亲缘关系较近,其中,荷兰品种stresa、日本品种guohuaxingxinghuo以及3个中国传统品种(nanshangaosi,jinjiliuxia,cenluanbiran)形成ⅲ-2小类群(pp=0.99,bs=100),区分于小类群ⅲ-1。

如表格3所示,根据4种花形态性状的统计结果显示,40份材料根据大小可分为大菊和小菊,其舌状小花有平瓣(ligulate)、匙瓣(spatulate)、脊瓣(quilled)、内曲(incurved)等4种类型,头状花序有单瓣(single)、半重瓣(semidouble)和重瓣(double)等3种状态,花色则有白(white)、黄(yellow)、红(red)、紫(purple)、粉红(pink)、绿(green)、双色系(doublecolor)和间色系(intermediatecolor)等8种类型。其中,发育树基部的第ⅰ和ⅱ类群均为小菊类型,其瓣型均为平瓣,头状花序同为单瓣,花色均为黄色。小类群ⅲ-1中含有ziyan、zihongtuogui及ziban等13个小菊品种,其余19个均为大菊品种,该小类群的舌状小花以平瓣为主,其次为匙瓣,少有脊瓣(taipingbao和xinxinghuo)和内曲(zilongtanzhua),其头状花序以重瓣为主,并含有fenban、zhenziju及ziban等5个单瓣品种以及casa、florange和yunshandiezi等3个半重瓣品种,同时该小类群的花色较为丰富,具有白、黄、红、紫、粉红及绿6种不同系列的花色。小类群ⅲ-2所含的5个品种除stresa外,均为大菊、重瓣类型,舌状小花以平瓣为主,而jinjiliuxia和nanshangaosi为脊瓣,该小类群花色有双色(cenluanbiran)、黄色(jinjiliuxia和nanshangaosi)以及粉红(stresa)三种

本发明鉴定菊花品种和母本来源,追踪起源,为下一步菊花育种奠定基础;取样更全面;近野生的品种菊花脑和黄龙眼和野生种野菊,在树的基部且聚到一起,说明野菊是她们的母本供体;近野生种橙红托桂,在groupiii中,和其他的近野生种距离遥远,说明他的母本不是野菊,而父本是野菊,他的母本和其他35个品种的母本是同一个,或者亲缘关系接近,因为目前缺乏对近野生菊杂交事件(或天然或人工)的记载,我们的研究可以追溯杂交事件,母本来源(更能体现本研究的价值),区分不同近野生菊花品种之间母系的关系远近。

通过将表型和遗传联合起来分析发现,花的大小和花头数量,这两个性状比较稳定,和叶绿体的结果基本一致。比如所有的日本菊花和中国传统菊花,都是大菊且双头。这个说明,也反过来证明了分类的可靠。图7为基于39个菊花品种与c.indicum的bi(bayesianinference)和ml(maximumlikelihood)系统发育分析,分支上的数值为后验概率/自展值,pp(posteriorprobability)/bs(bootstrap)。

对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。

<120>一种菊花叶绿体基因组ssr标记库、其获得方法及其应用

我要回帖

更多关于 探针在基因组上的共线性分析 的文章

 

随机推荐