线粒体基因组为Psilidae(Diptera:Brachycera)提供了新系统发育和进化见解(全文)

发布时间:2022-07-05 09:00:05

下面是小编为大家整理的线粒体基因组为Psilidae(Diptera:Brachycera)提供了新系统发育和进化见解(全文),供大家参考。

线粒体基因组为Psilidae(Diptera:Brachycera)提供了新系统发育和进化见解(全文)

 

 为 线粒体基因组为 Psilidae (Diptera :Brachycera )提供了新的系统发育和进化见解

 抽象 Psilidae(Diptera:Brachycera)是一个中等大小的家族,目前被放置在超家族 Diopsoidea 中,并包含一些破坏性的农业和林业害虫。锈蝇的系统位置和家族内分类有待进一步研究,而铁蝇科的可用分子资料仍然有限。在这项研究中,我们介绍了 6 个Psiliidae物种的线粒体基因组(Chamaepsilatestudinaria Wang和Yang,Chyliza bambusae Wang和Yang,Chy. chikuni Wang,Loxocera lunata Wang 和 Yang,L. planivena Wang 和 Yang 以及 L. sinica Wang 和 Yang)。比较分析表明,在基因组成和排列方面,基因组结构保守,6 个扇形有丝分裂基因组的高度腺嘌呤加胸腺嘧啶偏倚的核苷酸组成。线粒体进化速率在 6 个物种之间有所不同,其中 Chylizinae 物种的平均速率低于 Psiliinae 物种。6 个物种的长度、核苷酸组成和重复单元的拷贝数是可变的,这可能为 Psiliidae 的系统发育和进化研究提供有用的信息。基于 4 个有丝分裂基因组数据集(AA,PCG,PCG12RNA 和PCGRNA)的系统发育分析支持 Psilidae 的单系,以及 Chylizinae 和 Psilinae 之间的姐妹关系,而 Diopsoidea 则被认为是非单系的。我们的研究启发了丝裂基因组数据在基于更密集的分类群采样的 Psiliidae 系统发育和进化研究中的未来应用。

 关键字:

 生锈苍蝇; 疽嗪; 鞘翅目; 线粒体基因组; 发展史 1. 引言 线粒体是细胞器,在真核细胞代谢中起核心作用[1],并带有自己的基因组(称为线粒体)[2,3,4]。有丝分裂基因组由于其体积小、拷贝数高、结构相对简单、进化速度快而成为分类学[5,6]、系统基因组学[7,8,9,10]、系统地理学[11,12]和分子进化学[13 ,14]研究的有力分子标记[5,6]、系统基因组学[7,8,9,10]、系统地理学[11,12]和分子进化学[13,14]。].高通量测序技术的最新进展使得有丝分裂基因组高效且经济高效地测序成为可能[16,17]。昆虫有丝分裂基因组是一个 15-18 kb的双链环状 DNA,通常包括 37 个基因(13 个蛋白质编码基因(PCG)、22 个转移 RNA 基因(tRNA)和 2 个核糖体 RNA 基因(rRNA))、一个对照区(CR 或 A+ T 富区)和几个较短的非编码区(NCRs)[18]。目前,有丝分裂基因组学数据已广泛应用于包括 Diptera 在内的不同昆虫组的比较基因组学、系统发育和进化分析[19,20 ,21,22,23]。Acalyptratae 是双翅目最多样化的谱系之一,由许多具有经济和科学重要性的物种组成[24,25]。然而,Acalyptratae 的公开有丝分裂基因组学数据主要集中在果蝇科和 Tephritidae 上,而关于其他 Acalyptrate 家族的信息仍然非常有限,这在很大程度上阻碍了我们对 Acalyptrate苍蝇的系统发育和进化的理解。

 蝇科,俗称锈蝇,是一组小型至中型、黄色或黑色的刺蒺果蝇,体型减少[26]。Psilids 具有经济重要性,因为它们的植食性幼虫在植物的根部,茎和块茎中挖洞[26 ,27,28],有时还会对竹子[29,30],胡萝卜,[31,32]和其他块根作物造成相当大的损害[33,34]。据报道,一些物种还诱导胆汁[35,36]。到目前为止,已有约 340 种物种被描述,Psilidae 分布在旧世界和新北极地区所有动物地理学领域,少数物种也出现在新热带地区[28,37]。Psilidae 的成员目前被分配为 3 个亚科(Belobackenbardiinae,Chylizinae 和 Psiliinae),而 Psiliidae 的属级分类已经争论了很长时间,特别是 Psilinae 的一些通用分类群的地位需要重新考虑[27,28,38,39]。此外,Psilidae 的分类学、系统发育和进化研究主要依赖于成虫、幼虫和卵的形态学特征[38,39,40,41],基于分子数据的该科的比较和系统发育分析仍未被引导。

 本研究提供了 6 种 Psiliidae 的有丝分裂基因组学数据,包括 Chylizinae 亚科(Chyliza bambusae Wang 和 Yang 和 Chy. chikuni Wang)的前 2 个有丝分裂基因组,Loxocera 属 3 种(L. lunata Wang 和 Yang,L. planivena Wang 和 L. sinica Wang和 Yang)的有丝分裂基因组,以及 Chamaepsila 属(Cha. testudinaria)的有丝分裂基因组。

 王和杨)。这 6 种样本物种中的一些,如 Chy. bambusae,已被记录为竹子的破坏性害虫[30]。对 6 个扇形有丝分裂基因组的基因组结构、核苷酸组成、取

 代率和进化速率进行了比较分析,并对 Psiliidae 进行了分子系统发育研究。本研究旨在促进我们对有丝分裂基因组多样性和Pssilidae 系统发育的了解。

 2. 材料和方法 2.1. 分类群取样和 DNA 提取

 在田间使用扫网收集成年苍蝇,并在 DNA 提取前在–20°C 下保存在 100%乙醇中。表 表 S1 提供了详细的收集数据。标本主要根据 Wang[42]和 Wang 和 Yang[43]中的键,描述和插图来识别。使用 DNeasy 血液和组织试剂盒从胸肌组织中提取基因组 DNA(德国希尔登 Qiagen)。样本标本的剩余身体部位被保存为凭证,并存放在中国北京的中国农业大学昆虫博物馆。样本凭证编号包含在 表 S1 中。

 线粒体基因组测序和组装

 制备了一个平均插入尺寸为 350 bp 的 Illumina TruSeq 文库,并在 Illumina NovaSeq 6000 平台上以 150 bp 的配对端读取进行测序。使用 Trimmomatic [44] 修剪适配器的原始读取,并使用 Prinseq [45] 删除低质量和短读取。使用 IDBA-UD [46]进行高质量读取的从头开始组装,相似性阈值为 98%,最小和最大 k 值分别为 41 和 141 bp。通过引物 LCO1490(5′-GGTCAACAAATCATAAAGATAAGATATTG-3′正向)和 HCO2198(5′-TAAACTTCAGGGACCAAAAAATCA-3′反向)的聚合酶链反应(PCR)扩增 5"末端(~610 bp)附近的 COI 片段[47],并通过 Sanger 测序获得。COI 片段用作诱饵参考,以识别 BLAST 搜索下最合适的线粒体重叠群[48],最小相似度为 98%。为了检查组装精度,使用 Geneious 10.1.3 将干净的读数映射到获得的线粒体重叠群上[49]。

 线粒体基因组注释与分析

 基因序列最初用 MitoZ 注释[50],并在 Geneious 10.1.3 中进一步校正[49]。PCG 和 rRNA 基因通过将其序列与其他报道的 Acalyptratae 物种的同源基因的序列对齐来注释。tRNA 基因的位置和二级结构是利用 tRNAscan-SE 搜索服务器( http://lowelab.ucsc.edu/tRNAscan-SE/ , 2022 年 3 月 14 日 访 问 )

 [51 , 52] 和 ARWEN 版 本 1.2(http://130.235.244.92/ARWEN/,2022 年 3 月 14 日访问)鉴定的[53]。用 MEGA 7.0 分析有丝分裂基因组的核苷酸组成和PCG 的密码子使用[54]。AT-skew [(A − T)/(A + T)]和 GC-skew [(G − C)/(G + C)]用于测量基因之间的核苷酸组成差异[55]。DnaSP 5.0 [56]用于计算 PCG 的同义词(Ks)和非同义(Ka)取代率。PCG 的进化速率(Ka/Ks,ω)[57,58]是手动计算的。

 系统发育分析

 包括 6 个新测序的 Psiliidae 有丝分裂基因组,共 19 个刺桔酸有丝分裂基因组用于系统发育分析(表 表 1)。2 种 Calyptratae物种的有丝分裂基因组被用作外群。

 表 表 1.本研究中使用的分类学信息,GenBank 加入编号和线粒体基因组的参考。

 每个物种的 13 个 PCG 在 TranslatorX 在线平台[67]上的 MAFFT 算法[66]下分别对齐,并具有 L-INS-I 策略和默认设置。使用 MAFFT 版本 7 在线服务器[68]将 2 个 rRNA 基因的序列与 G-INS-I 策略对齐。所有对齐均在 MEGA 7.0 中手动验证和检查[54]。制备了 4 个用于系统发育分析的数据集:(1)AA 基质,包括 13 个 PCG 的氨基酸序列(3676 个氨基酸);(2)PCG 基质,包括 13 个 PCG(11,028 bp)的所有 3 个密码子位;(3)PCGRNA 基质,包括 13 个 PCG 的所有 3 个密码子位置的核苷酸和 2 个 rRNA 基因(13,082 bp);和(4)PCG12RNA 基质,包括 13 个 PCG 的第一和第二密码子位置的核苷酸,以及 2个 rRNA 基因(9406 bp)。使用具有默认滑动窗口大小的 AliGROOVE [69]分析了 4 个数据集内序列散度的异质性。

 从 4 个数据集推断中推断出的系统发育树是在贝叶斯推理(BI)和最大似然(ML)方法下构建的。站点异构混合 CAT + GTR 模型用于所有数据集。BI 分析使用 PhyloBayes MPI v.1.5a 进行[70];2 个独立的马尔可夫链蒙特卡洛(MCMC)链在从对准中移除恒定位点后运行,并在 2 个运行令人满意地收敛后停止(最大差<0.3);从剩余的树中计算出一个共识树,这些树从 2次 运 行 中 组 合 而 来 , 之 后 每 次 运 行 的 初 始 25% 树 被 丢 弃 为 老 化 。

 ML 分 析 是 使 用 IQ-TREE 网 络 服 务 器(http://iqtree.cibiv.univie.ac.at/ 于 2022 年 3 月 14 日访问)[71]进行的,具有 1000 个引导复制和自动模型预测。

 3. 结果和讨论 3.1. 鳞毛蕨科有丝分裂细胞组的一般结构和核苷酸组成

 Cha. testudinaria,Chy. bambusae,Chy. chikuni,L. lunata,L. planivena 和 L. sinica 的完整有丝分裂组长度分别为 16,609,16,664,16,759,16,283,16,489 和 16,527 bp(图 图 1; 表 S2)。6 个有丝分裂体的长度差异主要是由于对照区域的大小可变。它们是紧凑的环状分子,每个分子含有 37 个典型的线粒体基因(13 个 PCG,22 个 tRNA 和 2 个 rRNA)和 1个对照区。在这些基因中,4 个 PCG(ND1,ND4,ND4L 和 ND5),8 个 tRNA(trnC,trnF,trnH,trnL1,trnP,trnQ,trnV和 trnY)和 2 个 rRNA(lrRNA 和 srRNA)编码在少数链(N 链)上,而其他 23 个基因位于多数链(J 链)上。6 个有丝分裂基因组的基因顺序和取向与典型的昆虫有丝分裂基因组相同[2,18]。尽管在昆虫科的多个目中已经报道了线粒体基因重排[18,72,73 ,74],但这些事件在双翅目中很少见,而双翅目只在蚊子(Culicidae)[75]和胆蠓(Cecidomyiidae)中发现[76]。因此,锈蝇的有丝分裂基因组似乎被保守,并保留了假定的祖先排列[18,21]。

 图 图 1.Chamaepsila testudinaria,Chyliza bambusae,Chyliza chikuni,Loxocera lunata,Loxocera planivena 和 Loxocera sinica的线粒体基因组。基因转录的方向由链上的箭头指示。转移 RNA 基因由其相应氨基酸的单字母 IUPAC-IUB 缩写表示。缩写:ATP6和ATP8用于三磷酸腺苷(ATP)合酶亚基6和8;用于细胞色素C氧化酶亚基I-III的COI-COIII;CYTB用于细胞色素b;ND1–ND6 和 ND4L 用于烟酰胺腺嘌呤二核苷酸氢 (NADH)

 脱氢酶亚基 1–6 和 4 L;用于大和小 rRNA 亚基的 lrRNA 和 srRNA;和 CR 表示控制区域。

 6 个 Pssilidae 有丝分裂基因组的核苷酸组成(表 表 2)相似,腺嘌呤加胸腺嘧啶(A + T)偏倚(77-80%),这是昆虫有丝分裂基因组的共同特征[18,77]。对照区具有最高的 A + T 含量,而 PCG 的第一和第二密码子位置具有最低的 A + T 含量。已经提出了几种假设来解释 A + T 偏倚的组成异质性[78,79,80],其中能源效率权衡[79]是实验测试的。该假设表明,A 和 T 的合成比胞嘧啶(C)和鸟嘌呤(G)的合成消耗更少的能量和氮[80]。所有 6 个 Psilidae 有丝分裂体均表现出阳性 AT 偏斜和负GC 偏斜;AT 偏斜范围从 0.023(L. lunata)到 0.062(Chy. bambusae);GC 偏斜范围从−0.222(Chy. chikuni)到−0.147(Cha. testudinaria)。链偏斜组成是由多种因素引起的,包括突变和选择压力[21],昆虫有丝分裂基因组中的 GC 偏斜值似乎与复制方向相关[80]。

 表 表 2.6 种 Psilidae 物种线粒体基因组的核苷酸组成。

 蛋白质编码基因,密码子的使用,进化速率

 13 个 PCG 的 Cha. testudinaria,Chy. bambusae,Chy. chikuni,L. lunata,L. planivena 和 L. sinica 的总大小分别为11,184 bp,11,182 bp,11,182 bp,11,196 bp,11,183 bp 和 11,183 bp 长。6 个有丝分裂基因组中的每一个都表现出 PCG 的负 AT 偏斜,范围从−0.172(Chy. bambusae)到−0.132(L. lunata),以及 PCG 的 GC 偏斜阳性,范围从 0.009(L. planivena)到 0.041(Chy. bambusae)(表 表 2)。

 所有 13 种 PCG 都具有标准的起始密码子 ATN(ATT 和 ATG 是最常用的),除了 COI 和 ND1 分别在所有采样的锈蝇中以 TCG 和 TTG 开头。在全代谢昆虫中,COI 的起始密码子通常是不规则的[19],TCG 是二翅目 COI 的常见起始密码子之一[19,21,81]。ND1 的非标准起始密码子 TTG 也已在双翅目的其他几个有丝分裂基因组中发现[82,83]。每个 PCG 以 TAA 或 TAG作为终止密码子终止,或以单个 T 残基作为不完全终止密码子终止,这在许多其他昆虫有丝分裂基因组中已被注意到[19,21,72]。不完全终止密码子被认为在 mRNA 成熟期间通过聚腺苷酸化填充[84]。最常用的密码子家族是 tnL2(>490),而在所有 6个有丝分裂基因组中最少的是 tnC(<50)(图 图 2)。6 个有丝分裂基因组的相对同义密码子使用(RSCU)模式大致相同,RSCU值如图 3 所示,并给出了 22 个氨基酸的所有可能的同义词密码子。最常用的密码子是每种氨基酸的 NNA 和 NNU(图 图 3)。

 图 图 2.6 种线粒体蛋白质编码基因的密码子使用模式。X 轴显示密码子族,Y 轴显示总密码子数。

  图 图 3.6 种线粒体蛋白质编码基因的相对同义词密码子用法(RSCU)。X 轴显示不同的氨基酸,Y 轴显示 RSCU 值(使用某个同义密码子的次数/使用编码氨基酸的所有密码子的平均次数)。

 同义取代率(Ks)在 6 个采样物种之间差异很大,而非同义取代率(Ka)在它们之间相似(图 图 S1表 ,表 S3)。Ka/Ks(ω)的比率是检测分子适应性的诊断统计量[57,58],用于研究 PCG 的进化速率。每个物种的 13 个 PCG 的 ω 值如图 4 所示。Chylizinae 的物种表现出比 Psiliinae 物种慢的平均进化速率;所有 13 个 PCG 的 ω 值均低于 1.0,表明它们正在纯化选择中[57,58];ATP8(0.48),ND4L(0.504)和 ND6(0.521)具有非常高的进化速率,而 COI(0.057)的 ω 值最低(图 图 4,表 表 S3)。

 图 图 4.6 种 Psilidae 物种的线粒体蛋白编码基因的进化速率(Ka / Ks 的比率)。缩写:ATP6 和 ATP8 用于三磷酸腺苷(ATP)合酶亚基 6 和 8;COX1–COX3 用于...

推荐访问:线粒体基因组为Psilidae(Diptera:Brachycera)提供了新系统发育和进化见解 线粒体 基因组 见解

版权所有:众一秘书网 2005-2024 未经授权禁止复制或建立镜像[众一秘书网]所有资源完全免费共享

Powered by 众一秘书网 © All Rights Reserved.。备案号: 辽ICP备05005627号-1