Preliminary study on distribution characteristics and positioning of microsatellites in whole genome of Pelteobagrus vachelli
-
摘要: 文章探究了瓦氏黄颡鱼 (Pelteobagrus vachelli) 全基因组微卫星的分布特征及其规律,旨在为相关功能性微卫星分子标记的筛选提供依据。利用MISA (MIcroSAtellite identification tool) 软件对其全基因组微卫星进行筛查和分析,并对外显子中含有微卫星的基因进行了GO (Gene Ontology) 注释和KEGG (Kyoto Encyclopedia of Genes and Genomes) 富集分析。在瓦氏黄颡鱼全基因组 (约663.53 Mb) 中筛查到6种完整型微卫星共417 724个,相对丰度为630 个·Mb−1,在全基因组总长度中占比1.48%。其中二碱基重复类型的微卫星个数最多,占微卫星总数的43.36%,其他依次分别是单碱基 (39.02%)、四碱基 (9.05%)、三碱基 (7.34%)、五碱基 (1.12%)和六碱基 (0.12%)。对筛选得到的完整型微卫星进行初步定位,发现其中10 924个微卫星分布在外显子区,共定位到5 788个基因上。GO分析表明注释到生物过程的基因数量最多,GO富集较为显著的条目为结合活性和细胞大分子代谢过程。KEGG富集表明这些基因共富集到273条通路,其中黄酮与黄酮醇生物合成等通路最为显著 (P=0)。联合分析预测瓦氏黄颡鱼定位到外显子上的微卫星和其体内的生物代谢过程密切相关。Abstract: In this study, MISA (MIcroSAtellite identification tool) was used to screen and analyze the distribution characteristics of microsatellites in the whole genome of Pelteobagrus vachelli, aiming to provide a basis for the selection of functional microsatellite markers. The genes containing microsatellites in the exon regions were subjected to GO annotation and KEGG enrichment. In the whole genome of P. vachelli (Approximately 663.53 Mb), 417 724 perfect microsatellites were identified, accounting for 1.48% of the total length. The relative abundance of microsatellites in P. vachelli was 630 pcs·Mb−1. Among the six repeat types, dinucleotides were the most frequent, accounting for 43.36% of the total microsatellites, followed by mononucleotides (39.02%), tetranucleotides (9.05%), trinucleotides (7.34%), pentanucleotides (1.12%) and hexanucleotides (0.12%). By investigating the locations of microsatellites in the genome, we found that 10 924 microsatellites which belonged to 5 788 genes were located in the exons. The GO annotation shows that the number of genes annotated to biological process was the largest, mainly associated with binding activity and cellular macromolecular metabolism. KEGG enrichment analysis shows that these genes were enriched in 273 pathways, among which, flavonoids and flavonol biosynthesis (P=0) were the most significantly enriched pathways. Integrated analysis indicates that the microsatellites located in the exons of genes in P. vachelli were closely related to the biological metabolism processes.
-
Keywords:
- Pelteobagrus vachelli /
- Genome /
- Microsatellite /
- Distribution characteristics
-
神经肽是从神经系统和内分泌系统产生和释放,参与调节生物个体的生理活动,维持生物体内环境稳态的一类重要信号因子,是NEI系统中最重要的调节因子之一,在脊椎和无脊椎动物中均有免疫调节功能。其中FMRFamide (Phe-Met-Arg-Pheamide) 是一种酰胺化四肽,是类 FMRF酰胺肽 (FMRFarmide-related peptides, Farps或FMRFamide-like peptide, FLPs) 家族的成员。其在神经系统中合成并释放,能通过神经元直接传递信号,并作为神经递质、神经调质和神经激素发挥作用[1],是无脊椎动物中含量最丰富的一类神经肽[2]。此外,该神经肽也能通过内分泌系统调节摄食和运动行为[3]。近年来,FMRFamide的生理功能受到普遍关注,如Marciniak等[4]研究发现其具有特异性的心脏活性,能有效调节甲虫内脏肌肉的内源性收缩活性。Kim等[5]研究皱纹盘鲍 (Haliotis discus hannai) 发现,FMRFamide神经肽对海洋腹足类动物生殖调节有重要促进作用。FMRFamide也被发现能够通过抑制有丝分裂来保护细胞免受凋亡[6]。而作为无脊椎动物中特有的神经肽,一些研究也表明其可能参与了海洋无脊椎动物的免疫应答。如Li等[7]通过对太平洋牡蛎 (Crassostrea gigas) 炎症刺激后的FMRFanide多肽治疗,发现FMRFamide多肽不仅由神经内分泌系统合成,而且还在血细胞中合成加工,首次证实了该多肽存在于血细胞中。Guan等[8]对加利福尼亚海兔 (Aplysia california) 的研究发现FMRFamide可以通过激活P38丝裂原激活蛋白 (MAP) 激酶来调节突触的可塑性和调节免疫效应物。
瘤背石磺 (Onchidium reevesii) 隶属于软体动物门、石磺科,又名土鸡、海赖子、涂龟、土海参等[9-10],常栖息在滩涂上的石缝中、植被的根部和阴暗潮湿的角落,主要分布于我国东部沿海地区[11-12]。瘤背石磺的中枢神经系统 (Central nervous system, CNS) 是一个简单的环状结构,体积大且易获得[13]。瘤背石磺不仅是研究无脊椎动物神经系统功能的模式种,而且由于其生活在潮间带,有良好的应激耐受机制,能适应波动的生存环境、各种重金属离子和病原体[14],对于研究无脊椎动物应对外界环境变化和病原入侵的免疫反应机制也有显著优势。为此,本研究在实验室瘤背石磺高通量转录组测序的基础上克隆得到了OrFMRFamide基因的全长,分析该基因的分子特征及其mRNA和多肽在组织中的分布,研究其在炎症刺激后的反应,从而为探究FMRFamide基因在瘤背石磺免疫机制中的作用提供了理论依据,也为进一步理解生活在潮间带的两栖类动物对恶劣环境的适应机理奠定基础。
1. 材料与方法
1.1 实验材料
2020年6月初在江苏省盐城市沿海滩涂采集成体鲜活瘤背石磺,带回实验室后暂养于70 cm×120 cm×50 cm的塑料养殖箱内,养殖箱底部覆盖5~10 cm厚的海泥,种植滩涂采集的植被,放上瓦片,放养滩涂捕捉的螃蟹在泥中打洞,为石磺提供休息躲避的巢穴,尽可能地模拟自然生态环境,消除实验外干扰。每天早晚定时投喂玉米粉和喷洒海水保持土壤湿润,定期检查瘤背石磺生长状况,以确保其较高的成活率。暂养1周后,取5只体态均匀、健康有活力的瘤背石磺 [ 体长 (43.55±1.32) mm,体质量 (15.73±0.78) g],用超纯水清洗表面的泥沙,取血细胞、神经节、肝胰腺、肌肉、性腺、皮肤和腹足等组织用液氮速冻后放入–80 ℃冰箱备用,用于组织cDNA模板的制备。
1.2 实验方法
1.2.1 总RNA的提取和cDNA的合成
实验所用器皿均经180 ℃高温杀菌处理3 h或使用DEPC处理过后进行高压灭菌。实验开始前将所有器材预冷备用,全程在冰上操作,取–80 ℃保存的瘤背石磺各组织,按照Trizol (Invitrogen, 美国) 说明书提取各组织的总RNA。配制质量浓度为10 mg·mL−1的琼脂糖凝胶,135 V、电泳15 min检测RNA提取质量,在核酸检测仪上标定提取RNA的浓度和纯度。将神经节RNA按照PrimeScript II 1st Strand cDNA Synthesis Kit (TaKaRa) 说明书合成cDNA第一链,作为后续实验的RACE (Rapid-amplification of cDNA ends) 模板。将提取所得的各组织RNA按照PrimeScript™ RT reagent Kit with gDNA Eraser (TaKaRa) 试剂盒说明书进行反转录,将获得的cDNA于–20 ℃保存备用。
1.2.2 OrFMRFamide基因的克隆
根据笔者实验室测得的转录组数据库 (未发表) 筛选得到目的基因的部分基因片段,使用Primer Premier 5.0软件设计2对引物,进行PCR扩增反应,反应产物用10 mg·mL−1的琼脂糖凝胶电泳检测,使用D2000 Ladder作为Maker,产物条带单一且清晰,送至苏州金唯智生物科技有限公司测序,测序结果在NCBI上BLAST比对,确认为FMRFamide基因片段,然后按照SMARTER® RACE5'/3'Kit及3'Full RACE Core Set With PrimerScriptTM RTase试剂盒的说明书在Primer Premier 5.0软件上设计5'和3' RACE特异性引物,通过RACE技术得到产物,产物经过1.0%琼脂糖凝胶电泳检测合格后送往苏州金唯智生物科技有限公司测序,将所得到的全部测序结果通过Sequebcher 5.0软件拼接得到OrFMRFamide基因的序列全长。
1.2.3 OrFMRFamide基因的序列分析
把拼接得到的基因序列全长在NCBI上用ORF Finder (https://www.ncbi.nlm.nih.gov/orffinder/) 在线工具对OrFMRFamide基因开放阅读框 (Open reading frame, ORF) 及编码氨基酸进行预测,得到预测的编码氨基酸后在NCBI上用在线工具BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) 进行同源性比较,使用NetNGlyc 1.0 Server (http://www.cbs.dtu.dk/services/NetNGlyc/) 在线工具确定糖基化位点,理化性质用ProtParam (http://web.expasy.org/protparam/) 在线工具分析,使用NetPhos 2.0 Server (http://www.cbs.dtu.dk/services/NetPhos–2.0/) 在线工具查找磷酸化位点,使用Signal 5.0 (http://www.cbs.dtu.dk/services/SignalP/) 在线工具查找信号肽。用MEGA-X软件基于比邻法,以1 000次Bootstraps构建瘤背石磺与其他物种FMRFamide基因的系统进化树。
1.2.4 OrFMRFamide基因在不同组织中的表达
通过在线工具Genscrip (https://www.genscript.com/tools/real–time–pcr–taqman–primer–design–tool) 根据OrFMRFamide基因全长序列设计荧光定量引物 (表1),以18S作为内参基因,以上述验证过的瘤背石磺各组织cDNA为模板,使用 ChamQ Universal SYBR qPCR Master Mix (Vazyme,美国) 试剂盒在CFX-96 (Bio-Rad,美国) 进行荧光定量反应,每个样品和内参都设置3个平行对照,以Rnase-free双蒸水 (ddH2O) 为阴性对照,实时荧光定量PCR数据用2–ΔΔCT法进行分析。
表 1 实验中所用引物序列Table 1. Primers used in this experiment引物
Primer引物序列 (5'–3')
Primer sequence用途
FunctionOrFMRFamide-F1 CTTAGGAGTGGGAACAGC 验证目的片段 OrFMRFamide-R1 CGGCTGGAGATTTGATTG OrFMRFamide-F2 CGGACCAGTACGACCAAC OrFMRFamide-R2 GTTCAGTCCGCCCTAATG OrFMRFamide-3'RACE-inter ACTGGTTTGGGTAGCA 3'RACE 特异性引物 OrFMRFamide-3'RACE-outer ATGGCAACAATGTCTTTCG OrFMRFamide-5'RACE-inter GAGCAGAAGATGGCGT 5'RACE 特异性引物 OrFMRFamide-5'RACE-outer TCCTCGCTTTGCCTCA OrFMRFamide-RT-F AGCTGGAGGACACACTGAGGCA Real-time RT-PCR OrFMRFamide-RT-R TGCCACATCGCCCTCATCGG 18S-F TCCGCAGGAGTTGCTTCGAT 18S-R ATTAAGCCGCAGGCTCCACT 1.2.5 免疫组织化学分析
免疫组织化学取养殖箱暂养未经处理的5只瘤背石磺进行实验。采集未经处理的新鲜的神经节、肝胰腺、性腺、腹足、肌肉和皮肤,用4%的多聚甲醛固定6 h,转移至20%的蔗糖溶液固定过夜,然后转移至40%的蔗糖溶液固定到组织沉底,使用冰冻切片机 (莱卡CM1950) 切片后贴在黏附载玻片上,按照一步法免疫组化试剂盒 (凯基) 说明书完成免疫组化实验,用显微镜观察拍照。
1.2.6 LPS刺激
在养殖箱中暂养7 d后随机选取100只瘤背石磺,平均分为2组,暂养在2个养殖箱中,分别给每只瘤背石磺注射100 μL磷酸盐缓冲溶液 (Phosphate buffered saline, PBS) 和100 μL脂多糖 (LPS, 0.5 mg·mL–1,溶于PBS),经处理的瘤背石磺分别放回养殖箱暂养,分别在注射后第0、第6、第12、第24、第48小时取样,每次随机抽取9只石磺,将3只的血细胞、神经节、肝胰腺、肌肉、性腺、皮肤和腹足合并为1个样本,每个时间点采集3个平行样本。血细胞的采集是使用1 mL注射器从瘤背石磺腹部抽取血液,在800 ×g、4 ℃条件下离心10 min,获得血细胞后将其溶解在trizol中,用液氮速冻,于–80 ℃保存。其他组织取样后放入液氮速冻,于–80 ℃保存。用trizol法提取各组织RNA,用HiScript Q RT SuperMix for qPCR (+gDNA wiper, Vazyme,美国) 试剂盒进行反转录,得到的cDNA于–20 ℃备用。
1.2.7 OrFMRFamide基因在炎症刺激后的时空表达
按照上述方法,以各组织各个时期刺激前后的cDNA为模板,18S为内参,进行实时荧光定量RT-PCR扩增实验,数据使用2–ΔΔCT法进行分析。
1.2.8 统计学分析
使用SPSS 26.0软件对荧光定量的数据进行处理,单因素方差分析结果以“平均值±标准差 (
$ \overline X \pm {\rm{SD}} $ )”表示。P<0.05为差异显著,P<0.01为差异极显著。2. 结果
2.1 OrFMRFamide的cDNA序列特征
根据瘤背石磺转录组测序结果获得的OrFMRFamide基因片段,通过3'和5'-RACE扩增得到该基因全长序列为2 618 bp,开放阅读框 (Open reading frame, ORF)为882 bp,基因序列末端加尾信号AATAA与Poly (A) 之间有17个碱基 (图1)。ProtParam推测编码1个含有293个氨基酸的蛋白,分子量为33847.88 kD,理论等电点 (pI) 为9.25,不稳定指数为57.00,预测为不稳定蛋白,溶脂指数为55.67,平均疏水指数为–0.890。Server预测该蛋白不存在糖基位点。NetPhos 2.0 Server预测该蛋白含有12个磷酸化位点 [ 丝氨酸 (Ser):4;苏氨酸 (Thr):2;酪氨酸 (Tyr):6]。信号肽软件预测该基因有1个N端信号肽 (1~24)。
图 1 FMRFamide基因的氨基酸序列及cDNA全长浅灰色阴影部分是该基因编码信号肽部分,起始密码子和终止密码子用方框标出,深灰色阴影是磷酸化位点,末端加尾信号AATAAA用下划线标出,poly (A) 用斜体表示Figure 1. Amino acid sequence and full length cDNA of FMRFamide geneThe light grey shaded portion is the signal peptide portion of the gene; the start and stop codons are boxed; the dark grey shaded portion is the phosphorylation site; the end plus tail signal AATAAA is underlined, and poly (A) is in italics.2.2 系统进化树分析
将预测得到的OrFMRFamide基因的氨基酸序列放到NCBI上进行BLAST比对,发现其与其他物种的FMRFamide基因有较高的同源性,下载这些物种的氨基酸序列,使用MEGA-X软件构建进化树 (图2)。结果显示,瘤背石磺和静水椎实螺 (Lymnaea stagnalis) 聚为一支,再与加利福尼亚海兔、棕蜗牛 (Cornu aspersum) 等腹足纲软体动物聚为一大支,与双壳纲海洋贝类聚为一大支,与环节动物和节肢动物各聚为一支。瘤背石磺与静水椎实螺进化关系最为接近。
2.3 OrFMRFamide在不同组织中的表达分析
荧光定量RT-PCR结果显示,OrFMRFamide基因在神经节中的表达量极显著高于在其他组织的(P<0.01),此外,该基因也在血细胞、肝胰腺、皮肤、性腺组织中表达,几乎不在肌肉和腹足中表达 (图3)。以性腺的表达量为参照,血细胞、神经节、肝胰腺和皮肤的表达量分别约为性腺的2.33、1 025.47、36.96和6.86倍。
2.4 FMRFamide多肽免疫组织化学分析
利用免疫组织化学的方法分析瘤背石磺FMRFamide神经肽在神经节、肝胰腺、肌肉、性腺、皮肤和腹足中的分布情况 (图4),结果显示OrFMRFamide基因在不同组织中的表达模式和FMRFamide神经肽的分布水平相一致,在神经节中大量表达,在性腺、皮肤和肝胰腺中微量表达,在腹足和肌肉中几乎不表达。
2.5 OrFMRFamide在LPS刺激后的时空表达分析
基于瘤背石磺OrFMRFamide基因在不同组织中的相对表达量,研究该基因在LPS刺激后48 h内的表达变化 (图5)。LPS组肝胰腺中OrFMRFamide基因的表达量在注射后第12小时达最高值,与PBS组差异显著 (P<0.05),皮肤中OrFMRFamide基因的表达量随时间变化差异不大,但LPS组整体的表达量显著高于PBS对照组 (P<0.05),神经节中该基因的表达量在第12 小时达最高值,整体表达水平显著高于PBS对照组 (P<0.05),血细胞中该基因的相对表达量在第12小时达最高值,性腺中的表达量随时间变化的差异不显著,且LPS组和PBS组差异也不显著 (P>0.05)。
3. 讨论
本研究克隆了瘤背石磺FMRFamide基因,系统进化树显示其与静水椎实螺、棕蜗牛聚为一支,说明其与软体动物门腹足纲贝类的亲缘关系非常近,与软体动物双壳纲贝类明显区分开来。
神经节、肝胰腺和血细胞属于NEI (神经节、肝胰腺、血细胞) 系统,有报道指出NEI系统在应激和感染过程中能维持机体内环境稳定,有效清除病原体,调节机体平衡,减少对宿主的伤害[15]。FMRFamide作为软体动物神经系统中的重要组成部分[16],实时荧光定量结果显示OrFMRFamide在神经节、血细胞和肝胰腺组织中均有较高的表达,在神经节中表达量最高,可能因为其参与神经系统中神经递质的合成和释放及神经内分泌系统的可塑性调节。杨金龙等[17]在研究厚壳贻贝 (Mytilus coruscus) 早期幼虫发育时也发现,FMRFamide大量存在于神经系统中。在其他软体动物如双壳纲[7,18]、腹足纲[19]、头足纲[20]中,FMRFamide多肽也被报道主要存在于神经系统、消化系统和血细胞中。FMRFamide在瘤背石磺NEI系统中的高表达说明该基因可能对瘤背石磺的稳态起重要作用,推测FMRFamide可能在神经节、肝胰腺和血细胞中合成和加工,然后通过自分泌/旁分泌信号通路释放到血细胞中来调节机体。荧光定量结果显示瘤背石磺FMRFamide还存在于皮肤中,高凤娟等[21]和Allan等[22]对花背蟾蜍 (Bufo raddei) 和北美木蛙 (Rana sylvatica) 的研究表明,两栖类动物皮肤具有先天免疫功能,说明瘤背石磺作为无贝壳的两栖型贝类,为适应潮间带恶劣的生存环境,FMRFamide多肽可能参与了其先天免疫。FMRFamide应用免疫组化学进一步证实了OrFMRFamide在不同组织中的分布和FMRFamide多肽的分布一致,这与Terrnina等[23]对猫肝吸虫 (Opisthorchis felineus) 和Allan等[22]对星虫 (Themiste lageniformis) 中FMRFamide的定位结果相似。
炎症刺激实验结果显示,瘤背石磺神经节、肝胰腺和血细胞中FMRFamide基因相对表达量变化趋势为先上升后降低,在注射脂多糖12 h后的表达量达最大值,说明FMRFamide可能参与了免疫防御反应。在无脊椎动物中,血细胞被认为是宿主在免疫防御反应中起重要作用的免疫相关细胞[24],更有研究表明免疫细胞可以通过自分泌信号途径重新合成神经肽来调节肌体免疫反应[25-27]。Wang等[28]用寄生虫感染光滑双脐螺 (Biomphalaria glabrata),发现FMRFamide相对表达量高于对照组,FMRFamide表达量上升以抵抗寄生虫感染,这和本研究结果一致,可以推测FMRFamide多肽能保护机体免受侵害,响应免疫刺激,在维持机体稳态中发挥重要作用。炎症刺激后瘤背石磺性腺中FMRFamide相对表达量变化不显著,Hada等[29]研究发现FMRFamide还能影响根结线虫 (Meloidogyne graminicola) 的繁殖因子,Kerbl等[30]的研究也证实FMRFamide能作用于生殖腺,影响动物的交配行为,推测瘤背石磺性腺中的FMRFamide可能对瘤背石磺的繁殖有影响,但不参与维持自身稳态。
-
图 2 瓦氏黄颡鱼微卫星分布于外显子的基因GO功能注释
1. 结合;2. 催化活性;3. 转运活性;4. 核酸结合转录因子活性;5. 分子传感器活性;6. 信号传感器活性;7. 分子功能调节剂;8. 结构分子活性;9. 转录因子活性、蛋白质结合;10. 翻译调节活性;11. 细胞;12. 细胞部分;13. 膜;14. 细胞器;15. 膜组分;16. 高分子复合物;17. 细胞器部分;18. 胞外区;19. 膜封闭腔;20. 膜外区部分;21. 细胞过程;22. 代谢过程;23. 单生物过程;24. 生物调节;25. 生物过程调节;26. 刺激应答;27. 信号;28. 定位;29. 细胞成分组织或生物发生;30. 多细胞生物过程;31. 发展过程;32. 生物过程的负调控;33. 生物过程的正调控;34. 生物黏附;35. 运动活性。
Figure 2. GO function annotation of genes with microsatellites in exons in P. vachelli
1. Binding; 2. Catalytic activity; 3. Transporter activity; 4. Nucleic acid binding transcription factor activity; 5. Molecular transducer activity; 6. Signal transducer activity; 7. Molecular function regulator; 8. Structural molecule activity; 9. Transcription factor activity, protein binding; 10. Translation regulator activity; 11. Cell; 12. Cell part; 13. Membrane; 14. Organelle; 15. Membrane part; 16. Macromolecular complex;17. Organelle part; 18. Extracellular region; 19. Membrane-enclosed lumen; 20. Extracellular region part; 21. Cellular process;22. Metabolic process; 23. single-organism process; 24. Biological regulation; 25. Regulation of biological process; 26. Response to stimulus; 27. Signaling; 28. Localization; 29. Cellular component organizationor biogenesis; 30. Multicellular organismal process; 31. Developmental process; 32. Negative regulation of biological process; 33. Positive regulation of biological process; 34. Biological adhesion; 35. Locomotion.
表 1 瓦氏黄颡鱼基因组中不同类型微卫星统计
Table 1 Summary of different types of microsatellite in genome of P. vachelli
重复类型
Repeat type数量
Total
number/个占比
Proportion/%总长度
Total
length/bp占比
Proportion/%平均长度
Average
length/bp频率
Frequency/
(个·Mb−1)密度
Density/
(bp·Mb−1)单核苷酸 Mononucleotide 162 987 39.02 2 137 066 21.75 13.11 245.63 3 220.73 二核苷酸 Dinucleotide 181 107 43.36 5 291 784 53.85 29.22 272.94 7 975.15 三核苷酸 Trinucleotide 30 661 7.34 956 385 9.73 31.19 46.21 1 441.35 四核苷酸 Tetranucleotide 37 787 9.05 1 228 528 12.50 32.51 56.95 1 851.49 五核苷酸 Pentanucleotide 4 689 1.12 188 890 1.92 40.28 7.07 284.67 六核苷酸 Hexanucleotide 493 0.12 23 472 0.24 47.61 0.74 35.37 表 2 次数排名前10的重复碱基类别
Table 2 Top ten types of SSRs with most repeated copy numbers
SSR类别
SSR typeSSR出现次数
SSR occurrence占各碱基类型比例
Proportion of each base type/%A 158 915 97.50 AC 130 224 71.90 AG 31 118 17.18 AT 19 593 10.82 AAT 17 101 55.77 AAAT 9 490 25.11 AATG 9 210 24.37 ATC 4 106 13.39 AGAT 3 755 9.94 AAAG 2 865 7.58 表 3 瓦氏黄颡鱼基因组中排名前3的微卫星重复拷贝类别
Table 3 Top three dominant base classes in each base repeat type in P. vachelli genome
单碱基
Mononucleotide二碱基
Dinucleotide三碱基
Trinucleotide四碱基
Tetranucleotide五碱基
Pentanucleotide六碱基
HexanucleotideA
158 915a
97.50%bAC
13 002a
71.90%bAAT
17 101a
55.77%bAAAT
9 490a
25.11%bAATCT
365a
7.78%bGGGTTA
111a
22.5%bC
4 072a
2.50%bAG
31 118a
17.18%bATC
4 106a
13.39%bAATG
9 210a
24.37%bAAAGA
305a
6.50%bCTAACC
73a
14.8%bAT
19 593a
10.82%bAAG
3 060a
9.98%bAGAT
3 755a
9.94%bAAAAT
210a
4.48%bTGTAAA
54a
10.95%b注:a. 微卫星的个数;b. 该种微卫星占其碱基类型的比例。 Note: a. Number of microsatellites; b. Proportion of the microsatellites in the base type. 表 4 瓦氏黄颡鱼微卫星分布于外显子的基因GO富集
Table 4 GO enrichment of genes with microsatellites located in exons in P. vachelli
条目
TermGO码
GO ID输入数
Input number/个背景数
Background number/个P 结合 Binding 0005488 2 660 8 375 7.20×10−17 细胞大分子代谢过程 Cellular macromolecule Metabolic process 0044260 976 2 782 1.49×10−14 核 Nucleus 0005634 371 920 3.38×10−14 大分子代谢过程 Macromolecule metabolic process 0043170 1 095 3 196 3.70×10−13 细胞膜结合细胞器 Intracellular membrane-bounded organelle 0043231 475 1 263 5.81×10−12 细胞代谢过程 Cellular metabolic process 0044237 1 134 3 353 6.36×10−12 膜结合细胞器 Membrane-bounded organelle 0043227 486 1 306 2.13×10−11 基因表达调控 Regulation of gene expression 0010468 364 939 3.10×10−11 RNA生物合成过程 RNA biosynthetic process 0032774 375 972 3.13×10−11 转录、DNA模板化 Transcription, DNA-templated 0006351 374 970 3.65×10−11 表 5 瓦氏黄颡鱼微卫星分布于外显子的基因KEGG富集
Table 5 KEGG enrichment of genes with microsatellites in exons in P. vachelli
功能分类
Functional classification通路
Pathway输入数
Input number/个背景数
Background number/个P 机体系统
Organismal system甲状腺激素信号通路
Thyroid hormone signaling pathway66 147 1.45×10−5 胰岛素信号通路
Insulin signaling pathway73 173 7.57×10−5 神经营养因子信号通路
Neurotrophin signaling pathway64 156 4.83×10−4 昼夜节律
Circadian rhythm22 46 2.18×10−3 背腹轴形成
Dorso-ventral axis formation16 32 3.61×10−3 细胞过程
Cellular process黏合连接
Adherens junction59 115 1.51×10−7 内吞作用
Endocytosis135 345 1.86×10−5 黏着
Focal adhesion104 280 1.29×10−3 凋亡-果蝇
Apoptosis-fly29 63 1.37×10−3 自噬-酵母
Autophagy-yeast32 75 4.08×10−3 环境信息处理
Environmental information processingErbB信号通路
ErbB signaling pathway54 115 1.52×10−5 Hedgehog 信号通路-果蝇
Hedgehog signaling pathway-fly21 34 1.70×10−5 Hippo信号通路
Hippo signaling pathway84 200 3.07×10−5 FoxO信号通路
FoxO signaling pathway76 179 4.34×10−5 Notch信号通路
Notch signaling pathway35 69 4.48×10−5 代谢
Metabolism黄酮与黄酮醇生物合成
Flavone and flavonol biosynthesis1 1 0.00 单巴坦生物合成
Monobactam biosynthesis2 2 0.00 角质的生物合成
Cutin,suberine and wax biosynthesis1 1 0.00 安莎霉素的生物合成
Biosynthesis of ansamycins2 2 0.00 香叶醇降解
Geraniol degradation2 2 0.00 遗传信息处理
Genetic information processingmRNA监控通路
mRNA surveillance pathway42 96 7.33×10−4 基础转录因子
Basal transcription factors19 38 1.90×10−3 剪接体
Spliceosome49 124 4.54×10−3 RNA转运
RNA transport63 168 6.96×10−3 真核生物核糖体的生物合成
Ribosome biogenesisin eukaryotes30 74 1.22×10−2 -
[1] TAUTZ D, RENZ M. Simple sequences are ubiquitous repetitive components of eukaryotic genomes[J]. Nucleic Acids Res, 1984, 12(10): 4127-4138. doi: 10.1093/nar/12.10.4127
[2] 何平. 真核生物中的微卫星及其应用[J]. 遗传, 1998, 20(4): 44-49. [3] 罗文永, 胡骏, 李晓方. 微卫星序列及其应用[J]. 遗传, 2003, 25(5): 615-619. doi: 10.3321/j.issn:0253-9772.2003.05.027 [4] ZHAO X Y, TAN Z Y, FENG H P, et al. Microsatellites in different Potyvirus genomes: survey and analysis[J]. Gene, 2011, 488(1/2): 52-56.
[5] 张增翠, 侯喜林. SSR分子标记开发策略及评价[J]. 遗传, 2004(5): 763-768. doi: 10.3321/j.issn:0253-9772.2004.05.037 [6] WU X P, FENG Y W, JIANG H L, et al. A preliminary genetic linkage map of Sinonovacula constricta (Lamarck, 1818) based on microsatellites derived from RAD sequencing[J]. J Ocean U China, 2018, 17(4): 947-956. doi: 10.1007/s11802-018-3543-5
[7] 赵娜, 常剑波, 陶江平, 等. 基于微卫星标记的中华鲟亲子关系判别及案例分析[J/OL]. 水生态学杂志. [2021-01-15]. http://kns.cnki.net/kcms/detail/42.1785.X.20200915.1323.002.html. [8] 苏胜彦, 张林兵, 李海洋, 等. 基于微卫星标记的大口黑鲈 (Micropterus salmoides) 原种和养殖群体遗传多样性和结构分析[J]. 浙江大学学报 (农业与生命科学版), 2020, 46(6): 687-698. [9] 蔡焰值, 蔡烨强, 何长仁. 瓦氏黄颡鱼生物学的初步研究[J]. 北京水产, 2003(6): 24-29. [10] 李明锋. 瓦氏黄颡鱼研究进展及前景展望[J]. 现代渔业信息, 2011, 26(1): 5-12. [11] 巩高瑞, 张晋, 丹成, 等. 应用DNA分子标记鉴定黄颡鱼、瓦氏黄颡鱼及其杂交种的研究[J]. 水生生物学报, 2017, 41(2): 321-325. doi: 10.7541/2017.39 [12] 葛学亮, 尹洪滨, 毕冰, 等. 黄颡鱼遗传图谱构建及生长相关性状的QTL定位[J]. 水产学报, 2010, 34(2): 185-193. [13] 李大宇, 殷倩茜, 侯宁, 等. 黄颡鱼 (Pelteobagrus fulvidraco) 不同生态地理分布群体遗传多样性的微卫星分析[J]. 海洋与湖沼, 2009, 40(4): 460-469. doi: 10.3321/j.issn:0029-814X.2009.04.011 [14] 李林, 梁宏伟, 李忠, 等. 瓦氏黄颡鱼线粒体全基因组序列分析及系统进化[J]. 遗传, 2011, 33(6): 627-635. [15] 郑翔, 徐杰杰, 张佳佳, 等. 4个瓦氏黄颡鱼群体遗传多样性的微卫星分析[J]. 水产科学, 2020, 39(5): 657-668. [16] 何晶晶, 黄建华, 牛红艳, 等. 猪蛔虫全基因组微卫星分子标记开发与特征分析[J]. 中国兽医杂志, 2020, 56(9): 11-14, 19. [17] 张雪莲, 王红梅, 王磊, 等. 草地贪夜蛾基因组微卫星的分布规律[J]. 应用昆虫学报, 2020, 57(6): 1287-1298. [18] 徐杰杰, 毕宜慧, 程景颢, 等. 中华绒螯蟹 (Eriocheir sinensis) 全基因组微卫星分布特征研究[J/OL]. 基因组学与应用生物学. [2021-03-21]. http://61.175.198.136:8083/rwt/CNKI/http/NNYHGLUDN3WXTLUPMW4A/kcms/detail/45.1369.Q.20210118.1225.006.html. [19] 段永楠, 刘奕, 胡隐昌, 等. 美丽硬仆骨舌鱼全基因组微卫星分布规律特征[J]. 中国农学通报, 2019, 35(23): 152-158. doi: 10.11924/j.issn.1000-6850.casb18030101 [20] 王耀嵘, 杨尉, 任席林, 等. 金钱鱼基因组微卫星分布特征分析及多态性标记开发[J]. 广东海洋大学学报, 2020, 40(4): 7-14. doi: 10.3969/j.issn.1673-9159.2020.04.002 [21] 梁霞, 王慧琪, 马宇璇, 等. 鲤鱼 (Cyprinus carpio) 全基因组微卫星分布特征研究[J]. 南京师范大学学报(自然科学版), 2021, 44(3): 103-111. [22] CONESA A, GÖTZ S, GARCÍA-GÓMEZ J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21(18): 3674-3676. doi: 10.1093/bioinformatics/bti610
[23] XIE C, MAO X, HUANG J, et al. KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases[J]. Nucleic Acids Res, 2011, 39(Suppl2): W316-W322. doi: 10.1093/nar/gkr483
[24] SUBRAMANIAN S, MISHRA R K, SINGH L. Genome-wide analysis of microsatellite repeats in humans: their abundance and density in specific genomic regions[J]. Genome Biol, 2003, 4(2): 1-10. doi: 10.1186/gb-2003-4-2-p1
[25] TONG X L, DAI F Y, LI B, et al. Microsatellite repeats in mouse: abundance, distribution and density[J]. 动物学报, 2006, 52(1): 138-152. [26] 戚文华, 蒋雪梅, 肖国生, 等. 牛和绵羊全基因组微卫星序列的搜索及其生物信息学分析[J]. 畜牧兽医学报, 2013, 44(11): 1724-1733. [27] 徐杰杰, 郑翔, 张鑫宇, 等. 4种河鲀全基因组微卫星分布特征分析研究[J/OL]. 基因组学与应用生物学. [2021-01-25]. http://kns.cnki.net/kcms/detail/45.1369.q.20191126.1019.002.html. [28] 徐杰杰, 郑翔, 李杰, 等. 黄颡鱼 (Pelteobagrus fulvidraco) 全基因组微卫星分布特征分析[J]. 基因组学与应用生物学, 2020, 39(12): 5488-5498. [29] 王月月, 刘雪雪, 董坤哲, 等. 7种家养动物全基因组微卫星分布的差异研究[J]. 中国畜牧兽医, 2015, 42(9): 2418-2426. [30] 阮晓红. 大菱鲆(Turbot)微卫星标记的筛选与应用[D]. 青岛: 中国海洋大学, 2009: 53-54. [31] 黄杰, 杜联明, 李玉芝, 等. 红原鸡全基因组中微卫星分布规律研究[J]. 四川动物, 2012, 31(3): 358-363. [32] 崔凯, 岳碧松. 绿尾虹雉全基因组微卫星分布规律研究[J]. 四川动物, 2018, 37(5): 533-540. doi: 10.11984/j.issn.1000-7083.20180096 [33] 黄杰, 刘磊, 杨波, 等. 普通鸬鹚基因组微卫星分布规律研究[J]. 野生动物学报, 2020, 41(1): 108-114. doi: 10.3969/j.issn.1000-0127.2020.01.015 [34] TÓTH G, GÁSPÁRI Z, JURKA J. Microsatellites in different eukaryotic genomes: survey and analysis[J]. Genome Res, 2000, 10(7): 967-981. doi: 10.1101/gr.10.7.967
[35] 上官清, 陈昆慈, 刘海洋, 等. 斑鳢基因组中微卫星分布特征及野生种群遗传结构分析[J]. 南方水产科学, 2020, 16(3): 47-60. [36] SCHORDERET D F, GARTLER S M. Analysis of CpG suppression in methylated and nonmethylated species[J]. P Natl Acad Sci USA, 1992, 89(3): 957-961. doi: 10.1073/pnas.89.3.957
[37] PEARSON C E, SINDEN R R. Alternative structures in duplex DNA formed within the trinucleotide repeats of the myotonic dystrophy and fragile X loci[J]. Biochemistry-US, 1996, 35(15): 5041-5053. doi: 10.1021/bi9601013
[38] XU Y, LI W, HU Z, et al. Genome-wide mining of perfect microsatellites and tetranucleotide orthologous microsatellites estimates in six primate species[J]. Gene, 2018, 643: 124-132. doi: 10.1016/j.gene.2017.12.008
[39] XIAO T W, YU J Z, LIAO Q, et al. Comparative analyses of simple sequence repeats (SSRs) in 23 mosquito species genomes: identification, characterization and distribution (Diptera: Culicidae)[J]. Insect Sci, 2019, 26: 607-619. doi: 10.1111/1744-7917.12577
[40] ELLEGREN H. Heterogeneous mutation processes in human microsatellite DNA sequences[J]. Nature Genet, 2000, 24(4): 400-402. doi: 10.1038/74249
[41] WIERDL M, DOMINSKA M, PETES T D. Microsatellite instability in yeast: dependence on the length of the microsatellite[J]. Genetics, 1997, 146(3): 769-779. doi: 10.1093/genetics/146.3.769
-
期刊类型引用(1)
1. QIU Jiayin,SUN Lianlian,LI Shuang,ZHOU Xu,CHI Changfeng,ZHENG Libing. Identification and Expression Profile of a Neuropeptide LFRFamide-Like Gene During Different Stages of Gonadal Development in the Cephalopod Sepia pharaonis. Journal of Ocean University of China. 2024(02): 499-508 . 必应学术
其他类型引用(0)