基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究

洪永强, 谢永和, 刘鲁强, 董韶光, 李德堂, 王云杰, 姜旭阳, 张佳奇, 王君, 高炜鹏, 陈卿

洪永强, 谢永和, 刘鲁强, 董韶光, 李德堂, 王云杰, 姜旭阳, 张佳奇, 王君, 高炜鹏, 陈卿. 基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究[J]. 南方水产科学, 2024, 20(1): 62-73. DOI: 10.12131/20230185
引用本文: 洪永强, 谢永和, 刘鲁强, 董韶光, 李德堂, 王云杰, 姜旭阳, 张佳奇, 王君, 高炜鹏, 陈卿. 基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究[J]. 南方水产科学, 2024, 20(1): 62-73. DOI: 10.12131/20230185
HONG Yongqiang,  XIE Yonghe,  LIU Luqiang,  DONG Shaoguang,  LI Detang,  WANG Yunjie,  JIANG Xuyang,  ZHANG Jiaqi,  WANG Jun,  GAO Weipeng,  CHEN Qing. Research on water quality dissolved oxygen prediction method based on ESSA-LSTM for aquaculture ships[J]. South China Fisheries Science, 2024, 20(1): 62-73. DOI: 10.12131/20230185
Citation: HONG Yongqiang,  XIE Yonghe,  LIU Luqiang,  DONG Shaoguang,  LI Detang,  WANG Yunjie,  JIANG Xuyang,  ZHANG Jiaqi,  WANG Jun,  GAO Weipeng,  CHEN Qing. Research on water quality dissolved oxygen prediction method based on ESSA-LSTM for aquaculture ships[J]. South China Fisheries Science, 2024, 20(1): 62-73. DOI: 10.12131/20230185

基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究

基金项目: 浙江省“尖兵”“领雁”研发攻关计划 (2022C03023)
详细信息
    作者简介:

    洪永强(1996—),男,硕士研究生,研究方向为船舶与海洋工程。E-mail: 1791075392@qq.com

    通讯作者:

    谢永和(1967—),男,教授,博士,研究方向为船舶与海洋工程。E-mail: xieyh@zjou.edu.cn

  • 中图分类号: S 951

Research on water quality dissolved oxygen prediction method based on ESSA-LSTM for aquaculture ships

  • 摘要:

    为了准确预测水质参数中的溶氧量,采用长短时记忆网络 (Long Short-Term Memory, LSTM) 模型,提出一种增强型麻雀搜索算法 (Enhance Sparrow Search Algorithm, ESSA) 以改进预测率的精确性。该算法引入了Circle混沌映射进行种群初始化,并结合正弦余弦算法和Levy飞行策略分别对侦察者、跟踪者的位置进行更新,以促使麻雀个体能够快速跳出局部最优解。首先将ESSA与多种其他算法进行多形态基准函数对比测试,结果表明该算法在多个基准函数上展现出出色的性能和鲁棒性;随后将其应用于LSTM模型参数寻优,并与其他优化算法进行比较,结果显示基于ESSA-LSTM模型的预测率达到99.071%,相较于基本麻雀搜索算法 (Sparrow Search Algorithm, SSA)、灰狼优化算法 (Grey Wolf Optimizer, GWO)、海洋捕食算法 (Marine Predators Algorithm, MPA)、鲸鱼算法 (Whale Optimization Algorithm, WOA) 分别提升了2.142%、6.653%、6.682%、7.714%。研究表明,使用ESSA显著提高了溶解氧预测率,并有效减少了参数设置的盲目性和时间成本。

    Abstract:

    In order to accurately predict the dissolved oxygen content in water quality parameters, we adopted a Long Short Term Memory (LSTM) model, and proposed an Enhanced Sparrow Search Algorithm (ESSA) to improve the accuracy of the prediction rate. Besides, to prompt individual sparrows to swiftly depart from the local optimal solution, the algorithm introduced Circle chaotic mapping for population initialization, and integrated sine-cosine algorithm and Levy flight strategy to update the positions of scouts and trackers, respectively. Firstly, we compared ESSA with various other algorithms for multi form benchmark function testing, and the results reveal that the algorithm exhibited excellent performance and robustness on multiple benchmark functions. Subsequently, we used ESSA to explore LSTM model parameters and compared it with other optimization strategies, and the results show that the prediction rate based on ESSA-LSTM model reached 99.071%, which was improved by 2.142%, 6.653%, 6.682% and 7.714% compared with basic Sparrow Search Algorithm (SSA), Gray Wolf Optimization Algorithm (GWO), Marine Predation Algorithm (MPA), and Whale Optimization Algorithm (WOA), respectively. The results show that the use of ESSA significantly improves the prediction rate of dissolved oxygen (DO) and effectively reduces the blindness and time cost of parameter settings.

  • 热激蛋白(HSPs)是一类广泛存在的分子伴侣,主要分为组成型热激蛋白(heat shock cognate protein,HSC)和诱导型热激蛋白(inducible heat shock protein,HSP),帮助蛋白质和受损蛋白质重新折叠、装配以及错误折叠蛋白和不稳定蛋白降解[1-2]。热激蛋白基因的表达水平与生长紧密相关。肌肉增长会引起分子伴侣基因如热激蛋白的表达量增加[3]。饥饿后再复喂食的斑马鱼(Danio rerio)快肌中多种热激蛋白基因(HSP90、HSDP1和HSPA5等)的转录水平显著上调[4]。生长快的大口黑鲈(Micropterus salmoides)中,热激蛋白基因(如HSP90 alphaHSP70、HSP47、HSP30和HSPB1)的转录表达水平相比生长慢的大口黑鲈显著升高[5]。热激蛋白基因多态性与动物生长性状显著相关。Rocha和Junior[6]分析亚马孙河虾(Macrobrachium amazonicum) HSC70基因的单核苷酸多态性(SNP),发现C256T和T907C位点组成的H10双倍型与体质量显著相关。Chen等[7]分析杜洛克猪(Sus scrofa) HSP70.2基因启动子区域多态性,筛选到1个与背膘厚度显著相关的SNP位点。猪HSP70.2基因5′侧翼区存在5个SNP位点,其中2个位点与体质量和肉质性状显著相关[8-9]。目前有关大口黑鲈热激蛋白基因多态性与生长性状的相关研究尚未见报道。

    大口黑鲈是一种从北美洲引进的广温性鱼类,在分类学上隶属鲈形目、太阳鱼科。因其肉质鲜美且不含肌间剌,适合高密度养殖和活鱼长途运输,深受消费者和养殖者欢迎。大口黑鲈在我国众多省份都有规模化养殖,年产量超35×104 t[10],成为我国重要的淡水养殖经济品种之一。大口黑鲈属于肉食性鱼类,苗种培育阶段的相互残杀会影响基于表型性状的传统选育的准确性。分子标记辅助育种技术不受环境影响且结果可靠,在选育早期可进行选择,大幅提高选育效率[11]。候选功能基因多态性与表型性状相关的关联分析是实现分子标记辅助育种的有效方法[12]。鉴于HSC70基因是影响生长的候选功能基因,本研究采用PCR技术获得大口黑鲈HSC70-1基因的cDNA序列和基因全序列,从中发掘与大口黑鲈生长性状相关的SNP标记,以期应用于大口黑鲈分子标记辅助育种研究,加快良种选育进程。

    用于筛选SNP和关联分析的大口黑鲈成鱼为约5 000 组大口黑鲈“优鲈1 号”亲本同批次繁殖的子代,来自佛山市九江镇新旭养殖场。本实验鱼群体在相同养殖条件下培育,然后在同一个池塘中进行养殖,全程投喂冰冻野杂鱼,11月龄时从群体中随机取430尾并测量体质量、全长、体高、头长和尾柄长等性状值,同时以抗凝剂与血液体积比为6∶1的比例进行尾静脉活体取血,按天根生化科技(北京)有限公司试剂盒说明书提取血液DNA,并使用琼脂糖凝胶电泳和紫外分光光度计(Eppendorf,德国)检测DNA质量,于 − 20 ℃保存备用。用剪刀和镊子从采自中国水产科学研究院珠江水产研究所广州良种基地的1尾大口黑鲈背部取肌肉组织约30 mg,按照Trizol试剂盒(TaKaRa公司,大连)提供的方法提取总RNA,并用1%琼脂糖电泳检测其质量。

    根据从大口黑鲈转录组数据库(SRA436296)中获取的HSC70-1基因序列设计引物扩增cDNA序列,引物序列为Hsc70-1F: 5'-AAACCACATATTCTGAATTTAACGG-3'和Hsc70-1R: 5'-AAACCACATATTCTGAATTTAACGG-3'。大口黑鲈肌肉总RNA的反转录反应参照RNA PCR Kit (AMV) Ver.3.0试剂盒(TaKaRa公司,大连)说明书进行,以反转录产物为模板进行PCR扩增,反应程序为94 ℃变性3 min;94 ℃变性30 s,54 ℃复性30 s,72 ℃延伸1 min,35个循环;72 ℃延伸7 min。

    根据已获得的大口黑鲈HSC70-1 cDNA序列和NCBI数据库中登录的鳜(Siniperca chuatsi) HSC70-1基因全序列(KF500540.1)设计5对引物(表1),委托广州艾基生物技术有限公司合成。以1尾大口黑鲈基因组DNA为模板,采用PCR技术分别扩增HSC70-1基因的各个片段。PCR扩增反应总体积为50 μL,PCR反应体系包括25 μL 2×Taq PCR master mix (TaKaRa公司,大连),上下游引物各1 μL,模板DNA 1 μL,加ddH2O至50 μL。PCR扩增程序除退火温度改为56~60 ℃和循环数为32之外,其余同上。采用琼脂糖凝胶电泳检测扩增产物,并委托广州艾基生物公司完成序列测定,用Vector NTI Suite 11.0软件进行序列分析和比对。

    表  1  大口黑鲈HSC70-1基因全序列扩增所用的引物名称及序列
    Table  1.  Primer sequences applied in amplification of largemouth bass HSC70-1 gene
    上游引物
    forward primer
    引物序列 5'−3'
    primer sequence
    下游引物
    reverse primer
    引物序列 5'−3'
    primer sequence
    产物长度/bp
    product length
    F139AGTGAGAGGCTGATCGGAGATGR783TAGGCTTCAGCAATCTCCTTCATC645
    F672ATAACACCCGCCCCAAGGTTCAAGR1294CCATGCGGTTGTCGAAATCCTCAC623
    F1226GCATCTTTGAGGTCAAGTCCACTGR2022GTAGGTGGTGAAGGTCTGCGTCTG797
    F1923TCTCTCCCTGGGAATTGAGACCGCR2684CCAGCCAGCCAATAACCTCGTTGC762
    F2589AGTCGACCGTGGAGGATGAAAAGCR3382CCTCCTCAATGGTTGGTCCAGAGG793
    下载: 导出CSV 
    | 显示表格

    从关联分析群体中随机取20个样品基因组DNA,利用上述5对引物扩增HSC70-1基因,PCR产物经纯化后委托广州艾基生物公司进行测序,用Vector NTI Suite 11.0软件比对分析序列并查找SNP位点。

    用SNaPshot分型方法检测SNP位点的基因型,首先根据SNP位点附近序列设计扩增引物(表2),然后对430个样品DNA进行多重PCR扩增,从中取3 μL PCR产物用Exo I和FastAP分别去除反应产物中的剩余引物和dNTP,37 ℃下反应15 min,80 ℃高温灭活Exo I和FastAP 15 min。用延伸引物进行延伸反应,最后在ABI公司的PRISM 3730测序仪上完成基因型分析,具体委托上海捷瑞生物工程有限公司完成。

    表  2  SNP位点分型所用引物名称及序列
    Table  2.  Primer sequences applied in each SNP genotyping
    位点
    SNP locus
    上游引物
    forward primer
    下游引物
    reverse primer
    延伸引物
    extension primer
    C-821GTGAAGCCTACCTCGGAAAAGTAGCATCCTTAGTGGCCTGGCGCTTACTTAGCATAGCTCTGGACA
    A1105TCTCTGGCCTCAATGTCCTGGGTTGTCGAAATCCTCACCGTTTTTTTTTTCATCTTGAATTGAGGTAATAAA
    C-1200TTCATCTTTGATCTTGGTGGTGGACGGACAGCTCTCTTGTTGTTTTTTTTTTTTTTTTTTTTTCCTCGATGGTCAAGATGGAAAC
    A-2804TTCCACCAGCTTATCAGACTGTGGTCAACCCTCCAAGTAACTTCTGTAGGGGGTAACTGAAGGGT
    下载: 导出CSV 
    | 显示表格

    利用POPGENE V1.32软件分析观测杂合度(Ho)、有效等位基因数(Ne)和期望杂合度(He)等遗传参数,并估计各位点是否在群体中符合Hardy-Weinberg平衡定律。数据分析软件采用SPSS 19.0,各基因型与大口黑鲈生长性状之间的相关性分析中所用的一般线性分析模型为Yij=μ+Bi+eijYij为某个性状第i个标记第j个个体上的观测值;μ为实验观测所有个体的表型平均值;Bi为第i个标记的效应值;eij为对应于观察值的随机误差效应[13]

    大口黑鲈肌肉总RNA经反转录后,对引物Hsc70-1F和Hsc70-1R扩增获得的片段进行测序,序列长度为1 961 bp。分析结果表明,HSC70-1基因cDNA序列全长为1 953 bp,共编码650个氨基酸,其蛋白等电点为5.2,分子量为71 kD。该基因包含非细胞器特征的蛋白基序RARFEEL和位于C-端的细胞质定位特征基序EEVD,以及推测的双分型核定位信号KRKYKKDISDNKRAVRRLRTACERAKRT (图1)。

    图  1  大口黑鲈HSC70-1 cDNA序列及其推测的氨基酸序列
    碱基序列在上,氨基酸序列在下;非细胞器基序RARFEEL用方框表示;C末端的EEVD基序用单下划线标出;2个GGMP基序用双下划线标出;双分型核定位信号用波浪线表示
    Figure  1.  Nucleotide and deduced amino acid sequences of largemouth bass HSC70-1 cDNA
    The nucleotide sequence is in upper row and the amino acid in lower row. The non-organelle eukaryotic consensus motif is boxed. The C-terminal EEVD motif is indicated by “__”. Two consecutive repeats of the tetrapeptide motif GGMP are double-underlined. The NLS is indicated by “~~”.

    将测得的大口黑鲈HSC70-1基因全序列进行拼接,然后与其cDNA序列进行比对,结果表明,大口黑鲈HSC70-1基因序列全长为3 390 bp,由8个外显子和7个内含子构成,8个编码外显子的长度分别为205 bp、206 bp、153 bp、556 bp、203 bp、199 bp、233 bp和198 bp,编码区内7个内含子的长度分别为382 bp、85 bp、115 bp、147 bp、125 bp、86 bp和497 bp。

    大口黑鲈HSC70-1基因序列与GenBank中已登录的鱼类HSC70-1基因进行比较,与鳜(AGS83421.1)、尖吻鲈(Lates calcarifer,XP_018546814.1)、尼罗罗非鱼(Oreochromis niloticus,XP_003448938.1)和真鲷(Pagrus major,AKS36893.1)的氨基酸同源性为99%;与鳙(Hypophthalmichthys nobilis,ADK27718.1)、大黄鱼(Larimichthys crocea,XM_019279481.1)和翘嘴红鲌(Erythroculter ilishaeformis,EU693910.1)的氨基酸同源性为97%;与斑马鱼(L77146.2)、半滑舌鳎(Cynoglossus semilaevis,XM_008332615.2)和大西洋鲑(Salmo salar,XM_014162783.1)的氨基酸同源性依次为96%、96%和93%,表明鱼类HSC70-1基因的保守性很高。

    5对引物在20个个体中的PCR扩增产物经测序和比对后,共获得4个SNP位点,分别位于HSC70-1基因核苷酸序列中的第821、第1 105、第1 200和第2 804碱基处,均处于内含子中。

    大口黑鲈“优鲈1号”群体在4个SNP位点上的多样性比较丰富,平均Ne、平均Ho和平均He分别为1.67、0.688和0.602 (表3)。C-821G和A-2804T位点在群体中符合Hardy-Weinberg定律,其余2个位点均偏离Hardy-Weinberg定律(表3)。

    表  3  HSC70-1基因上4个SNP位点的遗传参数
    Table  3.  Genetic parameters of 4 SNPs in HSC70-1 gene
    SNP位点
    SNP locus
    碱基类型
    nucleotide type
    有效等位基因数
    Ne
    期望杂合度
    He
    观测杂合度
    Ho
    哈温平衡 (P)
    HWE
    C-821GG/C1.550.6450.6840.063 8
    A1105A/−1.910.5240.9510.000 0*
    C-1200TC/T1.690.5920.4300.019 3*
    A-2804TT/A1.540.6480.6880.416 3
    平均值 average1.670.6020.688
     注:*. 偏离Hardy-Weinberg定律(P<0.05)  Note: *. deviation from Hardy-Weinberg equilibrium (P<0.05)
    下载: 导出CSV 
    | 显示表格

    对用于关联分析的实验鱼群体的体质量进行正态分布检验,结果呈正态分布。各标记与不同生长性状的相关分析结果表明,C-821G位点的CC基因型个体的平均表型值均高于CG型和GG型,CC基因型与CG和GG基因型个体在体质量和全长上均存在显著差异(P<0.05)。A-2804T位点的TT基因型个体分别与AT和AA基因型个体在体质量和全长上存在显著差异(P<0.05)。其他位点不同基因型个体间的生长性状均不存在显著差异(P>0.05,表4)。

    表  4  HSC70-1基因中各SNP位点与生长性状的关联分析 (平均值±标准差)
    Table  4.  Correlation analysis between different SNP loci of HSC70-1 gene and various growth traits ($ {\overline {\mathit{\boldsymbol{X}}}} \pm {\bf SD}$)
    SNP位点
    SNP site
    基因型
    genotype
    样本数
    number of sample
    体质量/g
    body mass
    全长/cm
    total length
    头长/cm
    head length
    体高/cm
    body depth
    尾柄长/cm
    caudal peduncle length
    C-821GCC31573.26±22.87a30.26±0.45a7.57±0.288.75±0.188.57±0.17
    CG136512.49±10.92b29.22±0.21b7.36±0.138.48±0.098.33±0.08
    GG263523.32±7.85b29.32±0.15b7.46±0.108.48±0.068.28±0.06
    A1105−−157524.01±10.2329.44±0.27.41±0.138.54±0.088.38±0.07
    A−21540.70±27.9629.69±0.557.47±0.348.66±0.228.34±0.20
    AA252521.75±8.0729.28±0.167.45±0.108.46±0.068.28±0.06
    C-1200TCC185521.324±9.4129.24±0.187.55±0.128.49±0.078.30±0.07
    CT245525.14±8.1829.45±0.167.35±0.108.51±0.068.34±0.06
    A-2804TAA265523.05±7.82b29.34±0.15b7.45±0.108.49±0.068.28±0.06
    AT134512.86±11.00b29.20±0.22b7.37±0.148.46±0.098.33±0.08
    TT31573.26±22.88a30.26±0.45a7.57±0.288.75±0.188.57±0.17
     注:同列中上标字母不同表示差异显著(P<0.05),表5同此  Note: Different superscripts within the same column denote significant difference (P<0.05). The same case in Tab.5.
    下载: 导出CSV 
    | 显示表格

    将4个SNPs位点不同基因型合并成双倍型进行分析(表5),共组合成15种双倍型,去掉频率小于2.5%的10种,将其余5种进行关联性分析发现,双倍型D1的各个生长性状表现最优,其全长和体高显著高于D5,在实际的育种应用中,应选择此双倍型个体,以加快育种进程。

    表  5  HSC70-1基因双倍型与大口黑鲈生长性状的关联性分析 (平均值±标准差)
    Table  5.  Diplotype of HSC70-1 gene associated with growth traits in largemouth bass (${\overline {\mathit{\boldsymbol{X}}}} \pm {\bf SD}$)
    双倍型
    diplotype
    基因型 (样本数)
    genotype (n)
    体质量/g
    body mass
    全长/cm
    total length
    体高/cm
    body depth
    D1CC−−CCTT (28)552.01±103.5330.14±2.33a8.7±0.91a
    D2GGAACTAA (225)524.99±139.5129.47±2.428.51±1.05
    D3GGA−CTAA (11)522.11±84.4529.53±1.338.51±0.73
    D4CG−−CCAT (117)516.74±102.5529.29±1.988.51±0.89
    D5GGAACCAA (16)484.46±102.827.28±5.27b8.08±0.86b
    下载: 导出CSV 
    | 显示表格

    序列对比分析后发现大口黑鲈HSC70-1基因的氨基酸序列中含有HSP70家族基因特有的细胞质定位特征基序(EEVD)和双分型核定位信号标签(KRKYKKDISDNKRAVRRLRTACERAKRT),表明本研究获得的确实是HSP70家族成员基因的cDNA序列[14-15]。将大口黑鲈HSC70-1基因氨基酸序列与GenBank中已登录的其他鱼类HSC70-1基因序列进行比较,相互间的序列同源性为93%~99%,较高的同源性反映了HSC70家族在进化过程中的结构和功能都很保守[16-17]。在HSC70-1基因序列中发现了非细胞器应激蛋白元件(RARFEEL)和细胞质特异性的C末端EEVD和GGMP调控元件,表明该基因位于细胞液和细胞质中[18-19]。此外,编码区中含有内含子被认为是组成型HSC70的典型特征,不同于诱导型HSP70基因[20-21],其缺少内含子;因此在应激条件下不需要进行RNA剪接而直接快速表达和累积。

    He可用来评估物种不同群体的遗传多样性高低,杂合度越高表明群体的遗传变异越多,群体遗传多样性越高,对环境适应能力越强[22-23]。大口黑鲈“优鲈1号”群体中HSC70-1基因筛选到的4个SNPs位点的He从0.524到0.648,表明大口黑鲈“优鲈1号”群体的遗传多样性较高,这与李镕等[24]的研究结果相似。C-821G和A-2804T位点处于Hardy-Weinberg平衡状态,而A1105和C-1200T位点显著偏离Hardy-Weinberg定律。引起这2个位点在群体中处于不平衡状态的原因可能与人工选育对亲本的定向选择有关。大口黑鲈“优鲈1号”群体经历了长时间的高强度选育,可能导致位点偏离Hardy-Weinberg平衡状态。

    热激蛋白基因的表达水平与生长密切相关。肌肉增长会引起分子伴侣基因如热激蛋白的表达量增加[3]。美洲螯龙虾(Homarus americanus)蜕皮前期和蜕皮过程中HSC70和HSP90基因mRNA表达水平显著上升,参与肌肉萎缩[25]。将斑马鱼饥饿7 d后再喂饱,发现斑马鱼快肌中多种热激蛋白基因的转录表达水平显著上调[4]。在相同养殖条件下,与生长慢大口黑鲈相比,HSP90 alphaHSP70、HSP47、HSP30和HSPB1基因在生长快速大口黑鲈肌肉组织中的转录表达水平显著升高[5]。本研究分析了大口黑鲈HSC70-1基因多态性与生长性状的关联性,在鱼类HSC70基因中找到2个与生长性状显著关联的SNP位点,这与之前在亚马孙河虾[6]和猪[8-9]热激蛋白基因中均发掘到与生长相关的SNP标记的研究结果一致,表明HSC70-1基因对大口黑鲈生长性状发挥重要作用。

    大口黑鲈HSC70-1基因中的2个与生长性状关联的SNP位点均位于内含子中。已有类似研究报道,赵宪林等[26]在藏羊(Ovis aries) MC4R基因第一内含子上筛选到1个与生长性状密切相关的SNP位点;张世勇等[27]发现位于斑点叉尾鮰 (Ictalures punctatus) MSTN基因第二内含子上的1个SNP标记与体质量和体长显著相关;谢淑媚等[28]在缢蛏(Sinonovacula constricta) IGFBP基因第1个内含子中发现1个与体质量和壳长显著相关的SNP位点。内含子中SNPs位点可能与基因组区域中相邻的关键突变位点连锁[29]。此外,内含子中的突变虽不参与蛋白质的合成,但与基因转录调控有关[30-31]。内含子中的突变位点可能会影响到大口黑鲈HSC70-1的翻译、结构和功能,进而影响大口黑鲈的生长速度。

    生长性状是数量性状,受主效基因控制,同时也受多个基因和多个位点的相互调控[32-33]。C-821G位点中C等位基因频率为优势等位基因,CC基因型个体的生长性状最佳,A-2804T位点中T等位基因频率为优势等位基因,TT基因型个体的生长性状最佳。4个SNP位点组成的双倍型分析中,CC和TT基因型组合成的双倍型个体(CC−−CCTT)的生长性状最优,进一步支持了单个SNP与生长性状的关联分析结果。在后续的选育研究工作中,可通过人为定向选择基因型为CC−−CCTT的纯合子亲本,培育生长性状优良的纯合子品系,从而提高养殖产量和经济效益。

  • 图  1   养殖工船内部

    Figure  1.   Inside aquaculture ship

    图  2   原始数据溶解氧变化曲线

    Figure  2.   Change curve of dissolved oxygen in raw data

    图  3   LSTM内部单元结构

    Figure  3.   Internal unit structure of LSTM model

    图  4   增强型麻雀搜索算法优化LSTM模型结构

    Figure  4.   Optimized structure of LSTM model via ESSA

    图  5   预测模型流程

    Figure  5.   Flowchart of predictive modeling

    图  6   优化测试函数收敛曲线对比

    Figure  6.   Comparison of convergence curves for improved test functions

    图  7   模型评价指标

    Figure  7.   Indicators for model evaluation

    图  8   预测率收敛曲线

    Figure  8.   Convergence curve of prediction rate

    图  9   多种算法优化曲线对比

    Figure  9.   Comparison of optimization curves for multiple algorithms

    表  1   养殖水质原始数据表

    Table  1   Raw data sheet for aquaculture water quality

    时间
    Time
    pH盐度
    Salinity/‰
    温度
    Temperature/℃
    溶解氧
    DO/(mg·L−1)
    2023-04-11 00:05:007.8636.099 99820.114 889.119 555
    2023-04-11 01:05:007.8435.900 00220.127 559.047 465
    2023-04-11 02:05:007.8436.200 00120.123 218.998 263
    ···············
    2023-04-23 22:05:007.6934.200 00122.060 746.736 285
    2023-04-23 23:05:007.6734.200 00122.063 866.419 692
    2023-04-24 00:00:007.6734.299 99922.083 026.358 287
    下载: 导出CSV

    表  2   基准测试函数

    Table  2   Process of benchmarking

    基准测试函数    
    Benchmark function    
    维度
    Dimensionality
    搜索空间
    Search space
    最优值
    Optimal value
    $ {F}_{1}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}\mid {x}_{i}\mid {\text{+}}{\prod }_{i{\text{=}}1}^{n}\mid {x}_{i}\mid $
    30 $ [{\text{−}}\mathrm{10,\;10}] $ 0
    $ {F}_{2}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}i{x}_{i}^{4}{\text{+}}\mathrm{r}\mathrm{a}\mathrm{n}\mathrm{d}\mathrm{o}\mathrm{m}\left[\mathrm{0,\;1}\right) $
    30 $ [{\text{−}}\mathrm{1.28,\;1.28}] $ 0
    $ {F}_{3}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}{\text{−}}{x}_{i}\mathrm{s}\mathrm{i}\mathrm{n}\left(\sqrt{\mid {x}_{i}\mid }\right) $
    30 $ [{\text{−}}\mathrm{500,\;500}] $ $ {\text{−}}418.9829\times n $
    ${F}_{4}\left(x\right){\text{=}}\dfrac{1}{4\;000}{\sum }_{i{\text{=}}1}^{n}{x}_{i}^{2}{\text{−}}{\prod }_{i{\text{=}}1}^{n}\mathrm{c}\mathrm{o}\mathrm{s}\dfrac{ {x}_{i} }{\sqrt{i} }{\text{+}}1$
    30 $ [{\text{−}}\mathrm{600,\;600}] $ 0
    $ {F}_{5}\left(x\right){\text{=}}-\sum _{i{\text{=}}1}^{4}{c}_{i}\mathrm{e}\mathrm{x}\mathrm{p}\left[-\sum _{j{\text{=}}1}^{6}{a}_{ij}({x}_{i}-{p}_{ij}{)}^{2}\right] $
    30 $ \left[\mathrm{0,\;1}\right] $ $ -3.32 $
    下载: 导出CSV

    表  3   基准函数优化结果对比

    Table  3   Comparison of benchmark function optimization results

    算法种类
    Type of algorithm
    $ {F}_{1} $$ {F}_{2} $$ {F}_{3} $$ {F}_{4} $$ {F}_{5} $
    ESSA 最优值 Ave $ 2.351\,3{\times 10}^{{\text{−}}16} $ $ 4.306\,9{\times 10}^{{\text{−}}4} $ $ {\text{−}}1.030\,1{\times 10}^{4} $ 0 −3.266 5
    标准差 Std $ 1.242\,5{\times 10}^{{\text{−}}15} $ $ 5.081\,4{\times 10}^{{\text{−}}4} $ $ 1.842\,8{\times 10}^{3} $ 0 0.059 3
    SSA 最优值 Ave 0.057 3 0.003 0 $ {\text{−}}3.682\,2{\times 10}^{3} $ $ 4.899\,3{\times 10}^{{\text{−}}5} $ −3.138 5
    标准差 Std 0.063 1 0.002 7 359.466 6 $ 9.669\,2{\times 10}^{{\text{−}}5} $ 0.081 4
    GWO 最优值 Ave 0.025 5 0.015 9 ${\text{−} }5.646\,0{\times 10}^{ 3}$ 0.082 2 −3.238 5
    标准差 Std 0.013 1 0.007 8 879.281 3 0.059 1 −3.322 0
    MPA 最优值 Ave 0.091 3 0.006 8 $ {\text{−}}7.235\,6{\times 10}^{3} $ 0.290 3 0.075 0
    标准差 Std 0.031 1 0.003 8 685.562 5 0.128 3 1.750 6$ {\times 10}^{{\text{−}}4} $
    WOA 最优值 Ave $ 7.826\,5{\times 10}^{{\text{−}}9} $ 0.019 4 $ {\text{−}}8.801\,8{\times 10}^{3} $ 0.086 9 −3.104 0
    标准差 Std $ 1.722\,1{\times 10}^{{\text{−}}8} $ 0.017 9 $ 1.354\,2{\times 10}^{3} $ 0.262 4 0.340 7
    下载: 导出CSV

    表  4   参数设置

    Table  4   Settings of parameters

    参数     
    Parameter     
    取值
    Value
    训练样本个数 Number of training samples 3 457
    测试样本个数 Number of test samples 288
    训练迭代次数 Number of training iterations 100
    批处理大小个数 Number of batch sizes 32
    种群大小 Population size 30
    下载: 导出CSV

    表  5   预测率结果对比

    Table  5   Comparison of predicted rate

    算法
    Algorithm
    平均预测率 (10次)
    Average rate of prediction (10 times)
    增强型麻雀搜索算法 ESSA 99.071%
    麻雀搜索算法 SSA 96.929%
    灰狼优化算法 GWO 92.418%
    海洋捕食算法 MPA 92.389%
    鲸鱼优化算法 WOA 91.357%
    下载: 导出CSV
  • [1] 胡金有,  王靖杰,  张小栓, 等.  水产养殖信息化关键技术研究现状与趋势 [J].  农业机械学报,  2015,  46(7),  251-263.
    [2] 刘双印.  基于计算智能的水产养殖水质预测预警方法研究 [D].  北京:  中国农业大学,  2014:  68-78.
    [3] 徐琰斐,  徐皓,  刘晃, 等.  中国深远海养殖发展方式研究 [J].  渔业现代化,  2021,  48(1): 9-15.
    [4] 何清,  李宁,  罗文娟, 等.  大数据下的机器学习算法综述 [J].  模式识别与人工智能,  2014,  27(4): 327-336.
    [5] 沈时宇, 陈明. Prophet时序模型在短期水质溶氧预测中的应用 [J]. 渔业现代化, 2020, 47(3): 29-35.
    [6]

    REN Q,  WANG X,  LI W,  et al.   Research of dissolved oxygen prediction in recirculating aquaculture systems based on deep belief network[J].  Aquac Eng,  2020,  90:  102085.

    [7]

    CAO X,  REN N,  TIAN G,  et al.  A three-dimensional prediction method of dissolved oxygen in pond culture based on Attention-GRU-GBRT[J].  Comput Electron Agric,  2021,  181:  105955.

    [8] 宦娟,  曹伟建,  秦益霖, 等.  基于游程检测法重构集合经验模态的养殖水质溶氧预测 [J].  农业工程学报,  2018,  34(8):  220-226.
    [9] 林彬彬,  袁泉,  田志新, 等.  基于SSA-LSTM模型的黄鳝池溶氧预测研究 [J].  渔业现代化,  2023,  50(1):  71-79.
    [10]

    HONG J, SHEN B, XUE J, et al. A vector-encirclement-model-based sparrow search algorithm for engineering optimization and numerical optimization problems[J].  Appl Soft Comput,  2022,  131:  109777.

    [11]

    XUE J K,  SHEN B.  A novel swarm intelligence optimization approach:  sparrow search algorithm[J].  Syst Sci Control Eng,  2020,  8(1):  22-34.

    [12]

    HOCHREITE S,  SCHMIDHUBER J.  Long short-term memory[J].  Neural Comput,  1997,  9(8):  1735-1780.

    [13]

    FARAMARZI A,  HEIDARINEJAD M,  MIRJALILI S,  et al.  Marine predators algorithm:  a nature-inspired metaheuristic[J]. Expert Syst Appl,  2020,  152:  113377.

    [14] 张晓凤,  王秀英.  灰狼优化算法研究综述 [J].  计算机科学,  2019,  46(3):  30-38.
    [15]

    MIRJALILI S,  LEWIS A.  The whale optimization algorithm[J].  Adv Eng Softw,  2016,  95:  51-67.

    [16] 李争,  罗晓瑞,  张杰, 等.  基于改进麻雀搜索算法的光伏功率短期预测 [J].  太阳能学报,  2023,  44(6):  284-289.
    [17] 胡顺强,  崔东文.  基于海洋捕食者算法优化的长短期记忆神经网络径流预测 [J].  中国农村水利水电,  2021(2):  78-82, 90.
    [18] 薛阳,  燕宇铖,  贾巍, 等.  基于改进灰狼算法优化长短期记忆网络的光伏功率预测 [J].  太阳能学报,  2023,  44(7):  207-213.
    [19] 吴会咏,  靳舒春,  安雪洁.  基于改进鲸鱼算法优化神经网络的飞机空气循环系统建模及故障分析 [J].  西北师范大学学报(自然科学版),  2023,  59(2):  27-36.
    [20] 杨寒雨,  赵晓永,  王磊.  数据归一化方法综述 [J].  计算机工程与应用,  2023, 59(3):  13-22.
    [21] 秦文虎,  陈溪莹.  基于长短时记忆网络的水质预测模型研究 [J].  安全与环境学报,  2020,  20(1):  328-334.
    [22] 王丹.  随机梯度下降算法研究 [D].  西安:  西安建筑科技大学,  2020:  17-27.
    [23] 薛建凯.  一种新型的群智能优化技术的研究与应用 [D].  上海:  东华大学,  2020:  21-28.
    [24] 王鑫,  张奇志.  改进麻雀搜索算法优化支持向量机的井漏预测 [J].  科学技术与工程,  2022,  22(34):  15115-15122.
    [25] 王振东,  汪嘉宝,  李大海.  一种增强型麻雀搜索算法的无线传感器网络覆盖优化研究 [J].  传感技术学报,  2021,  34(6):  818-828.
    [26] 张伟康,  刘升,  任春慧.  混合策略改进的麻雀搜索算法 [J].  计算机工程与应用,  2021,  57(24):  74-82.
    [27] 周茜.  混沌理论及应用若干问题的研究 [D].  天津:  南开大学,  2010:  3-13.
    [28]

    MIRJALILI S.  SCA: a sine cosine algorithm for solving optimization problems[J].  Knowl Based Syst,  2016,  96:  120-133.

    [29]

    RATHER S A,  DAS S. Levy flight and chaos theory-based gravitational search algorithm for image segmentation[J]. Math, 2023, 11(18): 3913. doi: 10.3390/math11183913

    [30] 张严,  秦亮曦.  基于Levy飞行策略的改进樽海鞘群算法 [J].  计算机科学,  2020,  47(7):  154-160.
    [31] 毛清华,  张强,  毛承成, 等.  混合正弦余弦算法和Lévy飞行的麻雀算法 [J].  山西大学学报(自然科学版),  2021,  44(6): 1086-1091.
图(9)  /  表(5)
计量
  • 文章访问数:  0
  • HTML全文浏览量:  0
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-09-25
  • 修回日期:  2023-11-19
  • 录用日期:  2023-12-07
  • 网络出版日期:  2023-12-12
  • 刊出日期:  2024-02-04

目录

/

返回文章
返回