Research on water quality dissolved oxygen prediction method based on ESSA-LSTM for aquaculture ships
-
摘要:
为了准确预测水质参数中的溶氧量,采用长短时记忆网络 (Long Short-Term Memory, LSTM) 模型,提出一种增强型麻雀搜索算法 (Enhance Sparrow Search Algorithm, ESSA) 以改进预测率的精确性。该算法引入了Circle混沌映射进行种群初始化,并结合正弦余弦算法和Levy飞行策略分别对侦察者、跟踪者的位置进行更新,以促使麻雀个体能够快速跳出局部最优解。首先将ESSA与多种其他算法进行多形态基准函数对比测试,结果表明该算法在多个基准函数上展现出出色的性能和鲁棒性;随后将其应用于LSTM模型参数寻优,并与其他优化算法进行比较,结果显示基于ESSA-LSTM模型的预测率达到99.071%,相较于基本麻雀搜索算法 (Sparrow Search Algorithm, SSA)、灰狼优化算法 (Grey Wolf Optimizer, GWO)、海洋捕食算法 (Marine Predators Algorithm, MPA)、鲸鱼算法 (Whale Optimization Algorithm, WOA) 分别提升了2.142%、6.653%、6.682%、7.714%。研究表明,使用ESSA显著提高了溶解氧预测率,并有效减少了参数设置的盲目性和时间成本。
Abstract:In order to accurately predict the dissolved oxygen content in water quality parameters, we adopted a Long Short Term Memory (LSTM) model, and proposed an Enhanced Sparrow Search Algorithm (ESSA) to improve the accuracy of the prediction rate. Besides, to prompt individual sparrows to swiftly depart from the local optimal solution, the algorithm introduced Circle chaotic mapping for population initialization, and integrated sine-cosine algorithm and Levy flight strategy to update the positions of scouts and trackers, respectively. Firstly, we compared ESSA with various other algorithms for multi form benchmark function testing, and the results reveal that the algorithm exhibited excellent performance and robustness on multiple benchmark functions. Subsequently, we used ESSA to explore LSTM model parameters and compared it with other optimization strategies, and the results show that the prediction rate based on ESSA-LSTM model reached 99.071%, which was improved by 2.142%, 6.653%, 6.682% and 7.714% compared with basic Sparrow Search Algorithm (SSA), Gray Wolf Optimization Algorithm (GWO), Marine Predation Algorithm (MPA), and Whale Optimization Algorithm (WOA), respectively. The results show that the use of ESSA significantly improves the prediction rate of dissolved oxygen (DO) and effectively reduces the blindness and time cost of parameter settings.
-
热激蛋白(HSPs)是一类广泛存在的分子伴侣,主要分为组成型热激蛋白(heat shock cognate protein,HSC)和诱导型热激蛋白(inducible heat shock protein,HSP),帮助蛋白质和受损蛋白质重新折叠、装配以及错误折叠蛋白和不稳定蛋白降解[1-2]。热激蛋白基因的表达水平与生长紧密相关。肌肉增长会引起分子伴侣基因如热激蛋白的表达量增加[3]。饥饿后再复喂食的斑马鱼(Danio rerio)快肌中多种热激蛋白基因(HSP90、HSDP1和HSPA5等)的转录水平显著上调[4]。生长快的大口黑鲈(Micropterus salmoides)中,热激蛋白基因(如HSP90 alpha、HSP70、HSP47、HSP30和HSPB1)的转录表达水平相比生长慢的大口黑鲈显著升高[5]。热激蛋白基因多态性与动物生长性状显著相关。Rocha和Junior[6]分析亚马孙河虾(Macrobrachium amazonicum) HSC70基因的单核苷酸多态性(SNP),发现C256T和T907C位点组成的H10双倍型与体质量显著相关。Chen等[7]分析杜洛克猪(Sus scrofa) HSP70.2基因启动子区域多态性,筛选到1个与背膘厚度显著相关的SNP位点。猪HSP70.2基因5′侧翼区存在5个SNP位点,其中2个位点与体质量和肉质性状显著相关[8-9]。目前有关大口黑鲈热激蛋白基因多态性与生长性状的相关研究尚未见报道。
大口黑鲈是一种从北美洲引进的广温性鱼类,在分类学上隶属鲈形目、太阳鱼科。因其肉质鲜美且不含肌间剌,适合高密度养殖和活鱼长途运输,深受消费者和养殖者欢迎。大口黑鲈在我国众多省份都有规模化养殖,年产量超35×104 t[10],成为我国重要的淡水养殖经济品种之一。大口黑鲈属于肉食性鱼类,苗种培育阶段的相互残杀会影响基于表型性状的传统选育的准确性。分子标记辅助育种技术不受环境影响且结果可靠,在选育早期可进行选择,大幅提高选育效率[11]。候选功能基因多态性与表型性状相关的关联分析是实现分子标记辅助育种的有效方法[12]。鉴于HSC70基因是影响生长的候选功能基因,本研究采用PCR技术获得大口黑鲈HSC70-1基因的cDNA序列和基因全序列,从中发掘与大口黑鲈生长性状相关的SNP标记,以期应用于大口黑鲈分子标记辅助育种研究,加快良种选育进程。
1. 材料与方法
1.1 实验鱼和试剂
用于筛选SNP和关联分析的大口黑鲈成鱼为约5 000 组大口黑鲈“优鲈1 号”亲本同批次繁殖的子代,来自佛山市九江镇新旭养殖场。本实验鱼群体在相同养殖条件下培育,然后在同一个池塘中进行养殖,全程投喂冰冻野杂鱼,11月龄时从群体中随机取430尾并测量体质量、全长、体高、头长和尾柄长等性状值,同时以抗凝剂与血液体积比为6∶1的比例进行尾静脉活体取血,按天根生化科技(北京)有限公司试剂盒说明书提取血液DNA,并使用琼脂糖凝胶电泳和紫外分光光度计(Eppendorf,德国)检测DNA质量,于 − 20 ℃保存备用。用剪刀和镊子从采自中国水产科学研究院珠江水产研究所广州良种基地的1尾大口黑鲈背部取肌肉组织约30 mg,按照Trizol试剂盒(TaKaRa公司,大连)提供的方法提取总RNA,并用1%琼脂糖电泳检测其质量。
1.2 HSC 70-1基因cDNA序列和基因全序列扩增
根据从大口黑鲈转录组数据库(SRA436296)中获取的HSC70-1基因序列设计引物扩增cDNA序列,引物序列为Hsc70-1F: 5'-AAACCACATATTCTGAATTTAACGG-3'和Hsc70-1R: 5'-AAACCACATATTCTGAATTTAACGG-3'。大口黑鲈肌肉总RNA的反转录反应参照RNA PCR Kit (AMV) Ver.3.0试剂盒(TaKaRa公司,大连)说明书进行,以反转录产物为模板进行PCR扩增,反应程序为94 ℃变性3 min;94 ℃变性30 s,54 ℃复性30 s,72 ℃延伸1 min,35个循环;72 ℃延伸7 min。
根据已获得的大口黑鲈HSC70-1 cDNA序列和NCBI数据库中登录的鳜(Siniperca chuatsi) HSC70-1基因全序列(KF500540.1)设计5对引物(表1),委托广州艾基生物技术有限公司合成。以1尾大口黑鲈基因组DNA为模板,采用PCR技术分别扩增HSC70-1基因的各个片段。PCR扩增反应总体积为50 μL,PCR反应体系包括25 μL 2×Taq PCR master mix (TaKaRa公司,大连),上下游引物各1 μL,模板DNA 1 μL,加ddH2O至50 μL。PCR扩增程序除退火温度改为56~60 ℃和循环数为32之外,其余同上。采用琼脂糖凝胶电泳检测扩增产物,并委托广州艾基生物公司完成序列测定,用Vector NTI Suite 11.0软件进行序列分析和比对。
表 1 大口黑鲈HSC70-1基因全序列扩增所用的引物名称及序列Table 1. Primer sequences applied in amplification of largemouth bass HSC70-1 gene上游引物
forward primer引物序列 5'−3'
primer sequence下游引物
reverse primer引物序列 5'−3'
primer sequence产物长度/bp
product lengthF139 AGTGAGAGGCTGATCGGAGATG R783 TAGGCTTCAGCAATCTCCTTCATC 645 F672 ATAACACCCGCCCCAAGGTTCAAG R1294 CCATGCGGTTGTCGAAATCCTCAC 623 F1226 GCATCTTTGAGGTCAAGTCCACTG R2022 GTAGGTGGTGAAGGTCTGCGTCTG 797 F1923 TCTCTCCCTGGGAATTGAGACCGC R2684 CCAGCCAGCCAATAACCTCGTTGC 762 F2589 AGTCGACCGTGGAGGATGAAAAGC R3382 CCTCCTCAATGGTTGGTCCAGAGG 793 1.3 突变位点筛选
从关联分析群体中随机取20个样品基因组DNA,利用上述5对引物扩增HSC70-1基因,PCR产物经纯化后委托广州艾基生物公司进行测序,用Vector NTI Suite 11.0软件比对分析序列并查找SNP位点。
1.4 SNaPshot方法检测基因型
用SNaPshot分型方法检测SNP位点的基因型,首先根据SNP位点附近序列设计扩增引物(表2),然后对430个样品DNA进行多重PCR扩增,从中取3 μL PCR产物用Exo I和FastAP分别去除反应产物中的剩余引物和dNTP,37 ℃下反应15 min,80 ℃高温灭活Exo I和FastAP 15 min。用延伸引物进行延伸反应,最后在ABI公司的PRISM 3730测序仪上完成基因型分析,具体委托上海捷瑞生物工程有限公司完成。
表 2 SNP位点分型所用引物名称及序列Table 2. Primer sequences applied in each SNP genotyping位点
SNP locus上游引物
forward primer下游引物
reverse primer延伸引物
extension primerC-821G TGAAGCCTACCTCGGAAAAGT AGCATCCTTAGTGGCCTGGCGC TTACTTAGCATAGCTCTGGACA A1105 TCTCTGGCCTCAATGTCCTG GGTTGTCGAAATCCTCACCG TTTTTTTTTTCATCTTGAATTGAGGTAATAAA C-1200T TCATCTTTGATCTTGGTGGTGG ACGGACAGCTCTCTTGTTGT TTTTTTTTTTTTTTTTTTTTCCTCGATGGTCAAGATGGAAAC A-2804T TCCACCAGCTTATCAGACTGT GGTCAACCCTCCAAGTAACTT CTGTAGGGGGTAACTGAAGGGT 1.5 数据统计分析
利用POPGENE V1.32软件分析观测杂合度(Ho)、有效等位基因数(Ne)和期望杂合度(He)等遗传参数,并估计各位点是否在群体中符合Hardy-Weinberg平衡定律。数据分析软件采用SPSS 19.0,各基因型与大口黑鲈生长性状之间的相关性分析中所用的一般线性分析模型为Yij=μ+Bi+eij,Yij为某个性状第i个标记第j个个体上的观测值;μ为实验观测所有个体的表型平均值;Bi为第i个标记的效应值;eij为对应于观察值的随机误差效应[13]。
2. 结果
2.1 大口黑鲈HSC 70-1基因序列分析
大口黑鲈肌肉总RNA经反转录后,对引物Hsc70-1F和Hsc70-1R扩增获得的片段进行测序,序列长度为1 961 bp。分析结果表明,HSC70-1基因cDNA序列全长为1 953 bp,共编码650个氨基酸,其蛋白等电点为5.2,分子量为71 kD。该基因包含非细胞器特征的蛋白基序RARFEEL和位于C-端的细胞质定位特征基序EEVD,以及推测的双分型核定位信号KRKYKKDISDNKRAVRRLRTACERAKRT (图1)。
图 1 大口黑鲈HSC70-1 cDNA序列及其推测的氨基酸序列碱基序列在上,氨基酸序列在下;非细胞器基序RARFEEL用方框表示;C末端的EEVD基序用单下划线标出;2个GGMP基序用双下划线标出;双分型核定位信号用波浪线表示Figure 1. Nucleotide and deduced amino acid sequences of largemouth bass HSC70-1 cDNAThe nucleotide sequence is in upper row and the amino acid in lower row. The non-organelle eukaryotic consensus motif is boxed. The C-terminal EEVD motif is indicated by “__”. Two consecutive repeats of the tetrapeptide motif GGMP are double-underlined. The NLS is indicated by “~~”.将测得的大口黑鲈HSC70-1基因全序列进行拼接,然后与其cDNA序列进行比对,结果表明,大口黑鲈HSC70-1基因序列全长为3 390 bp,由8个外显子和7个内含子构成,8个编码外显子的长度分别为205 bp、206 bp、153 bp、556 bp、203 bp、199 bp、233 bp和198 bp,编码区内7个内含子的长度分别为382 bp、85 bp、115 bp、147 bp、125 bp、86 bp和497 bp。
2.2 序列同源性比较
大口黑鲈HSC70-1基因序列与GenBank中已登录的鱼类HSC70-1基因进行比较,与鳜(AGS83421.1)、尖吻鲈(Lates calcarifer,XP_018546814.1)、尼罗罗非鱼(Oreochromis niloticus,XP_003448938.1)和真鲷(Pagrus major,AKS36893.1)的氨基酸同源性为99%;与鳙(Hypophthalmichthys nobilis,ADK27718.1)、大黄鱼(Larimichthys crocea,XM_019279481.1)和翘嘴红鲌(Erythroculter ilishaeformis,EU693910.1)的氨基酸同源性为97%;与斑马鱼(L77146.2)、半滑舌鳎(Cynoglossus semilaevis,XM_008332615.2)和大西洋鲑(Salmo salar,XM_014162783.1)的氨基酸同源性依次为96%、96%和93%,表明鱼类HSC70-1基因的保守性很高。
2.3 突变位点筛查结果
5对引物在20个个体中的PCR扩增产物经测序和比对后,共获得4个SNP位点,分别位于HSC70-1基因核苷酸序列中的第821、第1 105、第1 200和第2 804碱基处,均处于内含子中。
2.4 HSC70-1基因突变位点在群体中的遗传结构分析
大口黑鲈“优鲈1号”群体在4个SNP位点上的多样性比较丰富,平均Ne、平均Ho和平均He分别为1.67、0.688和0.602 (表3)。C-821G和A-2804T位点在群体中符合Hardy-Weinberg定律,其余2个位点均偏离Hardy-Weinberg定律(表3)。
表 3 HSC70-1基因上4个SNP位点的遗传参数Table 3. Genetic parameters of 4 SNPs in HSC70-1 geneSNP位点
SNP locus碱基类型
nucleotide type有效等位基因数
Ne期望杂合度
He观测杂合度
Ho哈温平衡 (P)
HWEC-821G G/C 1.55 0.645 0.684 0.063 8 A1105 A/− 1.91 0.524 0.951 0.000 0* C-1200T C/T 1.69 0.592 0.430 0.019 3* A-2804T T/A 1.54 0.648 0.688 0.416 3 平均值 average 1.67 0.602 0.688 注:*. 偏离Hardy-Weinberg定律(P<0.05) Note: *. deviation from Hardy-Weinberg equilibrium (P<0.05) 2.5 SNPs与性状的关联分析
对用于关联分析的实验鱼群体的体质量进行正态分布检验,结果呈正态分布。各标记与不同生长性状的相关分析结果表明,C-821G位点的CC基因型个体的平均表型值均高于CG型和GG型,CC基因型与CG和GG基因型个体在体质量和全长上均存在显著差异(P<0.05)。A-2804T位点的TT基因型个体分别与AT和AA基因型个体在体质量和全长上存在显著差异(P<0.05)。其他位点不同基因型个体间的生长性状均不存在显著差异(P>0.05,表4)。
表 4 HSC70-1基因中各SNP位点与生长性状的关联分析 (平均值±标准差)Table 4. Correlation analysis between different SNP loci of HSC70-1 gene and various growth traits ($ {\overline {\mathit{\boldsymbol{X}}}} \pm {\bf SD}$ )SNP位点
SNP site基因型
genotype样本数
number of sample体质量/g
body mass全长/cm
total length头长/cm
head length体高/cm
body depth尾柄长/cm
caudal peduncle lengthC-821G CC 31 573.26±22.87a 30.26±0.45a 7.57±0.28 8.75±0.18 8.57±0.17 CG 136 512.49±10.92b 29.22±0.21b 7.36±0.13 8.48±0.09 8.33±0.08 GG 263 523.32±7.85b 29.32±0.15b 7.46±0.10 8.48±0.06 8.28±0.06 A1105 −− 157 524.01±10.23 29.44±0.2 7.41±0.13 8.54±0.08 8.38±0.07 A− 21 540.70±27.96 29.69±0.55 7.47±0.34 8.66±0.22 8.34±0.20 AA 252 521.75±8.07 29.28±0.16 7.45±0.10 8.46±0.06 8.28±0.06 C-1200T CC 185 521.324±9.41 29.24±0.18 7.55±0.12 8.49±0.07 8.30±0.07 CT 245 525.14±8.18 29.45±0.16 7.35±0.10 8.51±0.06 8.34±0.06 A-2804T AA 265 523.05±7.82b 29.34±0.15b 7.45±0.10 8.49±0.06 8.28±0.06 AT 134 512.86±11.00b 29.20±0.22b 7.37±0.14 8.46±0.09 8.33±0.08 TT 31 573.26±22.88a 30.26±0.45a 7.57±0.28 8.75±0.18 8.57±0.17 注:同列中上标字母不同表示差异显著(P<0.05),表5同此 Note: Different superscripts within the same column denote significant difference (P<0.05). The same case in Tab.5. 将4个SNPs位点不同基因型合并成双倍型进行分析(表5),共组合成15种双倍型,去掉频率小于2.5%的10种,将其余5种进行关联性分析发现,双倍型D1的各个生长性状表现最优,其全长和体高显著高于D5,在实际的育种应用中,应选择此双倍型个体,以加快育种进程。
表 5 HSC70-1基因双倍型与大口黑鲈生长性状的关联性分析 (平均值±标准差)Table 5. Diplotype of HSC70-1 gene associated with growth traits in largemouth bass (${\overline {\mathit{\boldsymbol{X}}}} \pm {\bf SD}$ )双倍型
diplotype基因型 (样本数)
genotype (n)体质量/g
body mass全长/cm
total length体高/cm
body depthD1 CC−−CCTT (28) 552.01±103.53 30.14±2.33a 8.7±0.91a D2 GGAACTAA (225) 524.99±139.51 29.47±2.42 8.51±1.05 D3 GGA−CTAA (11) 522.11±84.45 29.53±1.33 8.51±0.73 D4 CG−−CCAT (117) 516.74±102.55 29.29±1.98 8.51±0.89 D5 GGAACCAA (16) 484.46±102.8 27.28±5.27b 8.08±0.86b 3. 讨论
序列对比分析后发现大口黑鲈HSC70-1基因的氨基酸序列中含有HSP70家族基因特有的细胞质定位特征基序(EEVD)和双分型核定位信号标签(KRKYKKDISDNKRAVRRLRTACERAKRT),表明本研究获得的确实是HSP70家族成员基因的cDNA序列[14-15]。将大口黑鲈HSC70-1基因氨基酸序列与GenBank中已登录的其他鱼类HSC70-1基因序列进行比较,相互间的序列同源性为93%~99%,较高的同源性反映了HSC70家族在进化过程中的结构和功能都很保守[16-17]。在HSC70-1基因序列中发现了非细胞器应激蛋白元件(RARFEEL)和细胞质特异性的C末端EEVD和GGMP调控元件,表明该基因位于细胞液和细胞质中[18-19]。此外,编码区中含有内含子被认为是组成型HSC70的典型特征,不同于诱导型HSP70基因[20-21],其缺少内含子;因此在应激条件下不需要进行RNA剪接而直接快速表达和累积。
He可用来评估物种不同群体的遗传多样性高低,杂合度越高表明群体的遗传变异越多,群体遗传多样性越高,对环境适应能力越强[22-23]。大口黑鲈“优鲈1号”群体中HSC70-1基因筛选到的4个SNPs位点的He从0.524到0.648,表明大口黑鲈“优鲈1号”群体的遗传多样性较高,这与李镕等[24]的研究结果相似。C-821G和A-2804T位点处于Hardy-Weinberg平衡状态,而A1105和C-1200T位点显著偏离Hardy-Weinberg定律。引起这2个位点在群体中处于不平衡状态的原因可能与人工选育对亲本的定向选择有关。大口黑鲈“优鲈1号”群体经历了长时间的高强度选育,可能导致位点偏离Hardy-Weinberg平衡状态。
热激蛋白基因的表达水平与生长密切相关。肌肉增长会引起分子伴侣基因如热激蛋白的表达量增加[3]。美洲螯龙虾(Homarus americanus)蜕皮前期和蜕皮过程中HSC70和HSP90基因mRNA表达水平显著上升,参与肌肉萎缩[25]。将斑马鱼饥饿7 d后再喂饱,发现斑马鱼快肌中多种热激蛋白基因的转录表达水平显著上调[4]。在相同养殖条件下,与生长慢大口黑鲈相比,HSP90 alpha、HSP70、HSP47、HSP30和HSPB1基因在生长快速大口黑鲈肌肉组织中的转录表达水平显著升高[5]。本研究分析了大口黑鲈HSC70-1基因多态性与生长性状的关联性,在鱼类HSC70基因中找到2个与生长性状显著关联的SNP位点,这与之前在亚马孙河虾[6]和猪[8-9]热激蛋白基因中均发掘到与生长相关的SNP标记的研究结果一致,表明HSC70-1基因对大口黑鲈生长性状发挥重要作用。
大口黑鲈HSC70-1基因中的2个与生长性状关联的SNP位点均位于内含子中。已有类似研究报道,赵宪林等[26]在藏羊(Ovis aries) MC4R基因第一内含子上筛选到1个与生长性状密切相关的SNP位点;张世勇等[27]发现位于斑点叉尾鮰 (Ictalures punctatus) MSTN基因第二内含子上的1个SNP标记与体质量和体长显著相关;谢淑媚等[28]在缢蛏(Sinonovacula constricta) IGFBP基因第1个内含子中发现1个与体质量和壳长显著相关的SNP位点。内含子中SNPs位点可能与基因组区域中相邻的关键突变位点连锁[29]。此外,内含子中的突变虽不参与蛋白质的合成,但与基因转录调控有关[30-31]。内含子中的突变位点可能会影响到大口黑鲈HSC70-1的翻译、结构和功能,进而影响大口黑鲈的生长速度。
生长性状是数量性状,受主效基因控制,同时也受多个基因和多个位点的相互调控[32-33]。C-821G位点中C等位基因频率为优势等位基因,CC基因型个体的生长性状最佳,A-2804T位点中T等位基因频率为优势等位基因,TT基因型个体的生长性状最佳。4个SNP位点组成的双倍型分析中,CC和TT基因型组合成的双倍型个体(CC−−CCTT)的生长性状最优,进一步支持了单个SNP与生长性状的关联分析结果。在后续的选育研究工作中,可通过人为定向选择基因型为CC−−CCTT的纯合子亲本,培育生长性状优良的纯合子品系,从而提高养殖产量和经济效益。
-
表 1 养殖水质原始数据表
Table 1 Raw data sheet for aquaculture water quality
时间
TimepH 盐度
Salinity/‰温度
Temperature/℃溶解氧
DO/(mg·L−1)2023-04-11 00:05:00 7.86 36.099 998 20.114 88 9.119 555 2023-04-11 01:05:00 7.84 35.900 002 20.127 55 9.047 465 2023-04-11 02:05:00 7.84 36.200 001 20.123 21 8.998 263 ··· ··· ··· ··· ··· 2023-04-23 22:05:00 7.69 34.200 001 22.060 74 6.736 285 2023-04-23 23:05:00 7.67 34.200 001 22.063 86 6.419 692 2023-04-24 00:00:00 7.67 34.299 999 22.083 02 6.358 287 表 2 基准测试函数
Table 2 Process of benchmarking
基准测试函数
Benchmark function维度
Dimensionality搜索空间
Search space最优值
Optimal value$ {F}_{1}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}\mid {x}_{i}\mid {\text{+}}{\prod }_{i{\text{=}}1}^{n}\mid {x}_{i}\mid $ 30 $ [{\text{−}}\mathrm{10,\;10}] $ 0 $ {F}_{2}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}i{x}_{i}^{4}{\text{+}}\mathrm{r}\mathrm{a}\mathrm{n}\mathrm{d}\mathrm{o}\mathrm{m}\left[\mathrm{0,\;1}\right) $ 30 $ [{\text{−}}\mathrm{1.28,\;1.28}] $ 0 $ {F}_{3}\left(x\right){\text{=}}{\sum }_{i{\text{=}}1}^{n}{\text{−}}{x}_{i}\mathrm{s}\mathrm{i}\mathrm{n}\left(\sqrt{\mid {x}_{i}\mid }\right) $ 30 $ [{\text{−}}\mathrm{500,\;500}] $ $ {\text{−}}418.9829\times n $ ${F}_{4}\left(x\right){\text{=}}\dfrac{1}{4\;000}{\sum }_{i{\text{=}}1}^{n}{x}_{i}^{2}{\text{−}}{\prod }_{i{\text{=}}1}^{n}\mathrm{c}\mathrm{o}\mathrm{s}\dfrac{ {x}_{i} }{\sqrt{i} }{\text{+}}1$ 30 $ [{\text{−}}\mathrm{600,\;600}] $ 0 $ {F}_{5}\left(x\right){\text{=}}-\sum _{i{\text{=}}1}^{4}{c}_{i}\mathrm{e}\mathrm{x}\mathrm{p}\left[-\sum _{j{\text{=}}1}^{6}{a}_{ij}({x}_{i}-{p}_{ij}{)}^{2}\right] $ 30 $ \left[\mathrm{0,\;1}\right] $ $ -3.32 $ 表 3 基准函数优化结果对比
Table 3 Comparison of benchmark function optimization results
算法种类
Type of algorithm$ {F}_{1} $ $ {F}_{2} $ $ {F}_{3} $ $ {F}_{4} $ $ {F}_{5} $ ESSA 最优值 Ave $ 2.351\,3{\times 10}^{{\text{−}}16} $ $ 4.306\,9{\times 10}^{{\text{−}}4} $ $ {\text{−}}1.030\,1{\times 10}^{4} $ 0 −3.266 5 标准差 Std $ 1.242\,5{\times 10}^{{\text{−}}15} $ $ 5.081\,4{\times 10}^{{\text{−}}4} $ $ 1.842\,8{\times 10}^{3} $ 0 0.059 3 SSA 最优值 Ave 0.057 3 0.003 0 $ {\text{−}}3.682\,2{\times 10}^{3} $ $ 4.899\,3{\times 10}^{{\text{−}}5} $ −3.138 5 标准差 Std 0.063 1 0.002 7 359.466 6 $ 9.669\,2{\times 10}^{{\text{−}}5} $ 0.081 4 GWO 最优值 Ave 0.025 5 0.015 9 ${\text{−} }5.646\,0{\times 10}^{ 3}$ 0.082 2 −3.238 5 标准差 Std 0.013 1 0.007 8 879.281 3 0.059 1 −3.322 0 MPA 最优值 Ave 0.091 3 0.006 8 $ {\text{−}}7.235\,6{\times 10}^{3} $ 0.290 3 0.075 0 标准差 Std 0.031 1 0.003 8 685.562 5 0.128 3 1.750 6$ {\times 10}^{{\text{−}}4} $ WOA 最优值 Ave $ 7.826\,5{\times 10}^{{\text{−}}9} $ 0.019 4 $ {\text{−}}8.801\,8{\times 10}^{3} $ 0.086 9 −3.104 0 标准差 Std $ 1.722\,1{\times 10}^{{\text{−}}8} $ 0.017 9 $ 1.354\,2{\times 10}^{3} $ 0.262 4 0.340 7 表 4 参数设置
Table 4 Settings of parameters
参数
Parameter取值
Value训练样本个数 Number of training samples 3 457 测试样本个数 Number of test samples 288 训练迭代次数 Number of training iterations 100 批处理大小个数 Number of batch sizes 32 种群大小 Population size 30 表 5 预测率结果对比
Table 5 Comparison of predicted rate
算法
Algorithm平均预测率 (10次)
Average rate of prediction (10 times)增强型麻雀搜索算法 ESSA 99.071% 麻雀搜索算法 SSA 96.929% 灰狼优化算法 GWO 92.418% 海洋捕食算法 MPA 92.389% 鲸鱼优化算法 WOA 91.357% -
[1] 胡金有, 王靖杰, 张小栓, 等. 水产养殖信息化关键技术研究现状与趋势 [J]. 农业机械学报, 2015, 46(7), 251-263. [2] 刘双印. 基于计算智能的水产养殖水质预测预警方法研究 [D]. 北京: 中国农业大学, 2014: 68-78. [3] 徐琰斐, 徐皓, 刘晃, 等. 中国深远海养殖发展方式研究 [J]. 渔业现代化, 2021, 48(1): 9-15. [4] 何清, 李宁, 罗文娟, 等. 大数据下的机器学习算法综述 [J]. 模式识别与人工智能, 2014, 27(4): 327-336. [5] 沈时宇, 陈明. Prophet时序模型在短期水质溶氧预测中的应用 [J]. 渔业现代化, 2020, 47(3): 29-35. [6] REN Q, WANG X, LI W, et al. Research of dissolved oxygen prediction in recirculating aquaculture systems based on deep belief network[J]. Aquac Eng, 2020, 90: 102085.
[7] CAO X, REN N, TIAN G, et al. A three-dimensional prediction method of dissolved oxygen in pond culture based on Attention-GRU-GBRT[J]. Comput Electron Agric, 2021, 181: 105955.
[8] 宦娟, 曹伟建, 秦益霖, 等. 基于游程检测法重构集合经验模态的养殖水质溶氧预测 [J]. 农业工程学报, 2018, 34(8): 220-226. [9] 林彬彬, 袁泉, 田志新, 等. 基于SSA-LSTM模型的黄鳝池溶氧预测研究 [J]. 渔业现代化, 2023, 50(1): 71-79. [10] HONG J, SHEN B, XUE J, et al. A vector-encirclement-model-based sparrow search algorithm for engineering optimization and numerical optimization problems[J]. Appl Soft Comput, 2022, 131: 109777.
[11] XUE J K, SHEN B. A novel swarm intelligence optimization approach: sparrow search algorithm[J]. Syst Sci Control Eng, 2020, 8(1): 22-34.
[12] HOCHREITE S, SCHMIDHUBER J. Long short-term memory[J]. Neural Comput, 1997, 9(8): 1735-1780.
[13] FARAMARZI A, HEIDARINEJAD M, MIRJALILI S, et al. Marine predators algorithm: a nature-inspired metaheuristic[J]. Expert Syst Appl, 2020, 152: 113377.
[14] 张晓凤, 王秀英. 灰狼优化算法研究综述 [J]. 计算机科学, 2019, 46(3): 30-38. [15] MIRJALILI S, LEWIS A. The whale optimization algorithm[J]. Adv Eng Softw, 2016, 95: 51-67.
[16] 李争, 罗晓瑞, 张杰, 等. 基于改进麻雀搜索算法的光伏功率短期预测 [J]. 太阳能学报, 2023, 44(6): 284-289. [17] 胡顺强, 崔东文. 基于海洋捕食者算法优化的长短期记忆神经网络径流预测 [J]. 中国农村水利水电, 2021(2): 78-82, 90. [18] 薛阳, 燕宇铖, 贾巍, 等. 基于改进灰狼算法优化长短期记忆网络的光伏功率预测 [J]. 太阳能学报, 2023, 44(7): 207-213. [19] 吴会咏, 靳舒春, 安雪洁. 基于改进鲸鱼算法优化神经网络的飞机空气循环系统建模及故障分析 [J]. 西北师范大学学报(自然科学版), 2023, 59(2): 27-36. [20] 杨寒雨, 赵晓永, 王磊. 数据归一化方法综述 [J]. 计算机工程与应用, 2023, 59(3): 13-22. [21] 秦文虎, 陈溪莹. 基于长短时记忆网络的水质预测模型研究 [J]. 安全与环境学报, 2020, 20(1): 328-334. [22] 王丹. 随机梯度下降算法研究 [D]. 西安: 西安建筑科技大学, 2020: 17-27. [23] 薛建凯. 一种新型的群智能优化技术的研究与应用 [D]. 上海: 东华大学, 2020: 21-28. [24] 王鑫, 张奇志. 改进麻雀搜索算法优化支持向量机的井漏预测 [J]. 科学技术与工程, 2022, 22(34): 15115-15122. [25] 王振东, 汪嘉宝, 李大海. 一种增强型麻雀搜索算法的无线传感器网络覆盖优化研究 [J]. 传感技术学报, 2021, 34(6): 818-828. [26] 张伟康, 刘升, 任春慧. 混合策略改进的麻雀搜索算法 [J]. 计算机工程与应用, 2021, 57(24): 74-82. [27] 周茜. 混沌理论及应用若干问题的研究 [D]. 天津: 南开大学, 2010: 3-13. [28] MIRJALILI S. SCA: a sine cosine algorithm for solving optimization problems[J]. Knowl Based Syst, 2016, 96: 120-133.
[29] RATHER S A, DAS S. Levy flight and chaos theory-based gravitational search algorithm for image segmentation[J]. Math, 2023, 11(18): 3913. doi: 10.3390/math11183913
[30] 张严, 秦亮曦. 基于Levy飞行策略的改进樽海鞘群算法 [J]. 计算机科学, 2020, 47(7): 154-160. [31] 毛清华, 张强, 毛承成, 等. 混合正弦余弦算法和Lévy飞行的麻雀算法 [J]. 山西大学学报(自然科学版), 2021, 44(6): 1086-1091.