Effects of water temperature, photoperiod and light intensity on survival, feeding and growth of Schizothorax biddulphi juveniles and their tolerance of salinity and alkalinity
-
摘要: 文章采用实验生态学方法探究了水温、光周期和光照强度对塔里木裂腹鱼 (Schizothorax biddulphi) 幼鱼存活、摄食和生长的影响,使用Box-Benhnken实验设计法预测幼鱼最佳生长环境条件,并通过单因子静态毒性急性实验法对其盐碱耐受能力进行了研究。结果显示,水温5~25 ℃时幼鱼成活率均在85%以上;水温20 ℃时摄食率、体长增长率和特定生长率达到最高;光周期16 L∶8 D或光照强度500 lx时,各水平均达到最高;水温12.98 ℃、每天光照15.07 h、光照强度670.27 lx时,幼鱼达到理论最佳存活、摄食、生长条件;幼鱼24、48、72和96 h的氯化钠 (NaCl) 盐度半致死浓度 (LC50) 分别为4.01、3.62、3.29和2.92 g·L−1,安全浓度 (SC) 为0.89 g·L−1;24、48、72和96 h碳酸氢钠 (NaHCO3) 碱度LC50分别为97.14、86.75、80.26和74.52 mmol·L−1,SC为20.75 mmol·L−1。Abstract: In this paper, we investigated the effects of water temperature, photoperiod and light intensity on the survival, feeding and growth of Schizothorax biddulphi juveniles by using experimental ecological methods; predicted the optimal growth conditions for the juveniles by Box-Benhnken design; and studied the saline alkali tolerance of juveniles by single factor static toxicity acute test. The results show that the survival rate of the juveniles was above 85% at 5−25 ℃. The feeding rate, length growth rate and specific growth rate reached the maximum values at 20 ℃. When the photoperiod was 16 L∶8 D and the light intensity was 500 lx, all the indices of the juveniles reached the maximum values. Under conditions of water temperature of 12.98 ℃, daily light time of 15.07 h and light intensity of 670.27 lx, the best survival, feeding and growth were obtained. The LC50 of NaCl salinity was 4.01, 3.62, 3.29 and 2.92 g·L−1 at 24, 48, 72 and 96 h, respectively, and the safety concentration (SC) was 0.89 g·L−1. The LC50 of NaHCO3 alkalinity was 97.14, 86.75, 80.26 and 74.52 mmol·L−1 at 24, 48, 72 and 96 h, respectively, and the SC was 20.75 mmol·L−1.
-
长鳍金枪鱼 (Thunnus alalunga) 是一种大洋性高度洄游鱼类,其营养价值和经济价值高,资源丰富[1-2],广泛分布于全球温带及热带海域,其中南太平洋是中国进行长鳍金枪鱼捕捞生产的重要海域之一[3],准确预报其中心渔场可有效提高中国金枪鱼渔业生产水平。目前,国内外学者在南太平洋长鳍金枪鱼渔场环境方面的研究主要集中在渔场与海水温度、叶绿素a (Chl-a) 浓度和海面高度关系等[4-11]。樊伟等[2]研究了南太平洋延绳钓长鳍金枪鱼渔获量分布与海表温度 (Sea surface temperature, SST) 的关系,指出多数渔区平均SST为22~29 ℃;闫敏等[10]对南太平洋渔场附近Chl-a浓度进行了分析,结果显示最适Chl-a质量浓度介于0.02~0.08 mg·m−3;范江涛[12]报道了渔场单位捕捞努力量渔获量 (Catch per unit effort, CPUE) 与海面高度的关系。然而,用于渔场预报的模型和方法较少,主要有人工神经网络模型 (Artificial neural network, ANN)[13]、栖息地适应性指数 (Habitat suitability index, HSI) 模型[1, 14-15]的应用。其他海域渔场预报有贝叶斯概率 (Bayesian analysis, BA) 模型[16-17]、广义加性模型 (Generalized additive model, GAM)[18-19]、支持向量机 (Support vector machine, SVM)[20]、范例推理 (Case-based reasoning, CBR)[18, 21]等。可见,现有预报大多是利用单一模型结合环境和渔业数据进行,很容易陷入过拟合而降低模型的泛化能力[22-23]。此外,环境因素虽然可以作为建立预报模型的重要指标,但由于海洋渔业信息本身的模糊性、复杂性和不精确性,变量之间的关系有时不是一个函数或者几个变量就可以描述,在实际模型构建中,确定的单一数学模型具有一定的局限性[24]。
集成学习 (Ensemble learning) [25]是机器学习中一种构建分类和回归预测模型的策略,按照一定的规则将多个学习器进行组合,得到一个稳定且性能表现优于单一学习器的模型。通过多个学习器间的差异来提高泛化性能和预测精度,每个弱学习器的单一偏好不会处于主导地位,降低了过拟合风险。目前已有学者将随机森林 (Random forest, RF)[26]和梯度提升树 (Gradient boosting decision tree, GBDT)[27]应用于印度洋长鳍金枪鱼和东、黄海鲐鱼 (Scomber japonicus) 的渔场预报研究。考虑到渔场数据获取和渔场环境间时空非线性关系,本文根据2008—2015年南太平洋长鳍金枪鱼渔业数据,选取与渔场相关的11个环境指标 [SST、Chl-a浓度、海表温度距平 (ΔSST)、叶绿素距平 (ΔChla)、海表温度梯度 (SSTG)、叶绿素梯度 (ChlaG)、海平面异常数据 (Sea level anomal, SLA) 及渔区格网对应的前后各1个月海表温度和叶绿素值] 和3个时空指标 (月、经度和纬度),综合利用集成学习算法中的RF、Bagging决策树 (Treebag)、C5.0决策树、GBDT、AdaBoost (Adaptive boosting)、Stacking集成模型共6种模型开展了南太平洋长鳍金枪鱼渔场预报,并对比选出准确率最高的模型,可为南太平洋长鳍金枪鱼渔场预报提供理论支撑,也可为其他鱼类资源渔场的预报提供参考。
1. 材料与方法
1.1 数据来源与处理
1.1.1 数据来源
所用数据主要有渔业生产和海洋环境数据。渔业生产数据来自中水集团43艘远洋延绳钓渔船渔捞日志,包括船名、作业日期 (年/月/日)、作业位置 (经度、纬度)、渔获信息 (鱼种、产量、尾数和下钩数等),作业范围为150°E—160°W、0°—30°S (图1)。考虑到数据质量、模型构建及精度检验的需要,本文选取了2008—2015年的数据。
海洋环境数据选用SST、Chl-a浓度和SLA。SST和Chl-a浓度来源于美国国家海洋和大气局 (National Oceanic and Atmospheric Administration, NOAA) 下属的Ocean Watch网站 (https://oceanwatch.pifsc.noaa.gov),SLA来源于AVISO网站 (https://www.aviso.oceanobs.com),时间分辨率均为月,为2008—2015年共8年,其中SST空间分辨率为1/24°×1/24° (约4 km),Chl-a空间分辨率为0.05°×0.05°,SLA空间分辨率为0.25°×0.25°。为了与渔获数据进行匹配,将环境数据分辨率统一为0.5°×0.5°的空间格网。
所有数据分为两部分,2008—2014年数据作为模型构建数据,2015年数据作为模型预报精度检验数据。
1.1.2 数据预处理
1) CPUE计算。本文以经纬度0.5°×0.5°进行渔区划分,按月对其作业位置、尾数和放钩数进行统计,计算各渔区内CPUE[28],公式为:
$$ {{\rm{CPUE}}}_{\left(i,j\right)}=\frac{{N}_{fish\left(i,j\right)}\times 1\;000}{{N}_{hook\left(i,j\right)}} $$ (1) 其中
$ {{\rm{CPUE}}}_{(i,j)} $ 、$ {N}_{fish\left(i,j\right)} $ 、$ {N}_{hook\left(i,j\right)} $ 表示第i个经度、第j个纬度所处渔区格网的月平均CPUE (尾·千钩−1)、月渔获总尾数、月总投钩数。为了适应模型的需要、实现渔业生产最大化,计算了各月各渔区格网内所有CPUE值的三分位数,将渔区划分为两类,将大于第一三分位数Q1 (33.67%) 的CPUE称为高值CPUE,其所在渔区定义为南太平洋长鳍金枪鱼中心渔场。2008—2014年生产数据按0.5°×0.5°划分渔区格网,CPUE样本总数为10 301个,三分位数划分为Q1=8.77尾·千钩−1,Q2=15.85尾·千钩−1。2) 样本组成。考虑到环境对鱼类生长影响的滞后性[29],在匹配渔获数据所在格网当前月份对应的海表温度和叶绿素值的同时,提取了前后各一个月对应的海表温度 (SST_bf、SST_af) 和叶绿素值 (Chla_bf、Chla_af) 作为预测变量来增大样本间差异。并计算了SST和Chl-a衍生变量 (ΔSST[26]、SSTG[14, 20, 30]、ΔChla[26]和ChlaG[20])。因此,样本数据集输入变量包括月份 (m)、经/纬度 (Lon/Lat)、SST、Chla、SST_bf、SST_af、ΔSST、SSTG、Chla_bf、Chla_af、ΔChla、ChlaG和SLA共14种输入变量,输出变量为CPUE所属类别:YES (高CPUE渔区) 或NO (低CPUE渔区)。
$ {\Delta {\rm{SST}}}_{i,j} $ 、$\Delta {\rm{Chla}}{_{ij}}$ 、${\rm{SST}}{{\rm{G}}_{ij}}$ 和${\rm{Chl}}{\rm{a}}{{\rm{G}}_{ij}}$ 计算公式为:$$\Delta {\rm{SS}}{{\rm{T}}_{i,j}} = {\rm{SS}}{{\rm{T}}_{i,j}} - {\overline {{\rm{SST}}} _{i,j}}$$ (2) $$\Delta {\rm{Chl}}{{\rm{a}}_{i,j}} = {\rm{Chl}}{{\rm{a}}_{i,j}} - {\overline {{\rm{Chl}}{\rm{a}}} _{i,j}}$$ (3) $$ \begin{array}{c} {\rm{SSTG}}_{{i,j}}{=}\\\sqrt{{\left[\left({{{\rm{SST}}}}_{{i+1,j}}-{}{{{\rm{SST}}}}_{{i-1,j}}\right){/}{\varDelta y}\right]}^{{2}}{+}{\left[\left({{{\rm{SST}}}}_{{i,j+1}}-{{{\rm{SST}}}}_{{i,j-1}}\right){/}{\varDelta x}\right]}^{{2}}} \end{array}$$ (4) $$ \begin{array}{c} {{\rm Chl}{\rm aG}}_{{i,j}}{=}\\\sqrt{{\left[\left({{{\rm{Chl}}}{}{{\rm{a}}}}_{{i+1,j}}{-}{{{\rm{Chl}}}{}{{\rm{a}}}}_{{i-1,j}}\right){/}{\varDelta y}\right]}^{{2}}{+}{\left[\left({{{\rm{Chl}}}{}{{\rm{a}}}}_{{i,j+1}}{-}{{{\rm{Chl}}}{}{{\rm{a}}}}_{{i,j-1}}\right){/}{\varDelta x}\right]}^{{2}}} \end{array}$$ (5) 式 (2)、(3) 中,i、j为渔区所在的行、列号,
$ {{{\rm{SST}}}}_{{{\rm{i}},j}} $ 和${{{\rm{Chl}}}{{\rm{a}}}}_{{i,j-1}}$ 为该渔区对应的SST和叶绿素值,${\overline {{\rm{SST}}} _{i,j}}$ 和${\overline {{\rm{Chl}}{\rm{a}}} _{i,j}}$ 分别为该渔区在2008—2014年的月平均SST和叶绿素值;式 (4)、(5) 中,$ {{{\rm{SST}}}}_{{i \pm 1,j}} $ 、$ {{{\rm{SST}}}}_{{i,j \pm 1}} $ 为该渔区上、下、左、右4个格网对应SST,${{{\rm{Chl}}}{{\rm{a}}}}_{{i \pm 1,j}}$ 、${{{\rm{Chl}}}{{\rm{a}}}}_{{i,j \pm 1}}$ 为该渔区上、下、左、右4个格网对应叶绿素值,$ \Delta x $ 为在经度方向的分辨率,$ \Delta y $ 为在纬度方向的分辨率(°)。数据预处理用Python语言实现。1.2 集成学习模型
与传统的单一学习器不同,集成学习模型是利用一定方式更改初始训练样本的分布,构建不同的基学习器,并通过一定策略组合得到一个更强的学习器,提升了学习器的性能。最经典的算法为Bagging (Boostrap aggregating)、Boosting、Stacking3种[25],目前已被广泛应用于各个领域。
Bagging算法通过Bootstrap自助采样的方式,抽取不同的训练子集,再分别用不同的训练子集建立个体学习器,最后将其组合为整体。代表算法是RF,其是在Bagging基础上,以决策树为基学习器,进一步在训练过程中引入了随机特征的选择,即在每个节点分裂过程中的特征随机选择,泛化能力强且实现简单[26]。而Treebag算法进行n次Bootstrap采样得到n个训练子集,使用相同的算法建立决策树,与RF的区别在于没有进行特征选择。
Boosting算法通过分布迭代的方式构建模型,每个模型学习并修正上一个模型错判的样本。代表算法有AdaBoost和GBDT。AdaBoost[31]首先为每个样本赋予相同的权重,训练得到初始分类器,分错的样本被赋予更高的权重继续下一轮训练,n次迭代后得到n个基分类器,将其组合得到最终分类器。GBDT[32]是在每一轮迭代中,计算当前模型损失函数的负梯度方向,再乘以一定的步长 (即学习速率),加到当前模型中形成此轮迭代新模型,相比上轮模型,均可使损失函数更小。AdaBoost是直接通过提升错分数据点的权重来弥补模型的不足,而GBDT通过算梯度来弥补,每一步的残差计算实际上也是变相地增大被分错样本的权重[32]。C5.0算法[33]采用Boosting方式提高模型准确率,又称为BoostingTrees[27]。
Stacking算法是指训练一个用于组合多个个体学习器的模型,学习如何把各个模型组合达到最优性能。本文采用GLM线性模型对上述RF、Treebag、AdaBoost、C5.0模型和K最近邻 (K-nearest neighbor, KNN) 模型进行了组合。利用R语言caret包进行建模。
1.3 最优参数的确定方法
在进行建模时需要对模型参数进行优化。在caret包中主要函数命令为train,本文method选择repeatedcv重抽样方法,number选择10,repeats选择3,即为重复3次10折交叉验证。其中10折为将所有数据集分为10份,使用90%的数据作为训练集,确定一个参数组,经学习后得到一个分类模型,而将剩下的10%这一折数据用来评估,将其带入上述模型,计算模型准确率,重复10×3次后,最终输出所有折的平均性能指标。该函数内置网格搜索 (Grid-search) 思想,实现了模型的参数组合设置,不断改变参数的值,以训练得到新的模型,并再次检验预报精度,最终比较得出使模型精度达到最高的参数组合。
1.4 预报精度的检验方法
本文利用2008年1月—2014年12月的数据进行预报模型的建立,利用2015年的数据对预报模型进行精度检验。实验中使用总体准确率和高CPUE渔区预报准确率作为检验标准,来表示预报模型得到的渔场和实际渔场的符合程度,计算公式为:
$$ p=\frac{{C}_{0}\cap {C}_{0}'+{{C}_{1}\cap C}_{1}'}{{C}_{0}+{C}_{1}}\times 100 {\text{%}} $$ (6) $$ {p}_{0}=\frac{{C}_{0}\cap {C}_{0}'}{{C}_{0}}\times 100 {\text{%}} $$ (7) 式中
$ p $ 为预报总体精度,$ {p}_{0} $ 为高CPUE渔区中预报正确的概率,$ {C}_{0}' $ 为预报正确的高CPUE渔区集合,$ {C}_{1}' $ 为预报正确的低CPUE渔区集合;$ {C}_{0} $ 为实际渔区中高CPUE渔区集合,$ {C}_{1} $ 为实际渔区中低CPUE渔区集合。2. 结果
2.1 CPUE分布
长鳍金枪鱼月平均CPUE均大于12尾·千钩−1,1—4月CPUE变化很小 (12~13尾·千钩−1),9—12月约15尾·千钩−1,而5—8月CPUE较高。其中7月CPUE最高,达20.88尾·千钩−1,3月最低,为12.38尾·千钩−1 (图2)。因此,5—8月为南太平洋长鳍金枪鱼的盛产期,其余月份相对为淡季。
2.2 长鳍金枪鱼渔场CPUE与环境及时空指标的关系
2.2.1 环境对高、低CPUE渔区分类的影响
从渔区分类角度统计分析了2008—2014年长鳍金枪鱼高、低CPUE渔区数据与不同SST、Chl-a、SLA区间的关系。以第一三分位数为标准划分的高CPUE渔区与低CPUE渔区同时存在,仅在频数占比上存在差别 (图3-a),因此,当输入全新待分类数据集时,学习器必会偏向频数占比较大的类别进而影响分类的正确性,可见SST属性难以区分高CPUE渔区与低CPUE渔区,需结合其他条件进行渔区分类。渔区仅在频次占比上存在细微差别 (图3-b),以Chl-a属性区分渔区相比以SST区分其难度更大。SLA在−0.09~0.15 m区间上频次占比上下波动 (图3-c),以SLA属性仍无法区分高、低CPUE渔区。可见,由单一属性难以判别高、低渔区,应结合多个指标变量来增大高、低CPUE渔区样本集之间的差异。
2.2.2 CPUE与环境及时空指标的相关分析
采用R语言psych包计算Pearson相关系数并进行显著性检验,假设显著性水平为0.05。P均小于0.05 (表1),CPUE与各指标均呈显著相关关系。同时,通过对比相关系数的绝对值大小,可得出影响渔场分布的环境指标相对重要性排序为SST>Chl-a>SLA,时空指标相对重要性排序为Lat>Lon>m。
表 1 单位捕捞努力量渔获量与各环境及时空指标的相关分析Table 1 Correlation analysis of CPUE with environmental and spatio-temporal index变量
VariableP
相关系数R
Correlation coefficient R月份 m 0.00 0.10 经度 Lon 0.00 −0.14 纬度 Lat 0.00 −0.30 海表温度 SST 0.00 −0.32 叶绿素a浓度 Chl- a 0.00 0.14 前一个月海表温度 SST_bf 0.00 −0.33 后一个月海表温度 SST_af 0.00 −0.35 海表温度距平 ΔSST 0.00 −0.23 海表温度梯度 SSTG 0.00 0.10 前一个月叶绿素a浓度 Chla_bf 0.00 0.16 后一个月叶绿素a浓度 Chla_af 0.00 0.14 叶绿素a浓度距平 ΔChla 0.00 0.14 叶绿素a浓度梯度 ChlaG 0.04 0.01 海平面异常数据 SLA 0.02 −0.01 2.3 预报模型训练结果
2.3.1 各模型预报准确率
通过10折交叉验证及train函数内置的网格搜索算法,模型最终可调节参数设置为:RF特征数mtry=4;AdaBoost基分类器个数mfinal=150,树最大深度maxdepth=3,权重更新方式coeflearn=Freund;GBDT迭代次数n.trees=150,树的深度interaction.depth=3,学习率shrinkge=0.1;C5.0迭代次数trials=10,模型类型model=tree,特征选择winnow=FLASE。
6个集成模型准确率均达70%,且Stacking集成模型最高 (75.84%,表2)。对于本文南太平洋长鳍金枪鱼的训练集数据,Bagging模型要优于Boosting模型,相比而言RF模型较高,而增加了KNN的Stacking集成模型准确率又略高于RF。因此,本文使用Stacking集成模型进行预报。
表 2 各个模型训练结果对比Table 2 Comparison of training results of various models模型
ModelTreebag RF C5.0 GBDT AdaBoost Stacking 准确率
Accuracy/%73.87 75.52 72.99 71.14 71.33 75.84 2.3.2 GLM分析
利用GLM模型对各弱学习器进行组合,借助summary函数得到GLM模型自变量显著性检验结果 (表3)。根据P值,可得出截距、RF、C5.0和KNN均为显著性变量,对分类结果的影响非常显著 (P<0.001)。
表 3 GLM模型自变量显著性检验Table 3 Significance test of variables in Generalized linear model偏差来源
Source of deviation回归系数估计
Estimated regression coefficient标准误差
Standard differencez Pr (>|z|) 截距 Intercept 2.647 49 0.105 46 25.103 <2×10−16 P<0.001 随机数森林 RF −4.074 13 0.155 10 −26.268 <2×10−16 P<0.001 Bagging决策树 Treebag 0.091 37 0.108 10 0.845 0.398 C5.0决策树 C5.0 −0.544 04 0.105 74 −5.145 2.67×10−7 P<0.001 K最近邻 KNN −0.622 02 0.084 46 −7.365 1.77×10−13 P<0.001 AdaBoost −0.248 96 0.298 41 −0.834 0.404 2.4 Stacking集成模型预报实例
将2015年1—12月的时空各环境数据进行规范化及匹配处理后,代入上述Stacking集成模型得到各个月份的预报结果。由于渔场预报较关注高CPUE渔区位置,因此将2015年各月的高CPUE渔区预报图与同期实际生产的高CPUE渔区相叠加进行分析 (图4)。其中2015年1—6月高CPUE渔区主要分布在10°S—20°S,7—8月向南扩至27°S,9—11月又向北扩至约2°S,12月又集中分布在10°S—20°S。从渔场整体分布看,5—6月、10—11月呈聚集分布,而其他月份较离散。
2.5 预报精度检验
2015年各月的渔场预报总体准确率见图5。其中预报准确率最高为11月 (82.14%),最低为1月 (63.86%),平均70.99%。
2015年各月的高CPUE渔区预报准确率见表4。其中11月准确率最高 (90.63%),1月最低 (62.71%),平均78.76%。
表 4 2015年1—12月高单位捕捞努力量渔获量渔区预报准确率Table 4 Forecast accuracy of high CPUE fishing grounds from January to December in 2015% 月份 Month 1 2 3 4 5 6 7 8 9 10 11 12 准确率 Accuracy 62.71 63.16 66.67 65.71 97.85 94.38 70.45 80.56 68.75 90.63 95.83 88.46 3. 讨论
本文探讨了机器学习的集成学习建模策略中的6种模型 (RF、Treebag、C5.0、GBDT、AdaBoost和Stacking集成模型) 对渔场预报模型精度提高的可能性,结果表明所构建的集成学习模型的精度有所提高。经对比,选出准确率最高的Stacking集成模型对2015年的南太平洋长鳍金枪鱼渔场进行分月预测,并将高CPUE预报渔区与实际渔区进行了对比检验。研究显示,Stacking集成模型全年总体平均准确率为70.99%,高CPUE渔区预报的平均准确率为78.76%,为渔场预报模型的选择提供了一种新思路。
3.1 高CPUE渔区分布分析
2015年渔获生产情况与往年相比,每月产量均明显偏低,尤其是3—4月、7—9月高CPUE渔区呈点状分布,为预报增加了难度,导致预报精度相对较低。但从整体来看,Stacking集成模型预报的高CPUE渔区结果在空间分布上与实际渔区较好吻合。而关于实际高CPUE渔区分布,江承旭[34]对斐济专属经济区2013—2015年长鳍金枪鱼的渔场分析指出,1—3月、10—12月中心渔场位于16°S—19°S海域,第二季度开始向两边分散,与本文结果基本一致;而第三季度在南北分别有一个高CPUE海域,分别介于13°S—16°S和19°S—25°S,各占总体的28.82%和65.73%,其余区域占比较少。这与2015年渔场分布有所不同,本研究发现2015年北部的高CPUE渔区多于南部,原因可能是南太平洋长鳍金枪鱼高温区域叉长大于低温区域叉长[35],出于利益考虑,渔船偏向于在低纬作业;而且25°S以南也存在高CPUE渔区的分布,可能是因为2015年第三季度金枪鱼资源量不能满足商业渔船进而南移作业。
3.2 环境指标的选择
与大多数渔场一样,长鳍金枪鱼渔场极易受外界环境的影响[2, 14, 26]。其中SST对长鳍金枪鱼渔场的分布极为重要。Zainuddin等[36]研究认为长鳍金枪鱼渔场除了与SST有关外,与海面高度、叶绿素也有一定关系。Chl-a的渔场分析应用主要是基于海洋食物链原理[37];海面高度反映包括海水流速、流向、冷暖水团在内的海洋动力环境参数,而SLA反映与平均海平面的差值[38],常被应用于渔场分析。本研究发现单一属性难以判别高、低渔区 (图3),因此在上述属性基础上,还增加了SST、叶绿素的衍生变量,包括ΔSST和SSTG、ΔChla和ChlaG以及前后各一个月的SST和叶绿素值,以提高集成模型对高CPUE渔区的预报能力。此外,CPUE与各环境指标均呈显著相关关系。综上,本文选取的环境指标作为渔场预报模型的预测变量具有合理性。
3.3 模型的对比分析
1) 与其他模型的对比。国内外关于长鳍金枪鱼渔场预报的探索已有较多研究,但针对南太平洋海域目前最普遍使用的是HSI模型。如范永超等[1]、范江涛等[14]、马孟磊等[15]基于HSI模型,结合次表层水温等环境因子按季度 (或月份) 建立了基于各环境因子的长鳍金枪鱼HSI,并选择不同的方法计算多因子综合指数。HSI模型的结果是针对某一特定生物生境适宜度的表达,对渔业专家知识依赖度较高。在模型精度表示方面,其主要是统计大于0.6的渔区占比,这与实际渔场并无直接严格的相关性[39]。在相当多的情况下HSI大于0.6的海域可能占多数,一旦改变中心渔场的划定范围,其统计精度必会发生很大变化。而本文的模型精度计算原理是表征预报渔区与实际渔区的一致程度,且最终采用的Stacking集成模型综合了RF、Treebag、AdaBoost、GBDT及KNN的预测结果,预报准确率方面相比单一HSI较为可靠。
2) 模型间的对比。模型训练结果表明,Bagging算法平均准确率为74.7%,Boosting为71.8%,Bagging优于Boosting。Bagging作为一种并行式集成算法,对大样本训练速度有优势,并且由于采用了随机采样,其训练的模型方差小且泛化能力强。相较于Treebag,在划分节点时随机特征选择的优势下,RF的每棵树均能充分生长[26, 40],使本研究14种样本特征的渔业数据表现较好。Boosting针对错判的样本进行学习,该方法能够显著提高学习效果,但其缺点是容易受噪声影响[25]且基学习器只能顺序生成,因此,渔业数据本身的不完整和不确定性导致了模型相对较低的精度。基于GLM模型的Stacking渔场预报模型能够全面组合各层学习器的优势。本文维度m为5,5种基分类器分别结合10折交叉验证方式输出预测结果,并与真实值组合作为训练数据进行次级学习,建立了5组预测值与真实值更为准确的映射关系,准确率达75.84%,Stacking集成模型在南太平洋长鳍金枪鱼渔业数据上表现出众。
根据GLM模型自变量显著性结果,截距、RF、C5.0和KNN均为显著性变量,Stacking综合多个学习器的分类结果,学习器单一偏好不会处于主导地位,同时次级学习器选择简单模型进一步降低了过拟合风险。且模型对于基础学习器的类型选择没有限制,对诸多成熟的学习框架均具有良好适用性。尽管RF与Stacking在本文数据的精度上仅相差0.3,但这与渔业数据质量密切相关,对于复杂多样的海洋渔业数据而言,应充分利用Stacking的组合思想优势为其服务,可为之后的模型选择作参考。
3.4 模型和研究的完善
本文试验性地将集成学习思想应用在南太平洋长鳍金枪鱼渔场预报研究中,各学习器在利用函数内置的优化参数算法的情况下,Stacking集成模型取得了较高准确率,在后续工作中需要加以完善和调整参数优化的方式,以进一步提高模型性能。同时,由于渔业生产数据本身的特殊性,导致数据在时效性上存在不足,今后应加强渔业数据收集和整理工作以及渔场对应环境属性值计算的相关研究,使其更准确地反映海洋环境,为渔场预报模型提供更可靠、实时的原始渔业和环境信息,从而更精确地预报及指导渔业生产。
-
图 2 水温、光照时间和光照强度对塔里木裂腹鱼幼鱼成活率、摄食率、体长增长率和特定生长率的响应面
a. 水温和光照时间对成活率的影响;b. 水温和光照强度对成活率的影响;c. 光照时间和光照强度对成活率的影响;d. 水温和光照时间对摄食率的影响;e. 水温和光照强度对摄食率的影响;f. 光照时间和光照强度对摄食率的影响;g. 水温和光照时间对体长增长率的影响;h. 水温和光照强度对体长增长率的影响;i. 光照时间和光照强度对体长增长率的影响;j. 水温和光照时间对特定生长率的影响;k. 水温和光照强度对特定生长率的影响;l. 光照时间和光照强度对特定生长率的影响。
Figure 2. Response surface and contour plot of effects of water temperature, illumination time and light intensity on survival rate, feeding rate, length growth rate, specific growth rate of S.biddulphi juveniles
a. Influence of WT and IT on SR; b. Influence of WT and LI on SR; c. Influence of IT and LI on SR; d. Influence of WT and IT on FR; e. Influence of WT and LI on FR; f. Influence of IT and LI on FR; g. Influence of WT and IT on LR; h. Influence of WT and LI on LR; i. Influence of IT and LI on LR; j. Influence of WT and IT on SGR; k. Influence of WT and LI on SGR; l. Influence of IT and LI on SGR.
表 1 各实验组塔里木裂腹鱼幼鱼的初始和最终体长及体质量
Table 1 Initial and final body length and body mass of S. biddulphi juveniles in different groups
N=1 440 实验组
Group初始体长
Initial body length/mm最终体长
Final body length/mm初始体质量
Initial body mass/g最终体质量
Final body mass/g5 ℃ 45.32±0.52 50.42±0.65 0.81±0.73 1.17±0.96 10 ℃ 46.25±0.38 53.02±0.73 0.98±0.96 1.71±0.20 15 ℃ 47.38±0.12 56.76±0.68 1.29±0.98 2.56±0.67 20 ℃ 48.63±0.36 59.49±0.53 1.65±0.86 3.36±0.94 25 ℃ 46.36±0.49 53.98±0.49 1.08±0.75 1.74±0.78 30 ℃ 47.33±0.16 49.96±0.83 1.26±0.53 1.40±0.63 0 L∶24 D 47.02±0.28 — 1.20±0.63 — 8 L∶16 D 45.36±0.13 51.60±0.21 0.83±0.44 1.28±0.59 12 L∶12 D 48.63±0.22 57.85±0.89 1.63±0.87 2.84±0.99 16 L∶8 D 49.56±0.15 61.25±0.87 1.72±0.76 3.58±0.97 24 L∶0 D 46.35±0.48 50.84±0.77 1.05±0.93 1.28±0.72 2 000 lx 47.89±0.56 53.04±0.69 1.29±0.94 1.71±0.98 1 000 lx 48.31±0.60 57.26±0.32 1.53±0.97 2.46±0.94 500 lx 48.52±0.19 60.80±0.31 1.62±0.96 3.40±0.96 100 lx 47.11±0.22 56.73±0.57 1.19±0.88 2.41±0.54 10 lx 46.16±0.34 50.62±0.91 1.00±0.84 1.82±0.42 表 2 响应面实验方案及结果
Table 2 Response surface design and results
实验组
Group编码值 Coded value 成活率
SR/%摄食率
FR/%体长增长率
LR/%特定生长率
SGR/(%∙d−1)A:水温 WT B:光照时间 IT C:光照强度 LI 1 0 (17.5) −1 (0) 1 (2 000) 0 0 0 0 2 −1 (5) −1 (0) 0 (1 005) 0 0 0 0 3 −1 (5) 0 (12) 1 (2 000) 75.56±0.01 0.72±0.61 8.21±0.23 0.39±0.59 4 0 (17.5) 1 (24) 1 (2 000) 44.44±0.11 0.41±0.59 4.97±0.24 0.21±0.62 5 0 (17.5) 1 (24) −1 (10) 48.89±0.16 1.12±0.63 10.73±0.27 0.59±0.13 6 0 (17.5) 0 (12) 0 (1 005) 74.44±0.15 1.59±0.43 19.12±0.63 1.38±0.11 7 1 (30) 1 (24) 0 (1 005) 0 0 0 0 8 0 (17.5) −1 (0) −1 (10) 0 0 0 0 9 −1 (5) 0 (12) −1 (10) 78.89±0.09 1.23±0.42 11.27±0.56 0.80±0.72 10 −1 (5) 1 (24) 0 (1 005) 54.44±0.12 0.94±0.24 11.12±0.53 0.49±0.63 11 0 (17.5) 0 (12) 0 (1 005) 73.33±0.07 1.39±0.38 14.01±0.36 1.11±0.53 12 0 (17.5) 0 (12) 0 (1 005) 77.78±0.03 1.36±0.35 13.97±0.57 1.02±0.41 13 0 (17.5) 0 (12) 0 (1 005) 77.78±0.03 1.25±0.41 11.29±0.39 0.86±0.32 14 1 (30) 0 (12) −1 (10) 46.67±0.08 0.62±0.62 4.09±0.47 0.30±0.31 15 0 (17.5) 0 (12) 0 (1 005) 68.89±0.11 1.42±0.58 18.06±0.46 1.15±0.22 16 1 (30) −1 (0) 0 (1 005) 0 0 0 0 17 1 (30) 0 (12) 1 (2 000) 37.78±0.15 0.64±0.22 7.65±0.48 0.33±0.39 表 3 各因素及其交互作用对塔里木裂腹鱼幼鱼成活率、摄食率、体长增长率和特定生长率的显著性检验
Table 3 Significance test of factors and their interactions on survival rate, feeding rate, length growth rate and specific growth rate of S. biddulphi juveniles
因素
Factor水平 Level A B C AB AC BC A2 B2 C2 成活率 SR 0.000 2 < 0.000 1 0.383 4 0.003 6 0.674 2 0.735 9 0.005 5 < 0.000 1 0.445 2 摄食率 FR 0.003 0 0.000 3 0.013 7 0.008 5 0.080 6 0.029 2 0.000 6 < 0.000 1 0.009 1 体长增长率 LR 0.042 3 0.009 7 0.511 7 0.077 6 0.258 3 0.319 9 0.013 3 0.000 4 0.046 3 特定生长率 SGR 0.042 6 0.018 8 0.116 4 0.146 5 0.186 0 0.245 9 0.001 6 < 0.000 1 0.005 8 表 4 不同盐度条件下塔里木裂腹鱼幼鱼的死亡率
Table 4 Lathal rate of S. biddulphi juveniles at different salinities
N=560 盐度
Salinity暴露时间 Exposure time/h 12 24 48 72 96 0 (对照组 Control) 0.00 0.00 0.00 0.00 0.00 2.5 0.00 0.00 0.00 0.00 18.33 3.0 0.00 0.00 0.00 16.67 46.67 3.5 0.00 0.00 18.33 43.33 65.00 4.0 15.00 26.67 46.67 75.00 95.00 4.5 61.67 75.00 98.33 100.00 100.00 5.0 86.67 90.00 100.00 100.00 100.00 5.5 90.00 95.00 100.00 100.00 100.00 表 5 不同碱度条件下塔里木裂腹鱼幼鱼的死亡率
Table 5 Lathal rate of S. biddulphi juveniles at different alkalinities
N=560 碱度
Alkalinity/(mmol·L−1)暴露时间 Exposure time/h 12 24 48 72 96 0 (对照组 Control) 0.00 0.00 0.00 0.00 0.00 65 0.00 0.00 0.00 0.00 16.67 75 0.00 0.00 13.33 20.00 31.67 85 0.00 0.00 15.00 43.33 76.67 95 28.33 28.33 56.67 85.00 90.00 105 46.67 63.33 95.00 100.00 100.00 115 71.67 90.00 98.33 100.00 100.00 125 98.33 95.00 100.00 100.00 100.00 表 6 塔里木裂腹鱼幼鱼的急性盐度和碱度半致死浓度
Table 6 Acute LC50 of S. biddulphi juveniles at different salinities and alkalinities
暴露时间
Exposure time/h盐度半致死浓度
Salinity LC50/(g·L−1)安全浓度
SC/(g·L−1)碱度半致死浓度
Alkalinity LC50/(mmol·L−1)安全浓度
SC/(mmol·L−1)24 4.01 (3.84~4.18) 0.89 97.14 (93.62~100.79) 20.75 48 3.62 (3.48~3.76) 86.75 (83.66~89.95) 72 3.29 (3.15~3.43) 80.26 (77.45~83.17) 96 2.92 (2.78~3.06) 74.52 (71.70~77.44) 注:括号中数值为95%置信区间。 Note: The values in brackets are 95% confidence intervals. -
[1] 叶博, 程之扬, 彭茂潇, 等. 急性pH和碳酸盐碱度对缢蛏存活率、Na+/K-ATPase活性及血淋巴吞噬能力的影响[J]. 水产学报, 2019, 43(8): 1723-1732. [2] 庄亚润, 孙真, 周凯, 等. 中国西北地区次生盐碱水无机氮转化与环境因子的相关关系[J]. 中国水产科学, 2020, 27(12): 1438-1447. [3] 徐伟, 耿龙武, 姜海峰, 等. 浅析盐碱水域的鱼类养殖开发利用[J]. 水产学杂志, 2015, 28(4): 44-47. doi: 10.3969/j.issn.1005-3832.2015.04.010 [4] HE D, CHEN Y. Biogeography and molecular phylogeny of the genus Schizothorax (Teleostei: Cyprinidae) in China inferred from cytochrome b sequences[J]. J Biogeogr, 2010, 33(8): 1448-1460.
[5] MILLER T J, CROWDER L B, RICE J A, et al. Larval size and recruitment mechanisms in fishes: toward a conceptual framework[J]. Can J Fish Aquat Sci, 1988, 45(9): 1657-1670. doi: 10.1139/f88-197
[6] 周胜杰, 胡静, 于刚, 等. 光周期对尖吻鲈仔稚鱼消化酶活性的影响[J]. 海洋科学, 2018, 42(6): 63-69. doi: 10.11759/hykx20180201003 [7] 宋超, 庄平, 章龙珍, 等. 不同温度对西伯利亚鲟幼鱼生长的影响[J]. 海洋渔业, 2014, 36(3): 239-246. doi: 10.3969/j.issn.1004-2490.2014.03.007 [8] 苏富强, 吴凡, 文华, 等. 两种水温条件下吉富罗非鱼对两种工艺饲料的表观消化率的比较[J]. 淡水渔业, 2019, 49(6): 82-87. doi: 10.3969/j.issn.1000-6907.2019.06.013 [9] CUVIER P A, JOURDAN S, FONTAINE P, et al. Effects of light intensity on animal husbandry and digestive enzyme activities in sea bass Dicentrachus labrax post-larvae[J]. Aquaculture, 2001, 202(3/4): 317-328.
[10] 郭焱, 张人铭, 蔡林钢. 新疆鱼类志[M]. 乌鲁木齐: 新疆科学技术出版社, 2012: 114-115. [11] 张人铭, 郭焱, 马燕武, 等. 塔里木裂腹鱼资源与分布的调查研究[J]. 淡水渔业, 2007, 37(6): 76-78. doi: 10.3969/j.issn.1000-6907.2007.06.019 [12] 龚小玲, 崔忠凯, 吴敏芝, 等. 塔里木裂腹鱼胚胎和仔鱼的发育与生长[J]. 上海海洋大学学报, 2013, 22(6): 827-834. [13] 杨天燕, 孟玮, 郭焱, 等. 新疆两种裂腹鱼形态学和COI基因的比较分析[J]. 水产学杂志, 2013, 26(1): 10-14. doi: 10.3969/j.issn.1005-3832.2013.01.003 [14] 任永丽. 基于SSR标记及mtDNA序列的塔里木裂腹鱼群体遗传多样性分析[D]. 阿拉尔: 塔里木大学, 2020: 1-13. [15] 金方彭, 李光华, 李林, 等. pH和盐度对后背鲈鲤幼鱼存活的影响[J]. 水生生物学报, 2018, 42(3): 578-583. [16] 顾兵, 张政, 李玉萍, 等. 半数致死量及其计算方法概述[J]. 中国职业医学, 2009, 36(6): 507-508, 511. [17] 李洪涛, 周文宗, 高红莉, 等. 运用均匀设计法检验盐度和碱度对泥鳅的联合毒性作用[J]. 水产科学, 2006, 25(11): 563-566. doi: 10.3969/j.issn.1003-1111.2006.11.007 [18] 胡琼, 李胜忠, 曹景成, 等. 葡萄糖、丙三醇和盐对厚唇裂腹鱼精子活力的调控研究[J]. 南方水产科学, 2019, 15(2): 38-46. doi: 10.12131/20180193 [19] 陈思. 养殖水温、饵料种类及氨氮和亚硝酸盐对珍珠龙胆石斑鱼幼鱼生长性能的影响[D]. 湛江: 广东海洋大学, 2015: 1-4. [20] 吾欢欢, 张运海, 陈文, 等. 水温对前鳍高原鳅幼鱼生长和存活的影响[J]. 淡水渔业, 2020, 50(5): 25-30. doi: 10.3969/j.issn.1000-6907.2020.05.004 [21] 曾本和, 周建设, 王万良, 等. 水温对异齿裂腹鱼幼鱼存活、摄食和生长的影响[J]. 淡水渔业, 2018, 48(6): 77-82. doi: 10.3969/j.issn.1000-6907.2018.06.012 [22] 白海文, 张颖, 李雪, 等. 温度对施氏鲟幼鱼摄食、生长和肠道消化酶活性的影响[J]. 中国水产科学, 2012, 19(5): 799-805. [23] 胡发文, 潘雷, 高凤祥, 等. 温度和盐度变化对大泷六线鱼幼鱼存活与生长的影响[J]. 海洋科学, 2012, 36(7): 44-48. [24] 牟振波, 刘洋, 徐革锋, 等. 细鳞鱼摄食和生长最适水温的研究[J]. 水产学杂志, 2011, 24(4): 6-8, 24. doi: 10.3969/j.issn.1005-3832.2011.04.003 [25] 祝斐, 张志勇, 徐献明, 等. 光周期对松江鲈鱼生长和性腺发育影响的初步研究[J]. 海洋科学, 2016, 40(9): 32-38. doi: 10.11759//hykx20150606002 [26] 王萍, 桂福坤, 吴常文, 等. 光照对眼斑拟石首鱼行为和摄食的影响[J]. 南方水产, 2009, 5(5): 57-62. [27] 叶乐, 胡静, 王雨, 等. 光周期和光照强度对克氏双锯鱼仔鱼存活、生长和发育的影响[J]. 琼州学院学报, 2014, 21(5): 78-86. [28] VINOTH R, AJITHKUMAR T T, GOPI M. Photoperiod induced larval growth of anemone flash Amphiprion percula[J]. WASJ, 2010, 10(3): 283-286.
[29] BRITZ P J, PIENAAR A G. Laboratory experiments on the effect of light and cover on the behaviour and growth of African catfish, Clarias gariepinus (Pisces: Clariidae)[J]. J Zool, 1992, 227(1): 3-62.
[30] YOSEDA K, YAMAMOTO K, ASAMI K, et al. Influence of light intensity on feeding, growth, and early survival of leopard coral grouper (Plectropomus leopardus) larvae under mass-scale rearing conditions[J]. Aquaculture, 2008, 279(1/2/3/4): 55-62.
[31] 强俊, 王辉, 李瑞伟, 等. 盐度对奥尼罗非鱼仔、稚鱼生长、存活及其消化酶活力的影响[J]. 南方水产, 2009, 5(5): 8-14. [32] FANG L S, SHU F C. Effect of salinity on the activ-ities of digestive proteases from the tilapia fish, Oreochromis niloticus, in different culture environments[J]. Comp Biochem Physiol A, 1989, 93(2): 439-443. doi: 10.1016/0300-9629(89)90063-7
[33] PURKERSON J M, SCHWARTZ G J. The role of carbonic anhydrases in renal physiology[J]. Kidney Int, 2007, 71(2): 103-115. doi: 10.1038/sj.ki.5002020
[34] ZHAO Y, WU J W, WANG Y, et al. Role of miR-21 in alkalinity stress tolerance in tilapia[J]. Biochem Biophys Res Commun, 2016, 471(1): 26-33. doi: 10.1016/j.bbrc.2016.02.007
[35] 王妤, 庄平, 章龙珍, 等. 盐度对点篮子鱼的存活、生长及抗氧化防御系统的影响[J]. 水产学报, 2011, 35(1): 66-73. [36] 刘智皓, 兰雪溶, 李英文. 乙炔基雌二醇短期暴露损伤斑马鱼雌性成鱼渗透压调节[J]. 重庆师范大学学报 (自然科学版), 2019, 36(4): 44-48. [37] SEDDIKI H, BOEUF G, MAXIME V, et al. Effects of growth hormone treatment on oxygen consumption and sea water adaptability in Atlantic salmon parr and presmolts[J]. Aquaculture, 1996, 148(1): 49-62. doi: 10.1016/S0044-8486(96)01407-X
[38] MARTÍNEZALVAREZ R M, SANZ A, GARCÍAGALLEGO M, et al. Adaptive branchial mechanisms in the sturgeon Acipenser naccarii during acclimation to saltwater[J]. Comp Biochem Physiol A, 2005, 141(2): 183-190. doi: 10.1016/j.cbpb.2005.05.003
[39] 柳敏海, 彭志兰, 张凤萍, 等. 盐度对条石鲷摄食、生长和肌肉生化组成的影响[J]. 大连海洋大学学报, 2012, 27(5): 392-397. doi: 10.3969/j.issn.2095-1388.2012.05.002 [40] 耿龙武, 徐伟, 李池陶, 等. 盐碱对大鳞鲃血清渗透压、离子含量及鳃丝 Na+/K+-ATP酶活力的影响[J]. 中国水产科学, 2011, 18(2): 458-465. [41] 杨建. 盐碱胁迫下5种鱼类的耐受性和免疫应激反应[D]. 上海: 上海海洋大学, 2014: 14-15. [42] 刘济源. 盐碱胁迫对青海湖裸鲤呼吸耗氧、渗透和离子调节的影响[D]. 上海: 上海海洋大学, 2012: 13. [43] 武鹏飞, 耿龙武, 姜海峰, 等. 三种鳅科鱼对NaCl盐度和NaHCO3碱度的耐受能力[J]. 中国水产科学, 2017, 24(2): 248-257. [44] 池炳杰, 梁利群, 刘春雷, 等. 滩头雅罗鱼幼鱼对NaCl浓度和碱度的适应性分析[J]. 中国水产科学, 2011, 18(3): 689-694. [45] 魏玉众, 张人铭, 宋明波, 等. 欧鲇幼鱼对盐碱的耐受性[J]. 新疆农业科学, 2019, 56(7): 1335-1343. [46] 周文宗, 宋祥甫, 陈桂发. 黄鳝对盐碱耐受性的研究[J]. 淡水渔业, 2014, 44(3): 95-99. doi: 10.3969/j.issn.1000-6907.2014.03.017 -
期刊类型引用(9)
1. 赵诣,袁红春. 基于多通道单回归的太平洋长鳍金枪鱼渔场预测模型与可解释性研究. 水生生物学报. 2025(03): 15-27 . 百度学术
2. 宋利明,任士雨,张敏,隋恒寿. 基于集成学习的大西洋热带水域大眼金枪鱼渔情预报. 水产学报. 2023(04): 64-76 . 百度学术
3. 王志华,杨晓明,田思泉. 南太平洋长鳍金枪鱼资源不同尺度的空间格局特征. 南方水产科学. 2023(02): 31-41 . 本站查看
4. 张聪,周为峰,樊伟. 基于ADASYN和Stacking集成的南太平洋黄鳍金枪鱼渔场预报模型研究. 海洋渔业. 2023(05): 544-558 . 百度学术
5. 宋利明,任士雨,洪依然,张天蛟,隋恒寿,李彬,张敏. 大西洋热带海域长鳍金枪鱼渔场预报模型的比较. 海洋与湖沼. 2022(02): 496-504 . 百度学术
6. 曾硕星,袁红春. 基于极限学习机的南太平洋长鳍金枪鱼渔场预测. 渔业现代化. 2022(03): 99-106 . 百度学术
7. 张聪,周为峰,唐峰华,石永闯,樊伟. 基于机器学习的中西太平洋黄鳍金枪鱼渔场预报模型. 农业工程学报. 2022(15): 330-338 . 百度学术
8. 周胜杰,杨蕊,于刚,马振华,孟祥君. 美济礁附近海域3种金枪鱼肌肉成分检测与营养评价. 南方水产科学. 2021(02): 51-59 . 本站查看
9. 宋利明,任士雨,张敏,隋恒寿. 基于集成学习的大西洋热带海域黄鳍金枪鱼渔情预报. 中国水产科学. 2021(08): 1069-1078 . 百度学术
其他类型引用(12)