流速对不同群体数量花鲈幼鱼游泳行为的影响

郑纪昌, 颜寒, 姜燕, 徐永江, 崔爱君, 马斌

郑纪昌, 颜寒, 姜燕, 徐永江, 崔爱君, 马斌. 流速对不同群体数量花鲈幼鱼游泳行为的影响[J]. 南方水产科学, 2025, 21(3): 44-52. DOI: 10.12131/20240260
引用本文: 郑纪昌, 颜寒, 姜燕, 徐永江, 崔爱君, 马斌. 流速对不同群体数量花鲈幼鱼游泳行为的影响[J]. 南方水产科学, 2025, 21(3): 44-52. DOI: 10.12131/20240260
ZHENG Jichang, YAN Han, JIANG Yan, XU Yongjiang, CUI Aijun, MA Bin. Effects of flow velocity on swimming behavior of Lateolabrax maculatus juvenile with different population sizes[J]. South China Fisheries Science, 2025, 21(3): 44-52. DOI: 10.12131/20240260
Citation: ZHENG Jichang, YAN Han, JIANG Yan, XU Yongjiang, CUI Aijun, MA Bin. Effects of flow velocity on swimming behavior of Lateolabrax maculatus juvenile with different population sizes[J]. South China Fisheries Science, 2025, 21(3): 44-52. DOI: 10.12131/20240260

流速对不同群体数量花鲈幼鱼游泳行为的影响

基金项目: 

山东省重点研发计划 (2023TZXD050);青岛海洋科技中心山东省专项经费 (2022QNLM030001);中国水产科学研究院基本科研业务费 (2023TD51, 2024XT0701);国家海水鱼产业技术体系 (CARS-47)

详细信息
    作者简介:

    郑纪昌 (1993—),男,助理研究员,博士,研究方向为海水鱼类行为与生理学。E-mail: zhengjc@ysfri.ac.cn

    通讯作者:

    徐永江 (1981—),男,研究员,博士,研究方向为海水鱼类设施化养殖技术。E-mail: xuyj@ysfri.ac.cn

  • 中图分类号: S 965.399

Effects of flow velocity on swimming behavior of Lateolabrax maculatus juvenile with different population sizes

  • 摘要:

    为研究花鲈 (Lateolabrax maculatus) 对流速的行为适应特征,采用泳道流速仪测定了不同数量 (1、2、4、6、8尾) 花鲈幼鱼在多种流速 (0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0 BL·s−1,BL为体长) 下的游泳行为。结果显示,当流速达到4.5 BL·s−1时,各组群体运动速度 (Group movement speed, Gc) 均显著低于单尾鱼游泳速度 (p<0.05)。随着流速增加,反映鱼群凝聚力的个体间距离 (Inter-individual distance, IID) 在各组均呈先降低后上升的趋势,并在流速达到3.5~4.5 BL·s−1时出现最低值,且最低值对应的流速随着群体数量的增加而增大。反映鱼群协调性的游泳速度同步性 (Swimming speed synchrony, Sv) 与IID呈相反的变化趋势,且Sv峰值对应的流速也随着群体数量的增加而增大。当流速达到1.0 BL·s−1时,单尾鱼摆尾频率 (Tail beat frequency, TBF) 均显著高于相同流速下的其他各组 (p<0.05)。随着流速的增加,花鲈钻石型排布模式所占比例先下降后上升,方阵型模式所占比例则呈相反的变化趋势,但在各实验组中,不同流速下的花鲈均以钻石型排布模式为主。综上所述,随着流速的增加,花鲈群体的凝聚力和协调性均先升高后降低,群体数量的扩大有利于提高花鲈鱼群凝聚力和协调性,并且花鲈主要采用钻石型排布模式来降低游泳能量消耗。

    Abstract:

    To investigate the behavioral characteristics to flow velocity, we measured the swimming behaviors of juvenile Lateolabrax maculatus of different individuals (1, 2, 4, 6 and 8) at various flow velocities (0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5 and 5.0 BL·s−1; BL: Body length) by using swimming ability test tank. When the flow velocity reached 4.5 BL·s−1, the group movement speed (Gc) of fish schooling was significantly lower than that of single fish (p<0.05). With an increase in the flow velocity, the inter-individual distance (IID) (Reflects the cohesion of fish swarm) first decreased and then increased in each group, and the minimum values were observed when the flow velocity reached 3.5–4.5 BL·s−1. Besides, the flow velocity corresponding to the above IID minimum value increased with the expansion of fish population. The trend of swimming speed synchrony (SV), reflecting the coordination of fish population, was completely opposite with that of IID, and the flow velocity corresponding to the maximum SV value also increased with the fish schooling expansion. When the flow velocity reached 1.0 BL·s−1, the tail beat frequency (TBF) of single fish was significantly higher than that of other groups at the same flow velocity (p<0.05). With the increase of flow velocity, the proportion of diamond lattice displayed in fish schooling first decreased and then increased, which was opposite to the phalanx lattice pattern. However, the pattern of diamond lattice was always dominant in each group at different flow velocities. In conclusion, with the increase of flow velocity, the cohesion and coordination of L. maculatus schooling first increased and then decreased. The expansion of the fish population is conducive to improving its cohesion and coordination, and the fish mainly adopts adiamond lattice pattern to reduce swimming energy consumption.

  • 鱼类自动识别是渔业智能化的重要一环,在海洋生态学[1]、行为分析[2]、水产养殖管理[3]、健康监测[4]等领域应用广泛。鱼类由于种类多,体型大小不一,姿态多样,不同品种鱼类的外形、色彩、纹理及尺寸等相似,且数据采集中存在姿态、视角、光照、遮挡、背景干扰等因素,导致出现同种鱼类样本间差异大、不同种类之间相似性高等问题,识别难度大。而人工鉴别又耗时耗力,且高度依赖专家的经验和技能。准确识别鱼类,对于物种多样性保护和渔业可持续管理至关重要。传统的鱼类自动识别研究采用人工设计的特征对鱼类表观进行特征表达,这类特征针对性强,可靠性高,特定场景效果好;但特征表达能力有限,较难捕获高级语义特征和复杂内容,导致其泛化能力和鲁棒性差,难以应用于实际中的复杂环境。

    随着深度学习技术在人脸、指纹等目标识别任务中的成功应用[5-6],近年来,卷积神经网络(Convolutional Neural Network, CNN) 在水产物种自动识别中应用越来越广泛,并取得了较好的识别效果[7-11]。Zhuang等[7]设计了一种多模态网络模型,利用成对文本描述来区分高度相似的鱼类;李均鹏等[12]提出了一种基于迁移学习的海洋鱼类识别方法,该方法通过迁移学习和模型融合的有效结合提升模型的鲁棒性和泛化性。针对鱼类不同的局部特征可刻画其类别,姚润璐等[13]对鱼类图像进行分割,获取鱼背、鱼尾等部位,提取其形态和纹理等精细特征,并结合反向传播神经网络进行识别;Christensen等[14]开发了一种Lightfish网络模型,用于水下恶劣条件下的鱼类识别和分类。此外,针对复杂水下环境采集的数据分辨率低的情况,Pramunendar等[15]提出了一种基于反向传播神经网络的图像增强模型,通过选择合适的插值方法和网络配置提升图像的分辨率,进而提高鱼类识别的精度。

    在自然界中,鱼类物种遵循长尾分布,即少部分鱼类占大数据样本,而多数鱼类却仅有少量样本,导致收集的数据集中类别分布不均衡。由于头部类别的样本量远大于尾部,易导致模型在头部类别 (多样本类别) 过拟合、尾部类别 (少样本类别) 欠拟合,进而影响总体的识别性能。为缓解长尾分布带来的识别性能下降,目前的主要解决策略是重采样[16]和重加权[17-19]。Zhou等[20]提出了一个统一的双边分支网络 (BBN),同时进行表征学习和分类学习,在此基础上设计了一种累积学习策略,使网络首先学习通用模式,然后逐渐加权尾部数据,提升识别性能。Wang等[21]研发了一种基于学习平衡和鲁棒特征的长尾识别框架,通过构建注意特征增强模块,挖掘原始样本的类相关和变异相关特征,并对其进行聚合合成,以缓解原始数据集的类别不平衡。Pang等[22]构建了一个分层块聚合网络,以促进不同的即插即用策略的相互学习,同时设计了一个数量感知平衡损失和解耦训练策略对其优化,增强网络的特征提取能力,进而提升长尾目标的识别性能。不过,上述方法多是通过牺牲头部识别性能以换取尾部识别性能的提升,总体性能虽得以提升,但由于缺少与重要特征结合进行识别,尾部类别识别的过拟合问题仍有待解决。

    针对上述问题,本研究提出了一种基于多阶段特征提取的深度网络 (Multi-stage Feature Extraction Network, MF-Net) 模型进行鱼类识别,该模型首先使用预处理模块对图片进行预处理,然后构建多阶段特征提取模块,以学习到具有鲁棒细粒度表达能力和判别性能的高级特征,在此基础上,使用一个标签平滑损失函数以缓解鱼类类别不平衡问题。为验证该模型的有效性,构建了一个包含500个类别的鱼类数据集进行实验对比和消融分析,并利用公开的蝴蝶数据集进行实验对比分析。

    通过渔业调查项目、网络爬虫技术等收集开放环境下 (如不同地域、季节、天气等) 各种姿态的鱼类图片数据,对其进行清洗、检测、专家鉴定等处理后构建鱼类数据集。该数据集包含500种淡水和海洋鱼类,共32 768张图片。其中,每类样本量多于200张图片的鱼类有4种,低于15张图片的有10种,数据集存在类别分布不均衡。如图1所示,该数据集的特点如下:

    图  1  原始鱼类数据集特点
    Fig. 1  Characteristics of raw fish data

    1) 鱼目标与背景相似:复杂多变的开放环境使得部分鱼类拥有环境保护色;此外,部分鱼类存在纹理与背景高度重叠及严重遮挡等情况。

    2) 光线变化大:因水下环境光照条件差、亮度分布不均及光散射等原因,导致鱼类图片的颜色和纹理等存在失真情况。

    3) 姿态各异:因拍摄角度不同,获取的鱼类图像有多种不同的视角,导致同一类别鱼类存在较大的表观差异。

    4) 图像存在多目标:鱼类群体活动导致采集的鱼类数据存在多个目标。这些数据特性会降低识别精度,给鱼类自动识别带来极大挑战。此外,不同种类的鱼在形状、纹理、颜色等多种外观存在较高的相似性 (图2),进一步增加了识别难度。

    图  2  类间相似和类内差异
    Fig. 2  Subtle differences between species and dramatic changes among same species

    MF-Net识别模型主要包括预处理模块、多阶段特征提取模块和标签平滑损失函数3个部分(图3)。预处理模块对输入的鱼类图像通过卷积层和层归一化处理,将其映射到高维空间,以便后续模型获取图像丰富的判别特征;多阶段特征提取模块由多个MF-Net block和下采样层构成,每一个特征提取块由影子卷积模块Ghost Module[23]、批量归一化、深度卷积、压缩和激励 (Squeeze and excitation, SE) 注意力机制、GELU (Gaussian error linear units)激活函数和路径丢失Droppath构成。该模块通过对特征图的内在规律进行学习,进而从预处理后的特征图中学习到具有判别性的局部和全局特征。在训练过程中采用标签平滑损失函数对模型参数进行修正学习,以缓解数据类别的不平衡,提升模型的识别性能。

    图  3  MF-Net模型结构
    Fig. 3  Structure of MF-Net

    预处理模块采用卷积核大小为4×4、输出通道为96、步长为4的卷积层和层归一化的组合,将输入的图像数据映射至高维空间(图4)。在高维空间中,深度学习模型可以关注图像数据中的重要特征信息,并可捕捉特征之间复杂的非线性关系。

    图  4  预处理模块
    Fig. 4  Pre-processing module

    图5所示,在第一层残差结构中,输入的特征图首先经过影子卷积模块 Ghost Module,将提取的特征图传入到卷积核大小为 $ 3\times 3 $、步长为1、填充为1的深度卷积结构中,并对其批量归一化。在此基础上,通过SE注意力机制对通道特征进行加权,后将特征图输入第二个Ghost Module,使用路径丢失Droppath以一个固定的概率对该路径进行随机失活,以提升模型的泛化能力,然后与捷径分支的输出相加,并将结果传入第二个残差结构。当输入与输出特征图的尺寸不匹配时,可通过深度可分离卷积对输入的特征图进行维度调整。

    图  5  MF-Net block结构
    Fig. 5  Structure of MF-Net block

    第二层残差结构由2个Ghost Module及GELU激活函数组成,输入特征图在经过第一个Ghost Module后,其输出特征图经过高斯误差线性单元激活函数的激活后,传入第二个Ghost Module,并使用Droppath对该路径按一定的概率进行丢弃,然后与捷径分支的输出相加,并将该结果作为输出。在这一个残差结构中,输入、输出特征图的维度相等,捷径分支上的输出即为第一层残差结构的输出。

    第一层残差结构主要对鱼类的一些浅层特征进行提取,并通过SE注意力机制对特征图加权,使得MF-Net模型更加关注图片中目标的关键特征。第二层残差结构主要是将第一层残差结构提取的浅层特征图映射到更高的维度,进一步提取到鱼类更加丰富的特征。

    此外,MF-Net模型中,在各个阶段之间添加1个独立的下采样层。下采样层由池化核为 $ 2\times 2 $、池化步长为2的最大池化层构成,这样可在降低特征图的空间维度、减少网络中的参数数量及提高模型计算效率的同时保留特征图中的重要信息。此外,该下采样设计还可为网络引入了一定程度的平移不变性。

    参考Szeged等[24]的方法,本研究在训练过程中使用标签平滑损失函数对模型参数进行调整,以缓解数据分布不平衡带来的影响,其公式为:

    $$ H({p}{\minifont{\text{'}}},q){\text{=}}{\text{−}}\sum _{i=1}^{n}{p}{\minifont{\text{'}}}\left({x}_{i}\right)\mathrm{log}\left[q\left({x}_{i}\right)\right]=\left(1{\text{−}}\epsilon \right)H(p,q){\text{+}}\epsilon H(u,q) $$ (1)

    式中:$ H\left(p,q\right) $ 和 H(u,q) 均表示交叉熵损失函数,用于度量两个概率分布之间的差异性;n 表示类别个数;$ p\left({x}_{i}\right) $ 表示样本 $ {x}_{i} $ 的真实分布,$ {p}{{{\text{'}}}}\left({x}_{i}\right) $ 表示样本平滑后的分布;$ q\left({x}_{i}\right) $ 表示模型所预测的概率分布;u为人为引入的均匀分布;$\epsilon $ 表示标签平滑的系数,为超参数,$\epsilon $ $ \in \left(\mathrm{0,1}\right) $。

    基于上述损失函数对模型进行训练。具体步骤如下:

    1) 模型初始化:使用凯明均匀分布算法初始化除网络层外的所有卷积层的权值系数,使其均值为 0;使用正态分布算法初始化全连接层的权值系数,使其符合均值为0、方差为1的正态分布。

    2) 模型训练:将训练集传入MF-Net 中进行特征学习,并将经 Softmax 函数计算后得到的预测标签与真实标签使用标签平滑 (Label smoothing)损失函数计算网络模型的损失值。使用反向传播算法对 MF-Net 的权值系数进行更新,使损失函数值不断地向全局最小进行逼近。

    3) 模型测试:训练后的 MF-Net 在测试集进行测试,并输出在测试集的识别准确率。

    4) 模型保存:将较优的模型权值系数保存到本地后,进行下一次的模型训练。

    MF-Net模型训练的思路是:对输入的批量图像数据有 $ X\in {R}^{N\times C\times H\times W}$,其中:N为输入的样本批量数;C为输入图像的通道数;H为输入图像的高;W为输入图像的宽。

    输入的图像经预处理模块,得到维度大小为$ {X}{{{\text{'}}}}\in {R}^{N\times {C}{{{\text{'}}}}\times \frac{H}{4}\times \frac{W}{4}} $ 的特征图;然后使用多个特征提取块组成的4个阶段对图像的特征进行学习,每个阶段中包含的特征提取块个数为3、3、8、3,在此基础上,在每个特征的提取阶段之间使用下采样模块对特征图进行下采样操作,每经过一个下采样模块,输出特征图的高与宽均减少为输入特征图的一半,最后输出特征图的维度大小为 $ {X}{{{\text{'}}}}\in {R}^{N\times {C}{{{\text{'}}}}{{{\text{'}}}}\times \frac{H}{32}\times \frac{W}{32}} $。将特征图传入池化滤波器的大小为 $ \dfrac{H}{32}\times \dfrac{W}{32} $ 的平均池化层进行全局池化,并使用层归一化LayerNorm对池化后的特征图进行正则化运算,其输出特征图的维度为 ${X}{{{\text{'}}}}\in {R}^{N\times {C}{{{\text{'}}}}{{{\text{'}}}}\times 1 \times 1}$。最后将特征图传入全连接层,即可输出模型的预测分类结果。

    为验证模型性能,以MF-Net在测试集的第一准确率Acc-1和前五准确率Acc-5作为本网络模型的评价标准。Acc-1指模型输出的概率最大的预测标签与真实标签相符的准确率;Acc-5指模型输出概率前五的预测标签中包含真实标签的准确率。计算公式为:

    $$ A{\text{=}}\frac{\mathrm{T}\mathrm{P}{\text{+}}\mathrm{T}\mathrm{N}}{\mathrm{T}\mathrm{P}{\text{+}}\mathrm{T}\mathrm{N}{\text{+}}\mathrm{F}\mathrm{P}{\text{+}}\mathrm{F}\mathrm{N}} $$ (2)

    式中:A为准确率;TP为真实的正样本数量;TN为真实的负样本数量;FP为虚假的正样本数量;FN为虚假的负样本数量。

    为了进一步比较模型之间的性能,引入精确率、召回率、F1-score这3个评价指标。

    精确率 (Precision, P) 的公式为:

    $$ {P}_{k}{\text{=}}\frac{{\mathrm{T}\mathrm{P}}_{k}}{{\mathrm{T}\mathrm{P}}_{k}{\text{+}}{\mathrm{F}\mathrm{P}}_{k}} $$ (3)
    $$ P{\text{=}}\frac{1}{n}\sum _{k}^{n}{P}_{k} $$ (4)

    式中:TPk 表示第k个类别的真实正样本数量;FPk表示第k个类别的虚假正样本数量;n 表示类别个数;通过计算出每个类别的精确率,再对其取平均值获得多分类的精确率。

    召回率 (Recall, R) 的公式为:

    $$ {R}_{k}{\text{=}}\frac{{\mathrm{T}\mathrm{P}}_{k}}{{\mathrm{T}\mathrm{P}}_{k}{\text{+}}{\mathrm{F}\mathrm{N}}_{k}} $$ (5)
    $$ R{\text{=}}\frac{1}{n}\sum _{k}^{n}{R}_{k} $$ (6)

    其中,FNk表示第k个类别的虚假负样本数量;先计算出每个类别的召回率,再对其取平均获得多分类的召回率。

    F1-score的公式为:

    $$ {F}_{1{\text{-}}\mathrm{s}\mathrm{c}\mathrm{o}\mathrm{r}\mathrm{e}}{\text{=}}\frac{1}{n}\sum _{k}^{n}\frac{2 \cdot {P}_{k}\cdot {R}_{k}}{{P}_{k}{\text{+}}{R}_{k}} $$ (7)

    通过公式(3) — (7) 计算最终的F1-score,F1-score是精确率和召回率的调和平均数。

    为比较各模型的性能,进一步引入模型的浮点运算次数 (FLOPs)、参数量 (Params) 和延迟(Latency)。浮点运算次数是网络模型复杂度的衡量指标,也是网络模型速度的衡量标准。参数量为在模型进行训练时所需训练的参数总数。网络模型预测一张图片所需的时间,即为延迟。

    本实验的环境为:64位的Ubuntu 18.04操作系统,图形处理器(Graphics Processing Unit,GPU)型号为NVIDIA GeForce GTX 1080 Ti,中央处理器 (Central Processing Unit, CPU)的型号为Intel(R) Core i7-6700 CPU @3.40 GHz,集成开发环境为 PyCharm2021.3.2 + anaconda3.0,采用Pytorch1.12.1作为深度学习框架构建与部署网络模型,并使用CUDA版本并行并行计算框架。

    模型迭代次数设置为180,批处理量为32。相对平滑损失函数中的平滑参数设置为0.1。训练时优化器选择AdamW优化器,优化器的学习率变化中的最大参数设置为0.004,权重衰减系数的参数设置为0.05,一阶矩动量的指数衰减速率设置为0.9,二阶矩动量的指数衰减速率设置为0.999。其余的参数均为默认值。

    此外,在网络模型训练时,学习率的动态变化分为两个阶段。第一阶段使用Warm-up策略[25]调整学习率的变化,初始学习率为0,最大学习率为0.004,Warm-up策略的epoch数为12;第二阶段使用余弦退火算法对学习率进行调整,初始学习率为0.004,最小学习率为0.000 001,余弦退火算法[26]的最大epoch数为168。

    为验证该MF-Net模型的识别性能,基于构建的鱼类数据集,将其与主流的通用目标识别方法ResNet-50[5]、GhostNet[23]和ConvNext[27]进行实验对比分析。基线为ResNet-50,其损失函数为交叉熵损失函数,ResNet-50 (标签平滑)表示模型采用的损失函数为标签平滑损失函数,所有模型均采用在ImageNet的预训练参数,并使用默认参数与设置,结果见表1

    表  1  主流识别模型性能对比
    Table  1  Comparison of different generic recognition methods
    模型
    Model
    浮点运算次数
    Floating point operations per second/G
    参数量
    Parameter quantity/M
    Acc-1准确率
    Acc-1 accuracy/%
    召回率
    Recall/%
    精确率
    Precision/%
    F1分数
    F1-score
    ResNet-504.13025.6082.6072.9778.090.724
    ResNet-50 (标签平滑
    Label smoothing)
    4.13025.6085.1076.4580.270.761
    GhostNet0.1565.1883.3175.2178.850.746
    ConvNext15.40087.5084.2776.2079.620.759
    MF-Net1.74010.4086.8078.3781.800.781
    下载: 导出CSV 
    | 显示表格

    表1可以看出,MF-Net模型的识别效果最好 (86.80%),其Acc-1准确率比ResNet-50、GhostNet、ConvNext和ResNet-50 (标签平滑) 分别高出4.2%、3.49%、2.53%和1.7%。主要原因在于MF-Net的多阶段特征提取可以获得更好的特征表达。另外,在浮点运算、参数量、精度、召回率及F1-score等方面,该模型均优于ResNet-50和ConvNext模型,进一步表明MF-Net模型的有效性。

    为验证MF-Net模型的细粒度特征提取和识别能力,在公开的长尾蝴蝶数据集[28]中进行实验对比,其中58 066张图像为训练集,14 086张图像为测试集。基于该数据集,将所提出的MF-Net模型与双通路瀑布式 (Dual Route Cassaded, DRC) 模型、BBN长尾模型和主流通用目标识别模型进行性能对比,参照公开数据集的设定,头部类别定义为含有大于等于100张图片样本,尾部类别定义为含有小于等于30张图片样本,并统计头部类别和尾部类别的平均精度,实验结果见表2。可以看出,DRC和BBN由于出现得较早,总体识别精度比常规模型低,但头部和尾部类别的识别性能较常规模型有所提升。MF-Net模型在Acc-1和头尾部类别的准确率上均为最优,表明MF-Net模型不仅可提升长尾数据整体识别性能,同时也可提升头部和尾部的识别性能。

    表  2  蝴蝶数据集下不同长尾模型识别性能
    Table  2  Comparison of accuracy with different long-tailed methods on butterfly dataset
    模型
    Model
    Acc-1 准确率
    Acc-1 accuracy/%
    头部类别精度
    Many-shot/%
    尾部类别精度
    Few-shot/%
    DRC80.9087.2769.03
    BBN82.2088.0268.97
    ResNet-5080.9086.0966.66
    GhostNet82.2086.5568.33
    ConvNext82.7086.5868.09
    MF-Net83.8089.4072.55
    下载: 导出CSV 
    | 显示表格

    为验证该MF-Net模型对长尾数据的识别能力,选择有代表性的长尾识别模型BBN和DRC[17]在鱼类数据集上进行识别实验,结果见表3。在识别精度方面,MF-Net模型的性能最优,Acc-1准确率为86.8%,较BBN和DRC模型分别高出2.43%和3.21%。主要原因是BBN和DRC模型对长尾数据中头部类数据的识别性能较弱,进而对整个数据集的识别准确率产生影响,而MF-Net模型由于多阶段提取局部和全局特征,可以在保证头部数据性能的同时,进一步提升尾部数据的识别性能,从而提升了整体性能。

    表  3  鱼类数据集下不同长尾识别模型对比
    Table  3  Comparison of different long-tailed methods on fish dataset
    模型
    Model
    Acc-1准确率
    Acc-1 accuracy/%
    头部类别精度
    Many-shot/%
    尾部类别性能
    Few-shot/%
    BBN84.3789.4372.55
    DRC83.5988.7369.80
    MF-Net86.8090.1776.53
    下载: 导出CSV 
    | 显示表格

    为进一步验证本研究MF-Net模型中各模块的有效性,基于鱼类数据集,设置了以下5个消融实验进行对比分析。

    不同的预处理模块对模型性能影响有差异。对MF-Net模型,使用不同预处理模块进行消融实验:第一组通过卷积层、批量归一化、ReLU激活函数及最大池化的组合完成对图像数据预处理操作;第二组对图像数据中采用的卷积层、批量归一化、ReLU激活函数的组合完成预处理操作;第三组使用卷积层、层归一化的组合对图像数据进行预处理操作。鱼类识别结果如图6所示。可以看出,卷积层和层归一化的组合可更有效提升模型的性能。

    图  6  MF-Net模型不同预处理方式的识别结果
    Fig. 6  Recognition results based on different pro-processing strategies in proposed MF-Net

    block结构是网络模型的重要组成部件,在此设计不同的block结构以验证所提结构的有效性。其中,Gbneck为GhostNet模型的block结构,ResNet-Bottleneck 为ResNet模型的模块结构,MF-Net block (first residual)为MF-Net网络中的第一层残差结构,MF-Net block为本研究算法所采用的结构,结果如图7所示。

    图  7  MF-Net 模型不同block结构的识别性能
    Fig. 7  Recognition results based on different block structures in proposed MF-Net

    结果显示,不同的block结构对最终鱼类识别的效果影响显著,如在主干网络中采用MF-Net block (First residual) 结构,其Acc-1准确率仅61.80%,与Gbneck结构和MF-Net block结构相比,分别低23.3%和25.0%。这是因为不同的block层主要进行特征提取,结构不同提取的特征也不同。此外,MF-Net block结构的识别性能最佳 (86.80%),说明多阶段提取结构可以更好地捕获到鱼类更具判别性的细粒度局部特征和全局特征。

    为验证该MF-Net模型中下采样的有效性,设计不同的下采样方式进行分析,结果如图8所示。可以看出,模型使用下采样策略时,其识别性能明显高于无下采样的情形,在鱼类识别Acc-1准确率上,独立设置下采样结构的MF-Net高于未设置下采样结构的1.4%,而使用最大池化采样的MF-Net模型识别性能最佳,表明下采样在降低特征图空间维度的同时还可保留特征的重要信息。

    图  8  MF-Net模型中不同下采样策略
    Fig. 8  Recognition results based on different down sampling strategies in proposed MF-Net

    在网络训练中,损失函数指导模型的参数更新,进而影响模型的性能。为验证该MF-Net模型损失函数的有效性,采用不同的损失函数进行实验对比分析,其Acc-1和Acc-5的实验结果见图9。可以看出,无论是Acc-1还是Acc-5的准确率,均为基于标签平滑损失函数的识别性能最佳,分别为86.80%和95.90%,分别高于交叉熵损失函数、加权交叉熵损失函数和焦点损失函数2%、2.3%、2.5%和0.2%、0.9%、0.4%,表明标签平滑损失函数可有效缓解数据分布不平衡问题,从而提升鱼类识别性能。

    图  9  基于不同损失函数的识别性能
    Fig. 9  Recognition results based on different loss functions in proposed MF-Net

    为验证该MF-Net模型损失函数对长尾分布数据集的有效性,从本研究构造的鱼类数据集中选出50个类别,每类50~90张样本数据构造一个平衡数据集。在平衡数据集上与交叉熵损失函数进行实验对比分析,结果见表4。可以看出,在其他设置相同的条件下,采用改动损失函数进行实验对比,可以看到在分布均衡的数据集上,尽管识别精度相对不平衡的数据集有一定提升,但标签平滑损失函数与交叉熵精度接近,这表明平衡的数据集交叉熵和标签平滑损失函数分类效果接近。此外,由于识别精度达到90以上,因此召回率和F1-score与Acc-1准确率更加接近。

    表  4  平衡鱼类数据集下不同识别模型损失对比
    Table  4  Comparison of different recognition methods with different losses in balanced fish dataset
    模型
    Model
    浮点运算次数
    Floating point operations per second/G
    参数量
    Parameter quantity/M
    Acc-1准确率
    Acc-1 accuracy/%
    召回率
    Recall/%
    F1分数
    F1-score
    ResNet-50 (交叉熵 Cross entropy) 4.130 25.60 90.32 90.04 0.892
    ConvNext (交叉熵Cross entropy) 15.400 87.50 91.85 90.07 0.901
    GhostNet (交叉熵Cross entropy) 0.156 5.18 91.34 90.37 0.905
    MF-Net (交叉熵Cross entropy) 1.740 10.40 94.50 94.19 0.943
    ResNet-50 4.130 25.60 89.80 88.87 0.889
    ConvNext 15.400 87.50 92.50 92.24 0.925
    GhostNet 0.156 5.18 92.25 92.16 0.923
    MF-Net 1.740 10.40 94.05 93.73 0.937
    下载: 导出CSV 
    | 显示表格

    本研究提出了一个多阶段特征提取模型MF-Net,用于开放复杂环境下的鱼类识别。该方法使用了一个预处理模块以提升计算效率,并通过构建的多阶段特征提取模块,以学习识别目标中具有判别性的局部特征和全局特征。在此基础上,采用标签平滑损失函数以降低数据类别分布不均衡带来的影响,从而增强模型的识别性能。实验结果表明,该模型在本研究所提出的鱼类数据集和公开的蝴蝶数据集上均获得了较好的识别效果。在未来工作中,拟在增加鱼类类别的基础上,构建新的主干网络结构,探索细粒度特征学习、损失函数设计与类别分布不均衡之间的关联,进一步提升鱼类的识别精度。

  • 图  1   游泳能力测试水槽结构示意图

    Figure  1.   Schematic diagram of swimming ability test tank

    图  2   群体排布模式示意图

    注:a. 方阵型;b、c. 钻石型。

    Figure  2.   Schematic diagram of fish schooling layout pattern

    Note: a. Phalanx lattice; b, c. Diamond lattice.

    图  3   流速对花鲈幼鱼群体运动速度的影响

    注:n代表花鲈数量。图中不同字母表示同一组别之间差异具有显著性 (p<0.05)。

    Figure  3.   Effect of flow velocity on group movement speed of L. maculatus juvenile

    Note: n represents the number of L.maculatus. Different letters in the figure represent significant differences within the same group (p<0.05).

    图  4   流速对花鲈幼鱼个体间距离的影响

    注:n代表花鲈数量。图中不同字母表示同一组别之间差异具有显著性 (p<0.05)。

    Figure  4.   Effect of flow velocity on inter-individual distance of L. maculatus juvenile

    Note: n represents the number of L. maculatus. Different letters in the figure represent significant differences within the same group (p<0.05).

    图  5   流速对花鲈幼鱼个体游泳速度同步性的影响

    注:n代表花鲈数量。图中不同字母表示同一组别之间差异具有显著性 (p<0.05)。

    Figure  5.   Effect of flow velocity on speed synchronization of L. maculatus juvenile

    Note: n represents the number of L. maculatus. Different letters in the figure represent significant differences within the same group (p<0.05).

    图  6   流速对花鲈幼鱼摆尾频率的影响

    注:n代表花鲈数量。图中不同字母表示同一组别之间差异具有显著性 (p<0.05)。

    Figure  6.   Effect of flow velocity on tail beat frequency of L. maculatus juvenile

    Note: n represents the number of L. maculatus. Different letters in the figure represent significant differences within the same group (p<0.05).

    图  7   流速对花鲈幼鱼排布模式的影响

    注:n代表花鲈数量。图中大写字母用来标记方阵型排列模式差异性,小写字母用来标记钻石型排列模式差异性,其中不同字母表示同一组别之间差异具有显著性 (p<0.05)。

    Figure  7.   Effect of flow velocity on schooling layout pattern of L. maculatus juvenile

    Note: n represents the number of L. maculatus. Capital letters represent the differences in phalanx lattice pattern, while lowercase letters represent the differences in diamond lattice pattern. Different letters in the figure represent significant differences within the same group (p<0.05).

  • [1]

    LONG L, LIU H, CUI M, et al. Offshore aquaculture in China[J]. Rev Aquac, 2024, 16(1): 254-270. doi: 10.1111/raq.12837

    [2]

    YUAN B, CUI Y H, AN D, et al. Marine environmental pollution and offshore aquaculture structure: evidence from China[J]. Front Mar Sci, 2022, 9: 979003.

    [3] 汤保贵, 陈秀灿, 胡长圣, 等. 流速对黑鲷幼鱼游泳行为及运动生理的影响[J]. 水生生物学报, 2023, 47(12): 1993-2002. doi: 10.7541/2023.2022.0387
    [4] 陈万光, 郭国强, 张耀武. 红白鲫人工繁殖及鱼苗培育技术[J]. 水产科学, 2008, 27(6): 309-311. doi: 10.3969/j.issn.1003-1111.2008.06.011
    [5]

    ZHU T, YANG R, XIAO R, et al. Effects of flow velocity on the growth performance, antioxidant activity, immunity and intestinal health of Chinese perch (Siniperca chuatsi) in recirculating aquaculture systems[J]. Fish Shellfish Immunol, 2023, 138: 108811. doi: 10.1016/j.fsi.2023.108811

    [6]

    HUANG X, HEGAZY A M, ZHANG X. Swimming exercise as potential measure to improve flesh quality of cultivable fish: areview[J]. Aquac Res, 2021, 52(12): 5978-5989. doi: 10.1111/are.15510

    [7]

    MOZZI G, NYQVIST D, ASHRAF M U, et al. The interplay of group size and flow velocity modulates fish exploratory behaviour[J]. Sci Rep, 2024, 14(1): 13186.

    [8]

    SBRAGAGLIA V, JOLLES J W, COLL M, et al. Fisheries-induced changes of shoaling behaviour: mechanisms and potential consequences[J]. Trends Ecol Evol, 2021, 36(10): 885-888. doi: 10.1016/j.tree.2021.06.015

    [9]

    LARSSON M. Schooling fish from a new, multimodal sensoryperspective[J]. Animals, 2024, 14(13): 1984. doi: 10.3390/ani14131984

    [10]

    JOLLES J W, BOOGERT N J, SRIDHAR V H, et al. Consistentindividual differences drive collective behavior and group functioning of schooling fish[J]. Curr Biol, 2017, 27(18): 2862-2868. doi: 10.1016/j.cub.2017.08.004

    [11]

    MAXIMINO C, de BRITO T M, COLMANETTI R, et al. Parametric analyses of anxiety in zebrafish scototaxis[J]. Behav Brain Res, 2010, 210(1): 1-7. doi: 10.1016/j.bbr.2010.01.031

    [12]

    OZA A U, RISTROPH L, SHELLEY M J. Lattices of hydrodynamically interacting flapping swimmers[J]. Phys Rev X, 2019, 9(4): 041024.

    [13] 温海深, 李昀, 张美昭, 等. 花鲈: 家喻户晓的中国海鲈[J]. 中国水产, 2020(8): 110-111.
    [14] 农业农村部渔业渔政管理局, 全国水产技术推广总站, 中国水产学会. 2023中国渔业统计年鉴[M]. 北京: 中国农业出版社, 2023: 21-22
    [15]

    CAI L, ZHANG P, JOHNSON D, et al. Effects of prolonged and burst swimming on subsequent burst swimming performanceof Gymnocypris potanini firmispinatus (Actinopterygii, Cyprinidae)[J]. Hydrobiologia, 2019, 843: 201-209. doi: 10.1007/s10750-019-04049-4

    [16] 李阳希, 侯轶群, 陶江平, 等. 大渡河下游3种鱼感应流速比较[J]. 生态学杂志, 2021, 40(10): 3214-3220.
    [17] 王萍, 桂福坤, 吴常文. 鱼类游泳速度分类方法的探讨[J]. 中国水产科学, 2010, 17(5): 1137-1146.
    [18]

    WINGER P D, HE P, WALSH S J. Factors affecting the swimming endurance and catchability of Atlantic cod (Gadus morhua)[J]. Can J Fish Aquat Sci, 2000, 57(6): 1200-1207. doi: 10.1139/f00-049

    [19]

    WARDLE C S, HE P. Burst swimming speeds of mackerel, Scomber scombrus L.[J]. J Fish Biol, 1988, 32(3): 471-478. doi: 10.1111/j.1095-8649.1988.tb05382.x

    [20]

    GEORGOPOULOU D G, KING A J, BROWN R M, et al. Emergence and repeatability of leadership and coordinated motion in fish shoals[J]. Behav Ecol, 2022, 33(1): 47-54. doi: 10.1093/beheco/arab108

    [21]

    WEIHS D. Hydromechanics of fish schooling[J]. Nature, 1973, 241(5387): 290-291. doi: 10.1038/241290a0

    [22] 付世建, 聂利娟, 吴慧, 等. 群体大小对青幼鱼群体特征的影响[J]. 生态学报, 2016, 36(19): 6062-6070.
    [23]

    SHELTON D S, PRICE B C, OCASIO K M, et al. Density and group size influence shoal cohesion, but not coordination in zebrafish (Danio rerio)[J]. J Comp Psychol, 2015, 129(1): 72. doi: 10.1037/a0038382

    [24]

    LØKKEBORG S, SIIKAVUOPIO S I, HUMBORSTAD O B, et al. Towards more efficient longline fisheries: fish feeding behaviour, bait characteristics and development of alternative baits[J]. Rev Fish Biol Fish, 2014, 24: 985-1003. doi: 10.1007/s11160-014-9360-z

    [25]

    KATZ Y, TUNSTRØM K, IOANNOU C C, et al. Inferring the structure and dynamics of interactions in schooling fish[J]. Proc Natl Acad Sci, 2011, 108(46): 18720-18725. doi: 10.1073/pnas.1107583108

    [26]

    LI G, LIU H, MÜLLER U K, et al. Fishes regulate tail-beat kinematics to minimize speed-specific cost of transport[J]. Proc R Soc B, 2021, 288(1964): 20211601. doi: 10.1098/rspb.2021.1601

    [27]

    VIDELER J J, WARDLE C S. Fish swimming stride by stride: speed limits and endurance[J]. Rev Fish Biol Fish, 1991, 1: 23-40. doi: 10.1007/BF00042660

    [28]

    JOHANSEN J L, VAKNIN R, STEFFENSEN J F, et al. Kinematics and energetic benefits of schooling in the labriform fish, striped surfperch Embiotoca lateralis[J]. Mar Ecol Prog Ser, 2010, 420: 221-229. doi: 10.3354/meps08885

    [29]

    NAUEN J C, LAUDER G V. Hydrodynamics of caudal fin locomotion by chub mackerel, Scomber japonicus (Scombridae)[J]. J Exp Biol, 2002, 205(12): 1709-1724. doi: 10.1242/jeb.205.12.1709

    [30]

    HEMELRIJK C K, REID D A P, HILDENBRANDT H, et al. The increased efficiency of fish swimming in a school[J]. Fish Fish, 2015, 16(3): 511-521. doi: 10.1111/faf.12072

    [31]

    ASHRAF I, BRADSHAW H, HA T T, et al. Simple phalanx pattern leads to energy saving in cohesive fish schooling[J]. Proc Natl Acad Sci, 2017, 114(36): 9599-9604. doi: 10.1073/pnas.1706503114

    [32]

    ASHRAF I, GODOY-DIANA R, HALLOY J, et al. Synchronization and collective swimming patterns in fish (Hemigrammusbleheri)[J]. J R Soc Interface‌‌, 2016, 13(123): 20160734. doi: 10.1098/rsif.2016.0734

    [33]

    DONG G J, LU X Y. Characteristics of flow over traveling wavy foils in a side-by-side arrangement[J]. Phys Fluids, 2007, 19(5): 057107. doi: 10.1063/1.2736083

    [34]

    NEWLANDS N K, PORCELLI T A. Measurement of the size, shape and structure of Atlantic bluefin tuna schools in the open ocean[J]. Fish Res, 2008, 91(1): 42-55. doi: 10.1016/j.fishres.2007.11.019

  • 期刊类型引用(1)

    1. 尚浩然,俞洋. DAResNet:基于动态卷积与注意力的鱼类分类算法. 物联网技术. 2025(04): 133-137 . 百度学术

    其他类型引用(2)

推荐阅读
Establishment and application of qpcr and raa-lfd based onrecagene for detection ofpseudomonas anguilliseptica
WANG Yilin et al., SOUTH CHINA FISHERIES SCIENCE, 2025
Ameliorative effect of oyster enzymatic products on glucocorticoid-induced osteoporosis in rats
MA Wenyu et al., SOUTH CHINA FISHERIES SCIENCE, 2025
Study on preparation ofsargassum fusiformeoligosaccharides by enzyme and its antioxidant and antibacterial properties
DONG Mei et al., SOUTH CHINA FISHERIES SCIENCE, 2025
Hctlr1 involved in antimicrobial immune response by myd88-nf-κb signaling pathway inhyriopsis cumingii
LU Junyi et al., SOUTH CHINA FISHERIES SCIENCE, 2024
Activity red moringa oleifera leaf extract as a preventive measure on the profile of cd4+cd62l+and cd8+cd62l+cells in babl/c mice injected salmonella typhimurium
Mm. Riyaniarti Estri Wuryandari et al., KNE SOCIAL SCIENCES, 2019
The effect of different s0/oyster shell ratios on the performance of seawater sulfur autotrophic denitrification and microbial community
ZHOU Yu et al., PROGRESS IN FISHERY SCIENCES, 2025
High fischer ratio oligopeptides from hard-shelled mussel: preparation and hepatoprotective effect against acetaminophen-induced liver injury in mice
Zheng, Shuo-Lei et al., FOOD BIOSCIENCE, 2023
Zinc ameliorates acrylamide-induced oxidative stress and apoptosis in testicular cells via nrf2/ho-1/nfkb and bax/bcl2 signaling pathway
Ajibare, Ayodeji Johnson et al., REDOX REPORT, 2024
Ginsenoside rh4 facilitates the sensitivity of renal cell carcinoma to ferroptosis via the nrf2 pathway
ARCHIVOS ESPANOLES DE UROLOGIA, 2024
Differentiating the role of ni and fe in nifeox co-catalyzed bivo4 photoanode for water oxidation
ENERGY & ENVIRONMENTAL SUSTAINABILITY, 2025
Powered by
图(7)
计量
  • 文章访问数:  109
  • HTML全文浏览量:  33
  • PDF下载量:  17
  • 被引次数: 3
出版历程
  • 收稿日期:  2024-11-07
  • 修回日期:  2025-01-27
  • 录用日期:  2025-02-23
  • 网络出版日期:  2025-03-07
  • 刊出日期:  2025-06-04

目录

/

返回文章
返回