A method for estimating quantity of Trachinotus ovatus in marine cage aquaculture based on high-frequency horizontal mechanical scanning sonar image
-
摘要:
为准确估算海水养殖网箱中的卵形鲳鲹 (Trachinotus ovatus) 数量,基于高频水平机械扫描式声呐和深度学习技术,提出了一种海水网箱鱼群数量的估算方法。该方法使用微分水层并逐层聚类的方式以实现计数,主要包括鱼群识别计数、鱼群聚类和鱼群数量拟合3部分。首先,使用高频水平机械扫描式声呐对海水网箱进行螺旋式的检测,获取鱼群图像信息并标注图像以构建改进的CS-YOLOv8s的训练数据集,然后训练CS-YOLOv8s模型以识别图像中的鱼类位置信息;其次,以40 cm水深间距划分网箱作为水层,对每个水层的识别坐标数据使用DBSCAN方法进行聚类处理,生成每个水层的鱼群数量数据;最后,将每个水层的数量数据与网箱中已知的鱼群数量进行拟合,构建鱼群数量拟合模型。结果表明,在海水网箱定量实验中,该方法对卵形鲳鲹数量的估算精度达到87.14%,能够较好地实现卵形鲳鲹的数量估算。
-
关键词:
- 海水网箱 /
- 卵形鲳鲹 /
- 鱼群数量 /
- 高频水平机械扫描式声呐 /
- DBSCAN密度聚类
Abstract:To estimate the quantity of Trachinotus ovatus in marine cages accurately, a method for estimating the quantity of fish is proposed by using high-frequency horizontal mechanical scanning sonar and deep learning technology. Differentiating water layers and clustering layer by layer to realize counting is the main way of this method, which mainly involves three parts: fish identification, fish cluster and fish quantity fitting. Firstly, high-frequency horizontal mechanical scanning sonar is used to conduct spiral detection on marine cages to obtain fish image information, which is labeled to build training data set of improved CS-YOLOv8s. After training, the CS-YOLOv8s model is used to recognize fish location information in the images. Secondly, the cages are divided into water layers with a water depth spacing of 40 cm, and the identification coordinate data of each water layer are clustered through DBSCAN method to generate fish quantity data of each water layer. Finally, the quantity data of each water layer is fitted with the given quantity of fish in the cage, and the fitting model of fish quantity is established. The results show that in the quantitative experiment of marine cages, the accuracy of this method is 87.14%, and it can achieve a good estimation of the quantity of T. ovatus.
-
网箱养殖是建设现代化海洋牧场的主要作业方式[1],在海洋资源保护与利用中扮演着不可或缺的角色。但网箱养殖的鱼类信息数据 (数量、分布等) 难以详尽统计,不易形成具体、系统且科学的养殖及管理方案,无法为现代海洋牧场的发展提供充足的技术支撑[2-3]。随着海水养殖业的迅速发展,养殖场的数量和规模不断增加[4],鱼类数量的精确统计变得愈加困难。首先,海洋环境的多样性使鱼类在网箱中的活动难以被监测和记录,如海水的流动性和变化性会导致鱼类分布的不确定性,而传统的人工统计方法往往无法满足准确性的要求[5];其次,养殖网箱的分布地点通常较广,覆盖面积大[6],导致人工统计成本高昂,且可能存在漏报或误报的情况;此外,海洋环境中的天气、水温等因素也会对鱼类的分布和数量造成影响,进一步增加了统计的复杂性。因此,精确估算海水网箱养殖鱼类数量是当下海水网箱养殖业亟待解决的重要问题[7-8]。
网箱鱼群数量估算方法分为声学、光学和声光学混用三大类[9]。由于声光学混用方法的费用过于昂贵且实施条件、步骤过于繁琐,因此目前主流方法以声学和光学两大类为主。基于光学的方法具有非侵入性、高分辨率等优点[10]。有学者提出了利用不同的光学设备进行监测和估算的方法,并取得了一些成果[11-13]。光学设备在海水中的能见度较低,近距离的分辨率高,但远距离的效果较差,海水浑浊时的分辨率也较差,故难以充分发挥光学方法的优势。相较而言,声学方法的探测距离更远,且分辨率较为恒定。通过各种声呐设备采集数据并生成图像信息,可以获得海水网箱中鱼类的数据信息[14]。近年来,声纳设备在渔业资源监测中取得了一定成效[15-19]。Feng等[20]提出了一种声呐图像鱼类丰度自动估计方法,该法以改进的多列卷积神经网络 (Multi-column convolutional neural network, MCNN) 为基础,辅以多扩张率融合损失,提高了模型的精度。田玉先等[21]通过现场实验使用DE-FR01单波束鱼探仪和多功能小型无人船,探测围网养殖区大黄鱼 (Larimichthys crocea) 的分布位置、硬度以及海水温度、盐度、光照、pH、溶解氧等海洋环境数据,对大黄鱼分布进行了可视化分析。Jing等[22]、沈蔚等[23]使用DIDSON成像声呐获取水域数据,统计目标的平均密度、综合水域面积,估算出水域中的鱼群数量,此方法亦具有较高的统计精度。周权等[24]利用声呐及多种设备配合观测中华鲟 (Acipenser sinensis) 的分布特征,以实现对中华鲟的监测。上述研究表明,使用声呐对鱼群进行监测具有高效、便捷的优势。但是声呐在工作时的声波开角问题会导致扫描区域受限,存在视野盲区,会造成鱼群的重复计数或漏计。为了更精确地估计鱼群数量,需要进一步研究解决声呐测量中的视角盲区问题。
本研究提出了一种基于高频水平机械扫描式声呐图像的海水网箱养殖鱼群数量估算方法,采用划分水层并逐层聚类的原理,使用目标识别、密度聚类和数据拟合等技术对声呐图像数据进行分析,完成了网箱鱼群数量的估算,能以较高精度获得网箱内的鱼群数量。
1. 材料与方法
1.1 实验方法
1.1.1 实验场地及生物样品
实验数据为在珠海桂山岛海域 (
113.844 73 °E、22.125 71 °N,水温19.6 ℃,盐度21.5‰,能见度约1.5 m) 实地测量获得,使用的设备是中科探海海洋科技有限责任公司的高频水平机械扫描式成像声呐Scanfish-II (A2)型,具体技术指标和实物分别见表1和图1-a。声呐连接于图1-b中的银色电动伸缩杆末端,由伸缩杆 (伸缩速率为2.4 cm·s−1,最大量程6.41 m,固长1.5 m,可伸缩量为4.9 m) 带动实现竖直方向的单向匀速运动。本实验所用网箱的网衣尺寸为4 m×4 m×4 m,网衣四角配配重,以保证网衣在水下稳定,但受到海水浮力的影响,网衣深度约为2.9 m。实验用鱼为海水网箱中正常养殖的卵形鲳鲹 (Trachinotus ovatus),体长约24 cm,体高约12 cm。表 1 高频水平机械扫描式声呐技术指标Table 1. Technical specification of high-frequency horizontal mechanical scanning sonar项目
Project技术指标
Technical
specifiacation工作频率 Operating frequency 667 kHz 作用量程 Range of action 3 m 波束开角 (垂直×水平)
Beam opening angle (Vertical×Horizontal)7.5°×2.6° 距离像素/精度 Distance pixel/Precision 5 cm 扫描区域 (极坐标)
Scanning area (Polar coordinates)360° 工作深度 Working depth 3 m 云台旋转频率 Pan tilt rotation frequency 2.5 s·周−1 水平角度分辨率 Horizontal angle resolution 0.9° 圆筒尺寸 Cylinder size Φ 57 mm×99 mm 1.1.2 实验数据采集
本实验为定量实验,比较了100、150、200尾卵形鲳鲹的情况。如图2所示,设计由悬放于网箱水面中心位置的伸缩杆推 (拉) 动声呐在网箱中竖直运动,声呐于水下进行扫描测量 (同时工作,形成螺旋式的测量)。声呐采用低频模式,量程根据网箱的最大半径 (约2.8 m) 设定为3 m。高频水平机械扫描式声呐在扫描工作时,伸缩杆也在伸长运动,使得扫描并不限于一个水平面内,而是形成了一种螺旋式的测量方式。共测量得到19组实验数据。对19组数据进行随机编号,200尾卵形鲳鲹的7组数据编号为1、2、3、15、16、17、18;100尾卵形鲳鲹的5组数据编号为4、5、6、13、14;150尾卵形鲳鲹的7组数据编号为7、8、9、10、11、12、19。从19组数据中分别随机选取3组作为鱼群数量估算过程中数据拟合的训练集的训练组,余下的数据作为测试数据组。
1.2 数据处理方法
本研究提出的鱼群数量估算方法,需要对保存的数据进行3次处理,主要包括鱼群识别计数、鱼群聚类和鱼群数量拟合3部分,估计方法流程如图3所示。因数据较多,故以编号为1的一组数据为例进行数量估算的过程阐述,然后再对19组数据进行处理。
1.2.1 目标识别方法
Ultralytics公司的YOLOv8模型是建立在YOLO版本上的SOTA模型[25]。本研究提出了一种基于YOLOv8s模型的改进目标检测模型CS-YOLOv8s (图4),先以标注的数据集进行训练,再用其对保存的声呐图像视频数据进行目标识别处理。
考虑到声呐图像中每尾鱼为小目标,改进算法的核心思想是提高网络对小目标特征信息的感知能力。CS-YOLO优化了原始的YOLOv8结构,通过改进提升了小目标的检测效果,实现模型轻量化与性能之间的平衡,本研究主要进行如下改进:
1) 在Neck层中,引入CoT注意力机制[26],提高小目标检测能力,与GSConv[27]模块共同协作,进一步提高YOLOv8s模型的总体性能。
2) 在保留YOLOv8s本身的Backbone的同时,引入Slim-Neck[27]细颈结构,将YOLOv8s原本Neck层中的传统卷积模块替换为GSConv模块。此阶段使用GSConv处理拼接的特征图恰到好处:冗余信息少,无需压缩,与注意力模块的协调性更好。
在训练检测网络模型时,设置迭代次数为300,权值衰减系数为0.000 5,初始学习率为0.01,学习率动量为0.937,批大小为16。
1.2.2 聚类分析方法
DBSCAN (Density-based spatial clustering of applications with noise) 是一种聚焦于样本密度问题的聚类算法[28]。经改进后的CS-YOLOv8s识别算法处理后,可获得每组视频数据中每一帧被识别到的单体鱼的坐标位置,以及每一帧中所识别到的鱼的数量信息。统计每一帧所扫描到的鱼的数量数据 (Count) 及其对应的单体坐标信息 (Coordinates),将二维坐标数据由图像的归一化坐标转换为真实坐标,并为之添加根据视频数据的时间推算的深度数据 (Depth) 以构成三维坐标数据。分别汇总前述每组视频数据的三维坐标数据,以40 cm [注:根据本实验所用声呐波束垂直开角 (7.5°) 和所扫描网箱的半径大小 (3 m) 可以由三角函数求得声呐扇形波束的弦长约为40 cm,本研究的水层间距40 cm以此而定] 的深度间距划分为11层,每40 cm深度所包含的数量、三维坐标数据作为1个水层的数据。保证水层间重叠部分达到15 cm [根据前述实验用鱼的体长 (24 cm) 和体高 (12 cm) 而定]。鉴于测量时鱼会游到不同水层,会在不同水层产生相似的信号数据,因此,保证采样间隔之间有重叠部分,可以最小化聚类后中心点鱼的坐标误差。
使用DBSCAN聚类分析方法对每个水层的三维坐标数据进行聚类处理 (聚类参数设定为epsilon = 20.0,min_samples = 1)。考虑到本实验鱼类的体长 (约24 cm) 和体高 (约12 cm),以及鱼成群聚集的可能性,将聚类的半径设为20.0 cm,最小样本数设定为1尾。在以鱼的中心为球心、20 cm半径的超球体范围内,存在额外的坐标点,即可认定是同一尾鱼,因为多尾鱼不可能长时间并排存在,故本研究聚类的参数如此设定。
在聚类过程中,需要重点关注的数据有核心对象和聚类过程中被识别为噪声点的数据。但从实际考虑,不满足聚类条件意味着在一定范围内仅出现了1尾鱼的坐标,无其他干扰,即聚类所产生的每个噪声点可以单独作为1尾鱼,不能忽略。故在后续的数据的处理过程中,需将核心对象与噪声点综合考虑。
1.2.3 数据拟合方法
BP神经网络最早是由Rumelhart等提出的网络概念[29],它的基本模型主要由信息正向传递模型与信息反向传输模型共同组成,包含了输入层、隐藏层和输出层3个部分[29]。本研究先构建数据训练模型,然后应用该模型进行数据拟合。
使用每个水层的聚类数量数据 (参数集合为 $ \mathrm{e}\mathrm{p}\mathrm{s}\mathrm{i}\mathrm{l}\mathrm{o}\mathrm{n}\in [17.0,\mathrm{ }23.0],\mathrm{m}\mathrm{i}\mathrm{n}\_\mathrm{s}\mathrm{a}\mathrm{m}\mathrm{p}\mathrm{l}\mathrm{e}\mathrm{s}\in \left[1\right] $,半径以每次0.5 cm增加) 作为填充训练集,以增加拟合的稳定性,以编号为1的数据为例,部分结果如图5所示。
神经网络的训练过程中,隐藏层的神经元数为30个,使用贝叶斯正则化进行训练。共117组数据,随机抽取80%作为训练数据,20%作为测试数据。
2. 结果
2.1 原始声呐回波数据
图6为不同数量的鱼在某一时刻的声呐图像。可以看出,最外围方形的高亮部分为网箱中的网衣轮廓,网衣中间位置似鱼的轮廓为鱼的图像;其他的小图像点是包括不同体位的鱼的图像及一些由于海浪影响而形成的噪声点。图像中的网衣轮廓不尽相同,且中间和右边的2幅图有缺失部分,这是因海浪拍打,导致网衣的状态在时刻变动。
2.2 鱼类目标识别结果分析
1)训练结果。如图7所示,模型在300次后停止训练,此时loss降至0.8,mAP@0.5达87.4%。为了验证CS-YOLOv8s目标识别模型的有效性,本研究分别做了烧蚀实验和对比实验,实验为使用200张训练集训练模型的部分。训练结束后,再使用训练好的模型对19组声呐视频数据进行目标识别处理。
2)烧蚀实验。在相同的训练实验条件下,在YOLOv8s检测算法中加入不同模块,并评估各模块对检测算法性能的影响,结果见表2。本研究算法对检测算法的准确率提升最多(1.4%),同时还保证了算法的参数少、计算量少和实时性好。
表 2 烧蚀实验比较Table 2. Comparison of ablation experiments模型 Model Params/M FLOPs/G mAP@0.5 mAP@0.5:0.95 轮数Epoch YOLOv8s 11.1 28.6 86.0 43.8 300 YOLOv8s+Cot 12.0 31.6 86.7 45.2 300 YOLOv8s+Slim-Neck+Cot (本文算法 This paper's algorithm) 10.9 29.7 87.4 45.9 300 3)对比检验。在相同训练条件下,使用3种主流检测算法[30-32]进行目标识别对比实验(表3)。当输入大小均设置为640×640像素时,改进的本检测方法的检测精度最优,且模型的数据量也有极大的优化。与Faster RCNN相比,mAP@0.5提高了7.9%,而Params和GFLOPs分别降低了126.2 M和155.4 G。与YOLOv5相比,该算法的mAP@0.5提高了2.5%。总体而言,改进后的检测算法在骨干网络中加入了注意力模块和细颈结构,不仅提高了小目标的特征提取能力,还减少了模型的运算量,有效提升了对声呐图像中鱼类的识别效果。
表 3 异种检测方法的实验比较Table 3. Experimental comparison of different detection methods模型 Model mAP@0.5 mAP@0.5:0.95 Params/M GFLOPs/G 轮数Epoch Faster RCNN 69.5% 34.1% 137.1 185.1 300 SDD 76.0% 38.4% 26.3 31.4 300 YOLOv5 84.9% 40.6% 7.0 15.9 300 本文算法 This paper's algorithm 87.4% 45.9% 10.9 29.7 300 使用训练好的CS-YOLOv8s模型分别对每组视频数据进行目标识别,获得识别到的鱼的信息数据。如图8所示,以3组数据的识别结果为例,图中被框选出的便是识别到的单体鱼,框的中心点为鱼的坐标,每一帧所框选的数量为这一帧识别到的鱼的数量,每个框的标注为识别的类别和置信度。可以看出,CS-YOLOv8s模型的识别效果较好,识别出了图像中的多数单体鱼,但置信度不高,这是因为声呐在测量时,每一帧图像中每个单体鱼的数据并不完整,和1尾完整的鱼有差距,因此在识别时会呈现出有相似度却不高的情形。所以,本研究对每一帧的数据都进行目标识别处理,并对识别结果进行聚类,以减小每帧图像数据残缺对于鱼群数量估计的影响。
2.3 鱼群数量聚类结果分析
以编号为1的一组声呐测量数据 (200尾卵形鲳鲹) 经过目标识别处理后的水层225~265 cm的数据为例,水层中的所有坐标点的空间分布如图9-a所示,遍历水层中所有点,以epsilon为半径的超球体范围内,有点存在,便归纳到一类。本层共有7 681个坐标点,聚类后划分为17个簇 (图9-b),采用不同的颜色进行标识。
2.3.1 噪声点归算与展示
为了更直观地展示核心对象与噪声点,本研究选取编号为1的声呐图像数据的水层50~90 cm的1 800个点数据作为展示核心对象与噪声点的实验对象,图10-a为本水层所有数据,图10-b为调整聚类参数 (epsilon=10.0, min_samples = 1)后的实验结果。由图10-b可知,红色“★”为聚类识别出的噪声点数据,共计2个,其他的核心对象组成的簇除噪声点外共12个簇,噪声点游离在各簇之外,象征着每条独立存在的鱼。因此,在统计过程中,每簇记为1尾鱼,而噪声点需逐点计算,不能以噪声点的“Noise”簇作为1尾鱼来计算。
2.3.2 水层数据统计
编号为1的声呐数据的每个水层经过聚类(聚类参数:epsilon=20.0,min_samples = 1),可以得到每个水层鱼的数量 (表4)。
表 4 聚类结果统计Table 4. statistical results of clustering水层
Water layer/
cm总坐标
点数/个
Total number
of coordinate
points/piece聚类簇数量
(包括噪声
点簇)/个
Number of
clusters
(Including noise
clusters)/
piece噪声点
数量/个
Number of
noise points/
piece本层鱼
数量/尾
Number of
fish in this
layer/tail0~40 507 6 0 6 25~65 1 129 9 1 9 50~90 1 800 12 0 12 75~115 3 085 10 1 10 100~140 6 288 29 0 29 125~165 15 536 22 1 22 150~190 23 004 19 0 19 175~215 15 193 17 2 18 200~240 10 646 19 0 19 225~265 7 681 17 0 17 250~290 3 311 11 0 11 总计Total 88 180 171 5 172 如表4所示,所有水层的数据共计88 180个点,通过聚类得到171个簇 (其中包括噪声点簇),共识别出5个噪声点。将每个水层统计的鱼的数量进行简单求和,可以粗略得到整个网箱中鱼的数量 (172尾)。据前所述,本次聚类的目标网箱中共计有200尾卵形鲳鲹,经本研究方法测量的鱼群数量为172尾,误差为28尾,准确率为86%。虽低估了28尾鱼,但准确率较高,说明聚类的效果较好。然而,仅依靠聚类之后的简单求和来预估网箱中鱼的数量是不准确的,需要求解每个水层与整体网箱之间的函数关系并进行数据拟合。
随机从19组的测试数据组中选取3组做测试,将目标识别后获得的图像坐标按图像像素(宽804×高604) 与声呐量程半径大小 (3 m) 的比例转换为实际坐标数据,并根据声呐的运动速率 (2.4 cm·s−1) 为鱼的坐标信息添加深度数据,构成三维坐标数据;然后将网箱按照40 cm的深度划分水层,同时获取每个水层中被识别到的鱼的坐标数据信息,使用DBSCAN算法分别对每个水层的坐标数据进行聚类处理,以获取每个水层的鱼群数量 (表5)。
表 5 逐水层数量统计结果Table 5. Statistical results of number of water layers by layer编号
No.实际数量
Actual quantity水层 Water layer/cm 0~40 25~65 50~90 75~115 100~140 125~165 150~190 175~215 200~240 225~265 250~290 3 200 2 4 14 24 18 24 24 20 15 10 2 17 200 2 1 5 10 18 14 19 18 22 19 5 18 200 5 3 1 4 31 23 14 16 36 26 7 7 150 2 0 4 5 16 31 19 18 41 26 2 12 150 3 5 7 11 12 22 22 20 23 20 4 19 150 8 9 7 8 20 21 34 23 28 25 6 5 100 5 8 16 18 14 19 22 34 33 21 2 6 100 6 7 5 6 13 17 13 20 14 7 0 14 100 5 6 5 9 13 19 24 24 18 10 4 2.4 鱼群数量拟合结果分析
2.4.1 培训过程
神经网络训练结果见图11,显示了样本均方差 (Mean-square error, MSE) 的变化。经过995次训练,训练组的MSE效果最好为1.136 2×10−12,测试组最好为0.321 9。图11-b显示了训练组和测试组的预测误差,其中多数样本误差介于 [−1,1],正数表示预测大于实际数量,负数则表示预测小于实际数量。
BP神经网络的学习结果如图12所示,展示了训练组、测试组和所有数据的回归结果,即输出值与目标值之间的拟合程度。可以看出,大部分数据集中在对角线附近,少数游离在对角线之外,拟合结果均在0.99以上,说明拟合效果较好。
常用的拟合方法如线性拟合和多项式拟合[33-34],只能处理一对一的映射关系,需要从检测数据中提取一个关键数据,不适于本研究的数据格式,因此选取神经网络数据拟合方式。
2.4.2 数据拟合结果
将9组测试数据的每个水层的鱼数量导入训练的神经网络模型进行拟合,得到每个数据估算的鱼数量,估算结果如表6所示。可知,本研究算法对100、150和200尾声呐图像数据的拟合精度较高,可达87.14%,误差多数在10尾鱼以内。但也有几组误差较大,笔者推测,这几次测量中的海浪较大,声呐在水下作匀速运动时伸缩杆起伏不定,甚至有多段数据扫描到了同一水层,导致对网箱中的鱼有隔层扫描误差,在后续聚类处理时结果不及预期好,导致估计误差较大。解决方案是细化扫描数据的水层划分,减小水层之间的间距,从而实现对每层的鱼量更细致、准确的预估。
表 6 拟合数据统计结果Table 6. Statistical results of fitting data数据编号
Data No.DBscan
epsilon=20.0实际数量
Actual quantity神经网络拟合数量
Number of neural network fitting误差数量
Error quantity误差率
Error rate/%准确率
Accuracy/%3 20 200 204.61 4.61 2.30 97.70 17 20 200 189.86 10.14 5.07 94.93 18 20 200 186.37 13.63 6.82 93.18 7 20 150 146.94 3.06 2.04 97.96 12 20 150 177.78 27.78 18.52 81.48 19 20 150 100.00 50.00 33.33 66.67 5 20 100 142.08 42.08 42.08 57.92 6 20 100 99.86 0.14 0.14 99.86 14 20 100 105.47 5.47 5.47 94.53 均值 Mean 17.43 12.86 87.14 2.5 精度误差
图13为本研究采集的19组实验数据的估计和误差值的直方图。可以看出,多个组的预估误差较小,在15尾鱼以内,但有7组实验的误差数据在15尾鱼以上。经反复观看采集的数据和实验过程,发现2、19组数据在采集时,由于声呐在运动测量时海浪使得伸缩杆大幅度起伏不定,导致对某一层的数据进行多次重复测量以及隔层测量,其在进行聚类时所需的聚类半径比正常实验的半径大,而实验估计时的半径设置过小,导致聚类得到的数量较多,误差较大;而4、5、11、12、16组数据,则是在聚类时所需要的半径比正常聚类的半径小,但实验时聚类半径设置较大,导致了误差。后期可通过扩大训练的数据量和灵活变动聚类的半径范围来提高模型的稳定性,以减小估计误差值。
3. 讨论
3.1 鱼量估算方法比较
获取网箱鱼群数量的传统方法有标记-再捕获法、测鱼仪测量、环形水声多波束探测等[35-39]。由于不可能在同一环境下进行对比实验,各种方法所使用的仪器设备也各不相同,不同估算方法的对比见表7。
表 7 不同估算方法比较Table 7. Comparison of different estimation methods方法
Method设备使用
Equipment usage精度
Accuracy优点
Advantage缺点
DisadvantageMarkrecapture方法
Markrecapture method渔网、污渍 大离散区间 不需要任何电子设备 精度低,费时费力,影响鱼的生长 测鱼仪测量
Fish gauge measurement鱼类探测器 约50% 设备成本低 精度低,鱼密度大,有时误差巨大 鱼群密度划分法
Fish density division method成像声呐 90% 检测精度较高 具有偶然性,设备昂贵 图像像素等除法
Image pixel equal division前视声呐 97% 检测精度高 设备昂贵,实施过程复杂 本研究
This study高频水平机械扫描式声呐 约87% 精度高,自动测量,布局简单 测量时声呐的控制要求较高、
可变因素较多根据表7,使用前视声呐的方法精度高,但设备太过昂贵,是高频水平机械扫描式声呐的数倍,且实验需要消声水池,实验条件过于苛刻;成像声呐根据鱼群密度来判断鱼的数量,具有一定的偶然性,且测量船在行进过程中会影响到鱼的分布状态,导致重复计数;而本研究方法使用高频水平机械扫描式声呐,布局简单、可以自动获取并处理数据,无需额外的人工干预,但需要声呐在水下匀速运动且对速度要求较高。与其他方法相比,本研究方法的准确率有明显提升 (达到约87%),且在获取鱼量的同时还能获得鱼群在不同深度的分布信息,便于对鱼群进行生活习性分析,进行更精确的网箱养殖方案规划。
3.2 鱼量估算方法分析
本研究所用的高频水平机械扫描式声呐,在水平方向可实现360° 扫描,但云台旋转需要一定时间,声波的反射和回收也对云台的旋转时间有严苛的限制,这会导致声呐在旋转过程中丢失鱼群游动的数据,出现一定程度的重复测量。因此,声呐在时间差方面还需进一步改进,在提高声波强度的同时,缩短旋转所需的时间。
本研究在目标检测中使用YOLOv8模型,经训练后的识别精度可达87.4%,对识别图像中的单体鱼类效果较好,但当鱼群数量庞大时,识别模型对单体鱼的识别能力减弱,主要是由于鱼群之间的遮挡,使得单体鱼的边缘数据被模糊化。本研究所使用的DBSCAN密度聚类方法可以将一定范围内的鱼归为一类,可一定程度上减小声呐重复测量1尾鱼对数量估计的影响。但是聚类方法对于聚类参数较为敏感,在设置聚类半径时需要考虑鱼的实际体长等情况,当鱼群较为密集时,聚类半径设置和鱼群之间的实际排列状态会产生冲突。本研究所用的神经网络拟合方法主要针对本研究分水层的数量进行拟合,借鉴于微分的思想,希望通过多层的划分以实现较高精度的数量估计,但本研究所划分的水层数量依然较少,且当鱼群数量较大时,划分水层的应用效果会大打折扣。综上,后续将尝试使用目标分割的方法,解决大数量鱼群图像回波数据集中的问题,对聚类方法进行优化,尝试针对鱼的体长、体高以及体厚问题使用合理的参数进行聚类处理;针对大数量的鱼群数据进行研究,以解决鱼群遮挡和声呐测量的时间差问题。
4. 小结
本研究利用高频水平机械扫描式声呐采集卵形鲳鲹养殖网箱的数据,使用目标识别、密度聚类和数据拟合等方法对声呐图像数据进行分析,完成了网箱鱼群数量的估算,获得了网箱内鱼群的数量。主要结论为:
1) 本研究基于卵形鲳鲹的声呐图像标注数据集训练下的改进目标检测模型,在YOLOv8s骨干网中加入注意机制,增强对小目标的检测能力,使模型更适合鱼声呐图像检测任务。在先验标注数据集训练的情况下,能够有效地对声呐图像中的单体卵形鲳鲹进行识别,平均识别精度mAP@0.5达到87.4%,比原算法提高了1.4%。本研究使用DBSCAN密度聚类算法逐层对鱼群数量进行估计,得到每层鱼的数量,优化了已有方法的重复计数问题。本研究训练神经网络数据拟合模型,利用聚类分析后的每个水层的鱼群数量来拟合网箱整体的实际数量,训练拟合度在0.99以上,拟合效果较好。
2) 得益于网箱内鱼群数量较少且为封闭区域的优势,本研究能够将估算的鱼群数量与网箱内实际的鱼群数量进行对比。多组实验数据表明,本研究的方法估算卵形鲳鲹数量的精度为87.14%,证明了该方法的可行性与实用性。针对鱼群数量统计的问题,高频水平机械扫描式声呐能够提供一定程度的技术辅助。
3) 所提出的网箱鱼群数量估算方法也存在一定的缺点,如当鱼群数量庞大且较为密集时,鱼群之间的遮挡会对估算结果产生较大影响。未来的研究将重点解决鱼群密度较大时的鱼群遮挡问题,使该方法能适用于不同鱼类的网箱养殖数量估算。
-
表 1 高频水平机械扫描式声呐技术指标
Table 1 Technical specification of high-frequency horizontal mechanical scanning sonar
项目
Project技术指标
Technical
specifiacation工作频率 Operating frequency 667 kHz 作用量程 Range of action 3 m 波束开角 (垂直×水平)
Beam opening angle (Vertical×Horizontal)7.5°×2.6° 距离像素/精度 Distance pixel/Precision 5 cm 扫描区域 (极坐标)
Scanning area (Polar coordinates)360° 工作深度 Working depth 3 m 云台旋转频率 Pan tilt rotation frequency 2.5 s·周−1 水平角度分辨率 Horizontal angle resolution 0.9° 圆筒尺寸 Cylinder size Φ 57 mm×99 mm 表 2 烧蚀实验比较
Table 2 Comparison of ablation experiments
模型 Model Params/M FLOPs/G mAP@0.5 mAP@0.5:0.95 轮数Epoch YOLOv8s 11.1 28.6 86.0 43.8 300 YOLOv8s+Cot 12.0 31.6 86.7 45.2 300 YOLOv8s+Slim-Neck+Cot (本文算法 This paper's algorithm) 10.9 29.7 87.4 45.9 300 表 3 异种检测方法的实验比较
Table 3 Experimental comparison of different detection methods
模型 Model mAP@0.5 mAP@0.5:0.95 Params/M GFLOPs/G 轮数Epoch Faster RCNN 69.5% 34.1% 137.1 185.1 300 SDD 76.0% 38.4% 26.3 31.4 300 YOLOv5 84.9% 40.6% 7.0 15.9 300 本文算法 This paper's algorithm 87.4% 45.9% 10.9 29.7 300 表 4 聚类结果统计
Table 4 statistical results of clustering
水层
Water layer/
cm总坐标
点数/个
Total number
of coordinate
points/piece聚类簇数量
(包括噪声
点簇)/个
Number of
clusters
(Including noise
clusters)/
piece噪声点
数量/个
Number of
noise points/
piece本层鱼
数量/尾
Number of
fish in this
layer/tail0~40 507 6 0 6 25~65 1 129 9 1 9 50~90 1 800 12 0 12 75~115 3 085 10 1 10 100~140 6 288 29 0 29 125~165 15 536 22 1 22 150~190 23 004 19 0 19 175~215 15 193 17 2 18 200~240 10 646 19 0 19 225~265 7 681 17 0 17 250~290 3 311 11 0 11 总计Total 88 180 171 5 172 表 5 逐水层数量统计结果
Table 5 Statistical results of number of water layers by layer
编号
No.实际数量
Actual quantity水层 Water layer/cm 0~40 25~65 50~90 75~115 100~140 125~165 150~190 175~215 200~240 225~265 250~290 3 200 2 4 14 24 18 24 24 20 15 10 2 17 200 2 1 5 10 18 14 19 18 22 19 5 18 200 5 3 1 4 31 23 14 16 36 26 7 7 150 2 0 4 5 16 31 19 18 41 26 2 12 150 3 5 7 11 12 22 22 20 23 20 4 19 150 8 9 7 8 20 21 34 23 28 25 6 5 100 5 8 16 18 14 19 22 34 33 21 2 6 100 6 7 5 6 13 17 13 20 14 7 0 14 100 5 6 5 9 13 19 24 24 18 10 4 表 6 拟合数据统计结果
Table 6 Statistical results of fitting data
数据编号
Data No.DBscan
epsilon=20.0实际数量
Actual quantity神经网络拟合数量
Number of neural network fitting误差数量
Error quantity误差率
Error rate/%准确率
Accuracy/%3 20 200 204.61 4.61 2.30 97.70 17 20 200 189.86 10.14 5.07 94.93 18 20 200 186.37 13.63 6.82 93.18 7 20 150 146.94 3.06 2.04 97.96 12 20 150 177.78 27.78 18.52 81.48 19 20 150 100.00 50.00 33.33 66.67 5 20 100 142.08 42.08 42.08 57.92 6 20 100 99.86 0.14 0.14 99.86 14 20 100 105.47 5.47 5.47 94.53 均值 Mean 17.43 12.86 87.14 表 7 不同估算方法比较
Table 7 Comparison of different estimation methods
方法
Method设备使用
Equipment usage精度
Accuracy优点
Advantage缺点
DisadvantageMarkrecapture方法
Markrecapture method渔网、污渍 大离散区间 不需要任何电子设备 精度低,费时费力,影响鱼的生长 测鱼仪测量
Fish gauge measurement鱼类探测器 约50% 设备成本低 精度低,鱼密度大,有时误差巨大 鱼群密度划分法
Fish density division method成像声呐 90% 检测精度较高 具有偶然性,设备昂贵 图像像素等除法
Image pixel equal division前视声呐 97% 检测精度高 设备昂贵,实施过程复杂 本研究
This study高频水平机械扫描式声呐 约87% 精度高,自动测量,布局简单 测量时声呐的控制要求较高、
可变因素较多 -
[1] 刘伟峰, 张朝晖, 邢文秀, 等. 渔业生产方式创新视角下我国海洋牧场的概念应用与优化路径[J]. 生态经济, 2024, 40(8): 137-144. [2] 袁华荣, 陈丕茂. 广东省海洋牧场发展现状、问题与对策[J]. 广东农业科学, 2022, 49(7): 141-154. [3] 于盟盟, 任娟, 唐华强, 等. 日照市海洋牧场建设现状及思考[J]. 山西农经, 2022(12): 117-119. [4] 吕龙德, 熊莹. 深远海养殖风头劲我国造船业迎重大利好[J]. 广东造船, 2023, 42(3): 6-12. [5] 沈晨, 张培珍, 刘欢, 等. 基于VMD-Hilbert变换的大型网箱养殖鱼群声特性研究[J]. 吉林大学学报(信息科学版), 2023, 41(6): 1054-1062. [6] 刘世晶, 李国栋, 刘晃, 等. 中国水产养殖装备发展现状[J]. 水产学报, 2023, 47(11): 190-203. [7] 王静, 李蔚然, 刘业强, 等. 基于计算机视觉的养殖动物计数方法研究综述[J]. 农业机械学报, 2023, 54(S1): 315-329. [8] 施继军, 施佐帆, 傅荣兵. 舟山“岱衢族”大黄鱼深水网箱养殖技术[J]. 浙江农业科学, 2023, 64(8): 1987-1990. [9] 张涵钰, 李振波, 李蔚然, 等. 基于机器视觉的水产养殖计数研究综述[J]. 计算机应用, 2023, 43(9): 2970-2982. [10] 崔斌. 视觉识别技术在智慧实验室中的应用研究[J]. 信息与电脑(理论版), 2023, 35(8): 172-174. [11] 傅梁著. 基于视觉感知技术的鱼类行为辨别方法研究[D]. 大连: 大连理工大学, 2022: 15. [12] FENG S X, YANG X T, LIU Y, et al. Fish feeding intensity quantification using machine vision and a lightweight 3D ResNet-GloRe network[J]. Aquac Engin, 2022, 98: 102244. doi: 10.1016/j.aquaeng.2022.102244
[13] YANG L, CHEN Y Y, SHEN T, et al. A BlendMask-VoVNetV2 method for quantifying fish school feeding behavior in industrial aquaculture[J]. Comput Electron Agr, 2023, 211: 108005. doi: 10.1016/j.compag.2023.108005
[14] LAGARDE R, PEYRE J, AMILHAT E, et al. In situ evaluation of European eel counts and length estimates accuracy from an acoustic camera (ARIS)[J]. Knowl Manag Aquat Ec, 2020, 421: 44. doi: 10.1051/kmae/2020037
[15] 乐梓予. 基于声学技术有效保护近海渔业资源的探索与建议[J]. 中国水产, 2022(5): 58-60. [16] 彭战飞, 沈蔚, 张进. 基于成像声呐的鱼类长度测量误差与修正模型研究[J]. 南方水产科学, 2023, 19(4): 31-40. doi: 10.12131/20220279 [17] 周吉祥, 刘慧敏, 陆凯, 等. 深海ARV在海洋资源调查中的应用及展望[J]. 海洋地质前沿, 2024, 40(2): 93-102. [18] 朱俊, 封磊. 基于声呐图像的鱼群识别与计数方法[J]. 南京理工大学学报, 2023, 47(6): 782-789. [19] 刘慧杰, 王从峰, 刘德富, 等. 双频识别声呐在鱼类资源调查中的应用进展[J]. 三峡大学学报(自然科学版), 2015, 37(3): 7-11. [20] FENG Y H, WEI Y G, SUN S, et al. Fish abundance estimation from multi-beam sonar by improved MCNN[J]. Aquat Ecol, 2023, 57(4): 895-911. doi: 10.1007/s10452-023-10007-z
[21] 田玉先, 冯德军, 张华, 等. 通过小型探鱼无人船探测大型围网养殖区大黄鱼的分布特性[J]. 水产学报, 2022, 46(11): 2084-2096. [22] JING D X, ZHOU H Y, HAN J, et al. Fish abundance estimation based on an imaging sonar[J]. Appl Acoust, 2019, 38(4): 705-711.
[23] 沈蔚, 朱振宏, 张进, 等. 基于双频识别声呐的鱼类目标识别与计数[J]. 渔业现代化, 2020, 47(6): 81-87. doi: 10.3969/j.issn.1007-9580.2020.06.012 [24] 周权, 杜浩, 王洁, 等. 基于环境DNA的长江中华鲟分布特征探究[J]. 环境工程技术学报, 2024, 14(1): 71-78. [25] SUN Y, ZHANG Y H, WANG H Y, et al. SES-YOLOv8n: automatic driving object detection algorithm based on improved YOLOv8[J]. Signal Image Video P, 2024, 18(5): 3983-3992. doi: 10.1007/s11760-024-03003-9
[26] LI Y H, YAO T, PAN Y W, et al. Contextual transformer networks for visual recognition[J]. IEEE T-PAMI, 2023, 45(2): 1489-1500. doi: 10.1109/TPAMI.2022.3164083
[27] ZHAO L, WEI Z J, LI Y T, et al. SEDG-Yolov5: a lightweight traffic sign detection model based on knowledge distillation[J]. Electronics, 2023, 12(2): 305-305. doi: 10.3390/electronics12020305
[28] WU G Q, CAO L Q, TIAN H Y, et al. HY-DBSCAN: a hybrid parallel DBSCAN clustering algorithm scalable on distributed-memory computers[J]. J Parallel Distributed Comput, 2022, 168: 57-69. doi: 10.1016/j.jpdc.2022.06.005
[29] CHEN G, HUANG W X, RONCH A D, et al. BP neural Network-Kalman filter fusion method for unmanned aerial vehicle target tracking[J]. P I Mech Eng C-J Mec, 2023, 237(18): 4203-4212. doi: 10.1177/0954406220983864
[30] HAI T N, NGUYEN M N, PHUNG L D, et al. Anomalies detection in chest X-rays images using faster R-CNN and YOLO[J]. Vietnam J Comput Sci, 2023, 10(4): 499-515. doi: 10.1142/S2196888823500094
[31] CHOI W, CHA Y J. SDDNet: Real-time crack segmentation[J]. IEEE TIE, 2020, 67(9): 8016-8025.
[32] YU C, SHIN Y. SAR ship detection based on improved YOLOv5 and BiFPN[J]. ICT Express, 2024, 10(1): 28-33. doi: 10.1016/j.icte.2023.03.009
[33] DING F. Least squares parameter estimation and multi-innovation least squares methods for linear fitting problems from noisy data[J]. J Comput Appl Math, 2023, 426: 115107. doi: 10.1016/j.cam.2023.115107
[34] SELVARAJ P, KWON O M, LEE S H, et al. Disturbance rejections of polynomial fuzzy systems under equivalent-input-disturbance estimator approach[J]. Fuzzy Set Syst, 2024, 488: 109013. doi: 10.1016/j.fss.2024.109013
[35] 雍李明, 张语克, 赵丽媛, 等. 中华白海豚生态学研究进展[J]. 生物多样性, 2023, 31(5): 145-160. [36] 陈凯骅, 陈海洋, 李惠东, 等. 码头声波驱鱼技术的研究与应用[J]. 电力科技与环保, 2020, 36(3): 60-62. [37] 朱振宏. 基于成像声呐的鱼类资源评估关键技术研究[D]. 上海: 上海海洋大学, 2021: 46-52. [38] 荆丹翔, 周晗昀, 韩军, 等. 基于成像声呐DIDSON的水域内鱼群数量估计方法[J]. 应用声学, 2019, 38(4): 705-711. [39] 崔智强, 祝捍皓, 宋伟华, 等. 一种基于前视声呐的养殖网箱内鱼群数量评估方法[J]. 渔业现代化, 2023, 50(4): 107-117. doi: 10.3969/j.issn.1007-9580.2023.04.013