論文の概要: Deep Learning for Accurate Vision-based Catch Composition in Tropical Tuna Purse Seiners
- arxiv url: http://arxiv.org/abs/2511.15468v1
- Date: Wed, 19 Nov 2025 14:26:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.844853
- Title: Deep Learning for Accurate Vision-based Catch Composition in Tropical Tuna Purse Seiners
- Title(参考訳): 熱帯マグロ漁船における正確な視力に基づくキャッチ組成の深層学習
- Authors: Xabier Lekunberri, Ahmad Kamal, Izaro Goienetxea, Jon Ruiz, Iñaki Quincoces, Jaime Valls Miro, Ignacio Arganda-Carreras, Jose A. Fernandes-Salvador,
- Abstract要約: 電子監視システムで捉えた画像を用いて,マグロとイエローフィンマグロを識別する難易度を定量化する。
そこで本研究では,信頼度の高い接地トラスデータセットを用いて,捕食者の種組成を推定する多段階パイプラインを提案する。
検証の平均精度は0.66$pm$ 0.03、リコールは0.88$pm$ 0.03である。
- 参考スコア(独自算出の注目度): 1.9503589459693256
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Purse seiners play a crucial role in tuna fishing, as approximately 69% of the world's tropical tuna is caught using this gear. All tuna Regional Fisheries Management Organizations have established minimum standards to use electronic monitoring (EM) in fisheries in addition to traditional observers. The EM systems produce a massive amount of video data that human analysts must process. Integrating artificial intelligence (AI) into their workflow can decrease that workload and improve the accuracy of the reports. However, species identification still poses significant challenges for AI, as achieving balanced performance across all species requires appropriate training data. Here, we quantify the difficulty experts face to distinguish bigeye tuna (BET, Thunnus Obesus) from yellowfin tuna (YFT, Thunnus Albacares) using images captured by EM systems. We found inter-expert agreements of 42.9% $\pm$ 35.6% for BET and 57.1% $\pm$ 35.6% for YFT. We then present a multi-stage pipeline to estimate the species composition of the catches using a reliable ground-truth dataset based on identifications made by observers on board. Three segmentation approaches are compared: Mask R-CNN, a combination of DINOv2 with SAM2, and a integration of YOLOv9 with SAM2. We found that the latest performs the best, with a validation mean average precision of 0.66 $\pm$ 0.03 and a recall of 0.88 $\pm$ 0.03. Segmented individuals are tracked using ByteTrack. For classification, we evaluate a standard multiclass classification model and a hierarchical approach, finding a superior generalization by the hierarchical. All our models were cross-validated during training and tested on fishing operations with fully known catch composition. Combining YOLOv9-SAM2 with the hierarchical classification produced the best estimations, with 84.8% of the individuals being segmented and classified with a mean average error of 4.5%.
- Abstract(参考訳): 世界の熱帯マグロの約69%がこの装置で捕獲されているため、マグロ漁では清水が重要な役割を担っている。
全てのマグロ地域漁業管理機構は、伝統的な観察者に加えて、漁業で電子監視(EM)を使用するための最低限の基準を確立している。
EMシステムは、人間のアナリストが処理しなければならない膨大な量のビデオデータを生成する。
人工知能(AI)をワークフローに統合することで、ワークロードを削減し、レポートの正確性を向上させることができる。
しかし、すべての種間でバランスのとれたパフォーマンスを達成するには、適切なトレーニングデータが必要であるため、AIには依然として種を特定することが大きな課題である。
ここでは,イエローフィンマグロ (YFT, Thunnus Albacares) とイエローフィンマグロ (BET, Thunnus Obesus) を区別する難易度を,EMシステムで捉えた画像を用いて定量化する。
BETは42.9%$\pm$35.6%、YFTは57.1%$\pm$35.6%である。
そこで我々は, 観測者による識別に基づいて, 信頼度の高い接地トラスデータセットを用いて, 捕食者の種組成を推定する多段階パイプラインを提案する。
Mask R-CNN、DINOv2とSAM2の組み合わせ、YOLOv9とSAM2の統合である。
検証の平均精度は0.66$\pm$ 0.03、リコールは0.88$\pm$ 0.03である。
セグメンテーションされた個人はByteTrackを使って追跡される。
分類では,標準のマルチクラス分類モデルと階層的アプローチを評価し,階層的手法による優れた一般化を見出す。
これらのモデルはすべて,訓練中にクロスバリデーションを行い,漁獲量と漁獲量とを比較検討した。
YOLOv9-SAM2と階層分類を組み合わせることで、84.8%の個体が平均4.5%の誤差で区分けされ分類された。
関連論文リスト
- Multispectral airborne laser scanning for tree species classification: a benchmark of machine learning and deep learning algorithms [3.9167717582896793]
マルチスペクトル空中レーザースキャン(ALS)は、自動点クラウド処理とツリーセグメンテーションにおいて有望であることを示す。
本研究は,木種分類のための機械学習およびディープラーニング手法のベンチマークを行うことにより,これらのギャップに対処する。
論文 参考訳(メタデータ) (2025-04-19T16:03:49Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - DeepSeaNet: Improving Underwater Object Detection using EfficientDet [0.0]
このプロジェクトでは、注釈付き水中データセット上で様々な物体検出モデルを実装し、評価する。
このデータセットは、Limfjorden水中で捕獲された魚、カニ、ヒトデ、その他の水生動物の注釈画像からなる。
I compare the results of YOLOv3 (31.10% mean Average Precision (mAP)), YOLOv4 (83.72% mAP), YOLOv5 (97.6%), YOLOv8 (98.20%), EfficientDet (98.56% mAP) and Detectron2 (95.20% mAP) on the same dataset。
論文 参考訳(メタデータ) (2023-05-26T13:41:35Z) - Pruning by Active Attention Manipulation [49.61707925611295]
CNNのフィルタプルーニングは典型的には、CNNのフィルタ重みやアクティベーションマップに離散マスクを適用することで達成される。
ここでは、アクティブアテンション操作(PAAM)によるプルーニング(pruning)という新しいフィルタ強調表示概念を提案する。
PAAMはフィルタ重みからアナログフィルタスコアを学習し、そのスコアの加算項によって正規化されたコスト関数を最適化する。
論文 参考訳(メタデータ) (2022-10-20T09:17:02Z) - Towards Semi-Supervised Deep Facial Expression Recognition with An
Adaptive Confidence Margin [92.76372026435858]
Ada-CM(Adaptive Confidence Margin)を学習し、ラベルのないすべてのデータを半教師付き深層表情認識に活用する。
すべてのラベルなしサンプルは、信頼スコアと適応的に学習された信頼マージンを比較して、2つのサブセットに分割される。
提案手法は最先端の性能,特に半教師付きベースラインを超越した性能を実現する。
論文 参考訳(メタデータ) (2022-03-23T11:43:29Z) - Robust Segmentation Models using an Uncertainty Slice Sampling Based
Annotation Workflow [5.051373749267151]
本稿では,3次元医療ボリュームのセマンティックセグメンテーションのための不確実スライスサンプリング(USS)戦略を提案する。
多地点データを用いた肝セグメンテーション作業におけるUSSの有効性を示す。
論文 参考訳(メタデータ) (2021-09-30T06:56:11Z) - NemaNet: A convolutional neural network model for identification of
nematodes soybean crop in brazil [0.43968605222413054]
植物寄生線虫(または植物性線虫)は作物に深刻な損傷をもたらし、世界中で大規模な経済的損失を引き起こしています。
本研究は,5種の線虫から得られた3,063枚の顕微鏡画像を含むnemadatasetと呼ばれる新しい公共データセットを提案する。
論文 参考訳(メタデータ) (2021-03-05T14:47:00Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。