論文の概要: Audio-Visual Class-Incremental Learning for Fish Feeding intensity Assessment in Aquaculture
- arxiv url: http://arxiv.org/abs/2504.15171v1
- Date: Mon, 21 Apr 2025 15:24:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 14:49:07.661186
- Title: Audio-Visual Class-Incremental Learning for Fish Feeding intensity Assessment in Aquaculture
- Title(参考訳): 養殖場における魚の摂餌強度評価のための聴覚的クラスインクリメンタル学習
- Authors: Meng Cui, Xianghu Yue, Xinyuan Qian, Jinzheng Zhao, Haohe Liu, Xubo Liu, Daoliang Li, Wenwu Wang,
- Abstract要約: 魚の摂食強度評価(FFIA)は産業用養殖管理において重要である。
最近のマルチモーダルアプローチは、FFIAの堅牢性と効率性を改善することを約束している。
AV-CIL-FFIAは,水養環境下で6種の魚の摂餌強度を計測する81,932個のラベル付き視覚クリップからなる新しいデータセットである。
そして、FFIAのための音声視覚クラスインクリメンタルラーニング(CIL)の先駆者となり、AV-CIL-FFIAのベンチマークにより、単一モダリティ法を著しく上回ることを示す。
- 参考スコア(独自算出の注目度): 29.42598968673262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fish Feeding Intensity Assessment (FFIA) is crucial in industrial aquaculture management. Recent multi-modal approaches have shown promise in improving FFIA robustness and efficiency. However, these methods face significant challenges when adapting to new fish species or environments due to catastrophic forgetting and the lack of suitable datasets. To address these limitations, we first introduce AV-CIL-FFIA, a new dataset comprising 81,932 labelled audio-visual clips capturing feeding intensities across six different fish species in real aquaculture environments. Then, we pioneer audio-visual class incremental learning (CIL) for FFIA and demonstrate through benchmarking on AV-CIL-FFIA that it significantly outperforms single-modality methods. Existing CIL methods rely heavily on historical data. Exemplar-based approaches store raw samples, creating storage challenges, while exemplar-free methods avoid data storage but struggle to distinguish subtle feeding intensity variations across different fish species. To overcome these limitations, we introduce HAIL-FFIA, a novel audio-visual class-incremental learning framework that bridges this gap with a prototype-based approach that achieves exemplar-free efficiency while preserving essential knowledge through compact feature representations. Specifically, HAIL-FFIA employs hierarchical representation learning with a dual-path knowledge preservation mechanism that separates general intensity knowledge from fish-specific characteristics. Additionally, it features a dynamic modality balancing system that adaptively adjusts the importance of audio versus visual information based on feeding behaviour stages. Experimental results show that HAIL-FFIA is superior to SOTA methods on AV-CIL-FFIA, achieving higher accuracy with lower storage needs while effectively mitigating catastrophic forgetting in incremental fish species learning.
- Abstract(参考訳): 魚の摂食強度評価(FFIA)は産業用養殖管理において重要である。
最近のマルチモーダルアプローチは、FFIAの堅牢性と効率性を改善することを約束している。
しかし、これらの手法は、破滅的な忘れ物と適切なデータセットの欠如により、新しい魚種や環境に適応する上で重大な課題に直面している。
AV-CIL-FFIAは、実水養殖環境下で6種の魚種に対して摂餌強度を計測する81,932個のラベル付き音声視覚クリップからなる新しいデータセットである。
そして、FFIAのための音声視覚クラスインクリメンタルラーニング(CIL)の先駆者となり、AV-CIL-FFIAのベンチマークにより、単一モダリティ法を著しく上回ることを示す。
既存のCILメソッドは、歴史的データに大きく依存している。
Exemplar-based approach(英語版)は生のサンプルを保存し、貯蔵の課題を生み出し、exemplar-free method(英語版)はデータ保存を避けるが、異なる魚種間で微妙な摂餌強度の変化を区別するのに苦労する。
このような制約を克服するため,HAIL-FFIAは,コンパクトな特徴表現を通じて本質的な知識を保ちながら,模範的な非効率性を実現するプロトタイプベースのアプローチによって,このギャップを埋める新しいオーディオ視覚クラスインクリメンタルラーニングフレームワークである。
特に、HAIL-FFIAは、魚特有の特徴から一般的な強度知識を分離する二重パス知識保存機構を用いた階層的表現学習を採用している。
さらに,摂食行動の段階に基づいて,音声と視覚情報の重要性を適応的に調整する動的モダリティバランスシステムも備えている。
実験結果から,HAIL-FFIAはAV-CIL-FFIAのSOTA法よりも優れており,魚種学習における破滅的忘れを効果的に軽減しつつ,保存ニーズを低く抑えることができることがわかった。
関連論文リスト
- FisherMask: Enhancing Neural Network Labeling Efficiency in Image Classification Using Fisher Information [2.762397703396293]
FisherMaskはFisher情報に基づくアクティブラーニング(AL)アプローチで、主要なネットワークパラメータをマスキングすることで識別する。
実験の結果,FisherMaskは多様なデータセット上で最先端の手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-08T18:10:46Z) - EXACFS -- A CIL Method to mitigate Catastrophic Forgetting [3.2562590728737058]
本稿では,クラスインクリメンタルな学習環境においてこの問題を軽減するために,Exponentially Averaged Class-wise Feature Significance (EXACFS)を提案する。
CIFAR-100とImageNet-100の実験は、可塑性を取得しながら安定性を維持するEXACFSの優れた性能を示した。
論文 参考訳(メタデータ) (2024-10-31T09:11:56Z) - Learning from Neighbors: Category Extrapolation for Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.09687562334682]
Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文 参考訳(メタデータ) (2024-10-02T07:14:26Z) - Enabling Quartile-based Estimated-Mean Gradient Aggregation As Baseline
for Federated Image Classifications [5.5099914877576985]
Federated Learning(FL)は、機密データを保護し、モデルパフォーマンスを改善しながら、分散コラボレーションを可能にすることによって、ディープニューラルネットワークのトレーニング方法に革命をもたらした。
本稿では,これらの課題に対処するだけでなく,FLシステムにおける高度な集約技術に対して$mathsfbaseline$として基本的な参照ポイントを提供する,Estimated Mean Aggregation (EMA) という革新的なソリューションを紹介する。
論文 参考訳(メタデータ) (2023-09-21T17:17:28Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Disentangled Representation Learning for RF Fingerprint Extraction under
Unknown Channel Statistics [77.13542705329328]
本稿では,まず,不整合表現学習(DRL)の枠組みを提案し,入力信号を逆学習によりデバイス関連成分とデバイス関連成分に分解する。
提案フレームワークにおける暗黙的なデータ拡張は、デバイス非関連チャネル統計の過度な適合を避けるために、RFF抽出器に正規化を課す。
実験により、DR-RFFと呼ばれる提案手法は、未知の複雑な伝播環境に対する一般化可能性の観点から従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-04T15:46:48Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Impact of Channel Variation on One-Class Learning for Spoof Detection [5.549602650463701]
スポット検出はASVシステムの信頼性を高めるが、チャネルの変動により著しく低下する。
MCTに最適なデータ供給戦略は何か?スプーフ検出では分かっていない。
本研究は、データ供給とミニバッチの低重要度プロセスが、より良いパフォーマンスのために改善する必要性の認識を高めることの関連性を強調した。
論文 参考訳(メタデータ) (2021-09-30T07:56:16Z) - A deep neural network for multi-species fish detection using multiple
acoustic cameras [0.0]
本稿では,CNN (Convolutional Neural Network) と従来のCV (Computer Vision) 技術の両方を活用する新しい手法を提案する。
パイプラインは、音像を前処理して2つの特徴を抽出し、信号をローカライズし、検出性能を向上させる。
YOLOv3ベースのモデルは、2つの一般的な音響カメラで記録された複数の種の魚のデータを用いて訓練された。
論文 参考訳(メタデータ) (2021-09-22T11:47:24Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。