論文の概要: FMRFT: Fusion Mamba and DETR for Query Time Sequence Intersection Fish Tracking
- arxiv url: http://arxiv.org/abs/2409.01148v1
- Date: Mon, 2 Sep 2024 10:33:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 07:13:03.210032
- Title: FMRFT: Fusion Mamba and DETR for Query Time Sequence Intersection Fish Tracking
- Title(参考訳): FMRFT:Fusion Mamba and DETR for Query Time Sequence Intersection Fish Tracking
- Authors: Mingyuan Yao, Yukang Huo, Qingbin Tian, Jiayin Zhao, Xiao Liu, Ruifeng Wang, Haihua Wang,
- Abstract要約: 本稿では,複雑なマルチシーンの魚類追跡データセットを構築し,リアルタイム魚追跡モデルであるFMRFTを提案する。
このモデルでは、追跡アルゴリズムに低メモリ消費のMamba In Mamba (MIM)アーキテクチャを導入している。
このモデルは、隠蔽された物体と冗長な追跡フレームを効果的に処理し、より正確で安定した魚追跡を実現する。
- 参考スコア(独自算出の注目度): 3.7540444175896703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Growth, abnormal behavior, and diseases of fish can be early detected by monitoring fish tracking through the method of image processing, which is of great significance for factory aquaculture. However, underwater reflections and some reasons with fish, such as the high similarity , rapid swimming caused by stimuli and multi-object occlusion bring challenges to multi-target tracking of fish. To address these challenges, this paper establishes a complex multi-scene sturgeon tracking dataset and proposes a real-time end-to-end fish tracking model, FMRFT. In this model, the Mamba In Mamba (MIM) architecture with low memory consumption is introduced into the tracking algorithm to realize multi-frame video timing memory and fast feature extraction, which improves the efficiency of correlation analysis for contiguous frames in multi-fish video. Additionally, the superior feature interaction and a priori frame processing capabilities of RT-DETR are leveraged to provide an effective tracking algorithm. By incorporating the QTSI query interaction processing module, the model effectively handles occluded objects and redundant tracking frames, resulting in more accurate and stable fish tracking. Trained and tested on the dataset, the model achieves an IDF1 score of 90.3% and a MOTA accuracy of 94.3%. Experimental results demonstrate that the proposed FMRFT model effectively addresses the challenges of high similarity and mutual occlusion in fish populations, enabling accurate tracking in factory farming environments.
- Abstract(参考訳): 魚の成長, 異常行動, および魚の病気は, 画像処理による魚の追跡によって早期に検出できる。
しかし、水中での反射や、高い類似性、刺激による急激な水泳、多目的閉塞などのいくつかの理由により、魚の多目的追跡に困難が生じる。
これらの課題に対処するため,本稿では,複雑なマルチシーン・スタージョン追跡データセットを構築し,リアルタイム魚追跡モデルであるFMRFTを提案する。
このモデルでは,マルチフレーム映像のタイミング記憶と高速特徴抽出を実現するために,低メモリ消費のMamba In Mamba (MIM) アーキテクチャを導入し,マルチフィッシュ映像における連続フレームの相関解析の効率を向上させる。
さらに、RT-DETRの優れた特徴相互作用と事前フレーム処理機能を活用し、効率的な追跡アルゴリズムを提供する。
QTSIクエリインタラクション処理モジュールを組み込むことで、モデルは隠蔽されたオブジェクトと冗長なトラッキングフレームを効果的に処理し、より正確で安定した魚追跡を実現する。
データセット上でトレーニングおよびテストが行われ、IDF1スコアは90.3%、MOTA精度は94.3%である。
実験結果から,FMRFTモデルでは魚の群集における相似性と相互排除の課題に効果的に対処でき,工場の農業環境における正確な追跡が可能であることが示唆された。
関連論文リスト
- A method for detecting dead fish on large water surfaces based on improved YOLOv10 [0.6874745415692134]
死んだ魚は水質の悪化、生態系の損傷、病気の伝染などの重大な問題を引き起こす可能性がある。
本稿では,拡張YOLOv10フレームワーク上に構築したエンドツーエンド検出モデルを提案する。
論文 参考訳(メタデータ) (2024-08-31T08:43:37Z) - MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - FishMOT: A Simple and Effective Method for Fish Tracking Based on IoU
Matching [11.39414015803651]
FishMOTは、オブジェクト検出とObjectoUマッチングを組み合わせた、新しい魚追跡手法である。
本手法は, 各種環境および魚の数に対して, 優れた堅牢性と汎用性を示す。
論文 参考訳(メタデータ) (2023-09-06T13:16:41Z) - Scaling Relationship on Learning Mathematical Reasoning with Large
Language Models [75.29595679428105]
本研究では,事前学習損失,教師付きデータ量,拡張データ量が教師付きLDMの推論性能に与える影響について検討する。
複数のモデルからの拒絶サンプルは、LLaMA-7BをGSM8Kの49.3%の精度に押し上げ、監督された微調整(SFT)の精度を35.9%上回る結果となった。
論文 参考訳(メタデータ) (2023-08-03T15:34:01Z) - DeepSeaNet: Improving Underwater Object Detection using EfficientDet [0.0]
このプロジェクトでは、注釈付き水中データセット上で様々な物体検出モデルを実装し、評価する。
このデータセットは、Limfjorden水中で捕獲された魚、カニ、ヒトデ、その他の水生動物の注釈画像からなる。
I compare the results of YOLOv3 (31.10% mean Average Precision (mAP)), YOLOv4 (83.72% mAP), YOLOv5 (97.6%), YOLOv8 (98.20%), EfficientDet (98.56% mAP) and Detectron2 (95.20% mAP) on the same dataset。
論文 参考訳(メタデータ) (2023-05-26T13:41:35Z) - Multi-Object Tracking by Iteratively Associating Detections with Uniform
Appearance for Trawl-Based Fishing Bycatch Monitoring [22.228127377617028]
漁業活動における漁獲監視の目的は、映像から魚の標的をリアルタイムで検出し、追跡し、分類することである。
本稿では,既存の観測中心追跡アルゴリズムに基づく新しいMOT手法を提案する。
本手法は,海洋魚種群およびMOT17種群において,一様外観の追跡目標の性能向上と最先端技術の向上を図っている。
論文 参考訳(メタデータ) (2023-04-10T18:55:10Z) - Automatic Controlling Fish Feeding Machine using Feature Extraction of
Nutriment and Ripple Behavior [0.0]
栄養素数とリップル行動の推定を組み合わせたコンピュータビジョンに基づく自動魚介類供給機を提案する。
栄養素の数とリップル行動に基づいて, 実環境において常に良好に機能する魚の給餌機械を制御できる。
論文 参考訳(メタデータ) (2022-08-15T05:52:37Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。