論文の概要: A Framework for Multi-View Multiple Object Tracking using Single-View Multi-Object Trackers on Fish Data
- arxiv url: http://arxiv.org/abs/2505.17201v1
- Date: Thu, 22 May 2025 18:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.64429
- Title: A Framework for Multi-View Multiple Object Tracking using Single-View Multi-Object Trackers on Fish Data
- Title(参考訳): 魚データを用いたシングルビュー多目的トラッカーを用いた多視点多目的追跡のためのフレームワーク
- Authors: Chaim Chai Elchik, Fatemeh Karimi Nejadasl, Seyed Sahand Mohammadi Ziabari, Ali Mohammed Mansoor Alsahag,
- Abstract要約: この論文は、生態学研究における水中魚の検出と追跡に最先端のシングルビューMOTモデルであるFairMOTとYOLOv8を適用している。
提案フレームワークは,魚の個体を相対的精度47%で検出し,立体マッチング技術を用いて新しい3D出力を生成する。
- 参考スコア(独自算出の注目度): 0.559239450391449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-object tracking (MOT) in computer vision has made significant advancements, yet tracking small fish in underwater environments presents unique challenges due to complex 3D motions and data noise. Traditional single-view MOT models often fall short in these settings. This thesis addresses these challenges by adapting state-of-the-art single-view MOT models, FairMOT and YOLOv8, for underwater fish detecting and tracking in ecological studies. The core contribution of this research is the development of a multi-view framework that utilizes stereo video inputs to enhance tracking accuracy and fish behavior pattern recognition. By integrating and evaluating these models on underwater fish video datasets, the study aims to demonstrate significant improvements in precision and reliability compared to single-view approaches. The proposed framework detects fish entities with a relative accuracy of 47% and employs stereo-matching techniques to produce a novel 3D output, providing a more comprehensive understanding of fish movements and interactions
- Abstract(参考訳): コンピュータビジョンにおけるマルチオブジェクトトラッキング(MOT)は、大きな進歩を遂げているが、水中環境における小型魚の追跡は、複雑な3Dモーションとデータノイズによる固有の課題を呈している。
従来のシングルビューMOTモデルは、これらの設定でしばしば不足する。
この論文は、生態学研究における水中魚の検出と追跡に最先端のシングルビューMOTモデルであるFairMOTとYOLOv8を適用することで、これらの課題に対処する。
本研究の核となる貢献は,ステレオビデオ入力による追跡精度の向上と魚の行動パターン認識のための多視点フレームワークの開発である。
本研究は,これらのモデルを水中魚のビデオデータセットに組み込んで評価することにより,シングルビュー手法と比較して精度と信頼性を著しく向上することを目的としている。
提案フレームワークは,魚の個体を相対精度47%で検出し,立体マッチング技術を用いて新しい3D出力を生成し,魚の動きと相互作用をより包括的に理解する。
関連論文リスト
- MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion [118.74385965694694]
我々は動的シーンから時間ステップごとの幾何を直接推定する新しい幾何学的アプローチであるMotion DUSt3R(MonST3R)を提案する。
各タイムステップのポイントマップを単純に推定することで、静的シーンにのみ使用されるDUST3Rの表現を動的シーンに効果的に適応させることができる。
我々は、問題を微調整タスクとしてポーズし、いくつかの適切なデータセットを特定し、この制限されたデータ上でモデルを戦略的に訓練することで、驚くほどモデルを動的に扱えることを示す。
論文 参考訳(メタデータ) (2024-10-04T18:00:07Z) - FMRFT: Fusion Mamba and DETR for Query Time Sequence Intersection Fish Tracking [3.599033310931609]
本稿では,複雑なマルチシナリオ・スタージョン追跡データセットを確立する。
リアルタイムの魚追跡ソリューションであるFMRFTモデルを導入している。
このモデルは、ビデオメモリ消費の少ないMamba In Mambaアーキテクチャを取り入れている。
論文 参考訳(メタデータ) (2024-09-02T10:33:45Z) - FishMOT: A Simple and Effective Method for Fish Tracking Based on IoU
Matching [11.39414015803651]
FishMOTは、オブジェクト検出とObjectoUマッチングを組み合わせた、新しい魚追跡手法である。
本手法は, 各種環境および魚の数に対して, 優れた堅牢性と汎用性を示す。
論文 参考訳(メタデータ) (2023-09-06T13:16:41Z) - SimDistill: Simulated Multi-modal Distillation for BEV 3D Object
Detection [56.24700754048067]
多視点カメラによる3Dオブジェクト検出は低コストで普及しているが、カメラデータのみから正確に3D形状を推定することは依然として困難である。
モデルアーキテクチャと蒸留戦略を慎重に構築し,シミュレートされたマルチモーダル蒸留(SimDistill)法を提案する。
我々のSimDistillは、コスト効率のよいカメラのみの配置を維持しながら、3Dオブジェクト検出のためのより良い特徴表現を学習することができる。
論文 参考訳(メタデータ) (2023-03-29T16:08:59Z) - Towards Multimodal Multitask Scene Understanding Models for Indoor
Mobile Agents [49.904531485843464]
本稿では,現実世界の屋内環境におけるラベル付きデータの不十分,あるいは不可能,といった主な課題について論じる。
MMISM (Multi-modality input Multi-task output Indoor Scene Understanding Model) について述べる。
MMISMは、RGB画像だけでなく、スパースライダーポイントを入力と3Dオブジェクト検出、深さ完了、人間のポーズ推定、セマンティックセグメンテーションを出力タスクとみなしている。
MMISMはシングルタスクモデルよりも同等かそれ以上の性能を示す。
論文 参考訳(メタデータ) (2022-09-27T04:49:19Z) - SGM3D: Stereo Guided Monocular 3D Object Detection [62.11858392862551]
SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。
ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。
本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
論文 参考訳(メタデータ) (2021-12-03T13:57:14Z) - Movement Tracks for the Automatic Detection of Fish Behavior in Videos [63.85815474157357]
水中ビデオでサブルフィッシュ(Anoplopoma fimbria)の発芽行動のデータセットを提供し,その上での深層学習(DL)法による行動検出について検討した。
提案する検出システムは,Long Short-Term Memory(LSTM)ネットワークを用いて,サブルフィッシュの起動動作を識別する。
論文 参考訳(メタデータ) (2020-11-28T05:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。