論文の概要: Context-Aware Outlier Rejection for Robust Multi-View 3D Tracking of Similar Small Birds in An Outdoor Aviary
- arxiv url: http://arxiv.org/abs/2412.16511v1
- Date: Sat, 21 Dec 2024 07:20:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:58:44.796033
- Title: Context-Aware Outlier Rejection for Robust Multi-View 3D Tracking of Similar Small Birds in An Outdoor Aviary
- Title(参考訳): 室内環境における類似小鳥のロバストなマルチビュー3次元追跡のための文脈認識型外乱除去
- Authors: Keon Moradi, Ethan Haque, Jasmeen Kaur, Alexandra B. Bentz, Eli S. Bridge, Golnaz Habibi,
- Abstract要約: 本稿では,マルチカメラシステムを用いた屋外飛行場における複数の鳥のロバストな3次元追跡手法を提案する。
特徴マッチングと3次元再構成に環境ランドマークを活用することで,視覚的に類似した鳥とその迅速な動きの課題に対処する。
また、4つの囲いに居住する80羽の鳥の大規模な注釈付きデータセットを20時間の映像で提供し、コンピュータビジョン、鳥類学者、生態学者に豊富なテストベッドを提供しています。
- 参考スコア(独自算出の注目度): 39.35431651202991
- License:
- Abstract: This paper presents a novel approach for robust 3D tracking of multiple birds in an outdoor aviary using a multi-camera system. Our method addresses the challenges of visually similar birds and their rapid movements by leveraging environmental landmarks for enhanced feature matching and 3D reconstruction. In our approach, outliers are rejected based on their nearest landmark. This enables precise 3D-modeling and simultaneous tracking of multiple birds. By utilizing environmental context, our approach significantly improves the differentiation between visually similar birds, a key obstacle in existing tracking systems. Experimental results demonstrate the effectiveness of our method, showing a $20\%$ elimination of outliers in the 3D reconstruction process, with a $97\%$ accuracy in matching. This remarkable accuracy in 3D modeling translates to robust and reliable tracking of multiple birds, even in challenging outdoor conditions. Our work not only advances the field of computer vision but also provides a valuable tool for studying bird behavior and movement patterns in natural settings. We also provide a large annotated dataset of 80 birds residing in four enclosures for 20 hours of footage which provides a rich testbed for researchers in computer vision, ornithologists, and ecologists. Code and the link to the dataset is available at https://github.com/airou-lab/3D_Multi_Bird_Tracking
- Abstract(参考訳): 本稿では,マルチカメラシステムを用いた屋外飛行場における複数の鳥のロバストな3次元追跡手法を提案する。
特徴マッチングと3次元再構成に環境ランドマークを活用することで,視覚的に類似した鳥とその迅速な動きの課題に対処する。
このアプローチでは、最も近いランドマークに基づいて、外れ値が拒否される。
これにより、複数の鳥の正確な3Dモデリングと同時追跡が可能になる。
環境条件を利用することで,既存の追跡システムにおける重要な障害である視覚的に類似した鳥の分化を著しく改善する。
提案手法の有効性を実験的に示し, 3次元再構成プロセスにおけるアウトリーチの除去に$20\%, マッチング精度$97\%を示した。
3Dモデリングにおけるこの顕著な精度は、挑戦的な屋外条件であっても、複数の鳥の堅牢で信頼性の高い追跡に変換される。
我々の研究はコンピュータビジョンの分野を前進させるだけでなく、自然環境下で鳥の行動や運動パターンを研究するための貴重なツールも提供します。
また、4つの囲いに居住する80羽の鳥の大規模な注釈付きデータセットを20時間の映像で提供し、コンピュータビジョン、鳥類学者、生態学者に豊富なテストベッドを提供しています。
コードとデータセットへのリンクはhttps://github.com/airou-lab/3D_Multi_Bird_Trackingで確認できる。
関連論文リスト
- Temporally-consistent 3D Reconstruction of Birds [5.787285686300833]
本研究では,特定の種類の海鳥の単眼映像から3Dのポーズと形状を復元する手法を提案する。
我々は,9羽の鳥を同時に捕獲した映像を1万フレームのリアルタイムデータセットとして提供した。
論文 参考訳(メタデータ) (2024-08-24T17:12:36Z) - RoScenes: A Large-scale Multi-view 3D Dataset for Roadside Perception [98.76525636842177]
RoScenesは、最大規模のマルチビューロードサイド認識データセットである。
私たちのデータセットは、驚くべき21.13Mの3Dアノテーションを64,000$m2$で達成しています。
論文 参考訳(メタデータ) (2024-05-16T08:06:52Z) - A Flying Bird Object Detection Method for Surveillance Video [9.597393200515377]
本稿では,FBOD-SV(Flying Bird Object Detection for Surveillance Video)を提案する。
FBOD-SVは、トラクション・サブステーション監視ビデオにおいて、飛行する鳥の物体の実験的データセットを用いて検証されている。
実験結果から,FBOD-SVは監視ビデオにおいて飛来する鳥の物体の検出性能を効果的に向上することが示された。
論文 参考訳(メタデータ) (2024-01-08T09:20:46Z) - 3D-MuPPET: 3D Multi-Pigeon Pose Estimation and Tracking [14.52333427647304]
複数のカメラビューを用いて対話的な速度で最大10羽のハトの3Dポーズを推定・追跡するフレームワークである3D-MuPPETを提案する。
まず第1フレームのグローバルIDに2D検出を動的にマッチングし、次に2Dトラッカーを使用して、その後のフレームにおけるビュー間のIDを維持する。
また、3D-MuPPETは自然環境からのアノテーションを伴わずに屋外でも機能することを示した。
論文 参考訳(メタデータ) (2023-08-29T14:02:27Z) - Multi-view Tracking, Re-ID, and Social Network Analysis of a Flock of
Visually Similar Birds in an Outdoor Aviary [32.19504891200443]
曲鳥群が3次元空間を移動する際にの行動動態を研究するシステムについて紹介する。
密接な相互作用する動物群を3次元で追跡する際に生じる複雑さについて検討し、マルチビュートラッカーを評価するための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-12-01T04:23:18Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - AcinoSet: A 3D Pose Estimation Dataset and Baseline Models for Cheetahs
in the Wild [51.35013619649463]
我々はAcinoSetと呼ばれる野生のフリーランニングチーターの広範なデータセットを提示する。
データセットには、119,490フレームのマルチビュー同期高速ビデオ映像、カメラキャリブレーションファイル、7,588フレームが含まれている。
また、結果の3D軌道、人間チェックされた3D地上真実、およびデータを検査するインタラクティブツールも提供される。
論文 参考訳(メタデータ) (2021-03-24T15:54:11Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - Fast and Furious: Real Time End-to-End 3D Detection, Tracking and Motion
Forecasting with a Single Convolutional Net [93.51773847125014]
本研究では,3Dセンサが捉えたデータを用いて,3D検出,追跡,動作予測を共同で推論する,新たなディープニューラルネットワークを提案する。
鳥の眼球を3次元の世界として表現し,空間と時間にまたがる3次元畳み込みを行う。
論文 参考訳(メタデータ) (2020-12-22T22:43:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。