論文の概要: Fully Distributed Multi-View 3D Tracking in Real-Time
- arxiv url: http://arxiv.org/abs/2606.13127v2
- Date: Fri, 12 Jun 2026 20:00:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 13:45:31.20304
- Title: Fully Distributed Multi-View 3D Tracking in Real-Time
- Title(参考訳): リアルタイムの完全分散マルチビュー3次元トラッキング
- Authors: Byron Hernandez, Fangyu Li, Aotian Wu, Paul J. Shin, Kaustubh Purandare, Henry Medeiros,
- Abstract要約: 本稿では,リアルタイム多視点3Dトラッキングのための完全分散フレームワークMV3DTを提案する。
各カメラノードは、モノクロ3次元認識、分散多視点アソシエーション、協調融合からなる軽量なモジュールパイプラインを実行する。
MV3DTは、カメラのキャリブレーションをゼロショットで設定し、シーン固有の学習を必要とせず、新しい環境で直接デプロイできる。
- 参考スコア(独自算出の注目度): 5.7805207139640915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-camera tracking with overlapping fields of view typically relies on centralized fusion, which creates computational bottlenecks that prevent deployment at scale. We present MV3DT, a fully distributed framework for real-time multi-view 3D tracking that achieves accurate identity propagation and occlusion recovery through peer-to-peer coordination, eliminating the need for central aggregation. Each camera node executes a lightweight modular pipeline comprising monocular 3D perception, distributed multi-view association, and collaborative fusion via lightweight messaging. MV3DT achieves 96.5% IDF1, 93.1% MOTA, and 94.6% MOTP on WILDTRACK, competitive with state-of-the-art centralized methods, and unprecedented 41.7% IDF1 and 50.9% MOTA on SCOUT while demonstrating superior scalability: sustaining 30 FPS on 100 cameras with <10ms inter-camera latency and only 2.2% communication overhead. MV3DT operates in a zero-shot regime given camera calibrations, requiring no scene-specific learning and making it directly deployable in new environments. These results establish MV3DT as a practical solution for real-time multi-view tracking in large-scale overlapping camera networks.
- Abstract(参考訳): 重なり合う視野を持つマルチカメラトラッキングは、通常、集中的な融合に依存し、スケールでのデプロイメントを阻止する計算ボトルネックを生成する。
我々は、ピアツーピア調整による正確なアイデンティティの伝播と閉塞回復を実現し、集中集約の必要性を排除した、リアルタイム多視点3Dトラッキングのための完全に分散されたフレームワークMV3DTを提案する。
各カメラノードは、モノラルな3D認識、分散マルチビューアソシエーション、軽量メッセージングによる協調融合を含む軽量なモジュールパイプラインを実行する。
MV3DTは96.5%のIDF1、93.1%のMOTA、94.6%のMOTPをWILDTRACKで達成し、最先端の集中型手法と競合し、前例のない41.7%のIDF1と50.9%のMOTAをSCOUTで達成した。
MV3DTは、カメラのキャリブレーションをゼロショットで設定し、シーン固有の学習を必要とせず、新しい環境で直接デプロイできる。
これらの結果から,MV3DTは大規模重複カメラネットワークにおけるリアルタイムマルチビュートラッキングの実用的なソリューションとして確立された。
関連論文リスト
- Mon3tr: Monocular 3D Telepresence with Pre-built Gaussian Avatars as Amortization [16.68162021163563]
Mon3trは、3Dガウススプラッティング(3DGS)に基づくパラメトリック人間モデリングを統合する新しいモノクル3Dテレプレゼンスフレームワークである。
単眼のRGBカメラは、身体の動きや表情をリアルタイムで捉え、3DGSベースのパラメトリック人間モデルを駆動するために使用される。
提案手法は,新しいポーズに対するPSNR > 28 dB,80msのエンドツーエンドレイテンシ,1000倍の帯域幅削減を実現する。
論文 参考訳(メタデータ) (2026-01-12T13:17:41Z) - Sparse BEV Fusion with Self-View Consistency for Multi-View Detection and Tracking [15.680801582969393]
SCFusionは、マルチビュー機能統合を改善するための3つのテクニックを組み合わせたフレームワークである。
SCFusionは最先端のパフォーマンスを達成し、WildTrackで95.9%、MultiviewXで89.2%を記録した。
論文 参考訳(メタデータ) (2025-09-10T09:06:41Z) - Multi-View 3D Point Tracking [67.21282192436031]
本稿では,複数のカメラビューを用いた動的シーンにおける任意の点の追跡を目的とした,データ駆動型マルチビュー3Dポイントトラッカーについて紹介する。
本モデルでは,現実的な数のカメラを用いて直接3次元対応を推定する。
我々は5K合成多視点Kubricシーケンスをトレーニングし、2つの実世界のベンチマークで評価する。
論文 参考訳(メタデータ) (2025-08-28T17:58:20Z) - SpatialTrackerV2: 3D Point Tracking Made Easy [73.0350898700048]
SpaceTrackerV2はモノクロビデオのフィードフォワード3Dポイントトラッキング手法である。
これは、世界空間の3Dモーションをシーン幾何学、カメラエゴモーション、ピクセルワイドオブジェクトモーションに分解する。
このような異種データから幾何学と運動を共同で学習することで、SpatialTrackerV2は既存の3Dトラッキング方法よりも30%優れています。
論文 参考訳(メタデータ) (2025-07-16T17:59:03Z) - MCBLT: Multi-Camera Multi-Object 3D Tracking in Long Videos [39.75692195719607]
MCBLTという3次元物体検出・追跡フレームワークを提案する。
既存の方法とは異なり、MCBLTは様々なシーンにまたがって印象的な一般化性を持ち、カメラの設定も様々である。
提案した MCBLT は AICity'24 データセットに 81.22$ HOTA で,WildTrack データセットに 95.6$ IDF1 で新たな最先端技術を確立する。
論文 参考訳(メタデータ) (2024-12-01T06:18:06Z) - Learning Online Policies for Person Tracking in Multi-View Environments [4.62316736194615]
MVSparseは、複数の同期カメラにまたがる協調的多人数追跡のための新しいフレームワークである。
MVSparseシステムは、エッジサーバベースのモデルと分散軽量強化学習(RL)エージェントを組み合わせた、慎重にオーケストレーションされたパイプラインで構成されている。
私たちの貢献には、マルチカメラの歩行者追跡データセットの実証分析、マルチカメラの開発、マルチパーソナリティ検出パイプラインの開発、MVSparseの実装などが含まれています。
論文 参考訳(メタデータ) (2023-12-26T02:57:11Z) - CC-3DT: Panoramic 3D Object Tracking via Cross-Camera Fusion [45.0665426425428]
本研究では,CC-3DTと呼ばれるパノラマ3次元物体追跡手法を提案する。
本手法は、複数のカメラから3次元検出を融合させ、同一性スイッチを大幅に低減し、モーションモデリングを改善する。
我々は,競合するNuScenes 3Dトラッキングベンチマークにおいて,カメラベースのすべての手法の中で,平均マルチオブジェクトトラッキング精度(AMOTA)を12.6%改善した新しい最先端技術を設定した。
論文 参考訳(メタデータ) (2022-12-02T15:43:55Z) - BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation [105.96557764248846]
本稿では,汎用マルチタスクマルチセンサ融合フレームワークであるBEVFusionを紹介する。
共有鳥眼ビュー表示空間におけるマルチモーダル特徴を統一する。
3Dオブジェクト検出では1.3%高いmAPとNDS、BEVマップのセグメンテーションでは13.6%高いmIoU、コストは1.9倍である。
論文 参考訳(メタデータ) (2022-05-26T17:59:35Z) - Scalable and Real-time Multi-Camera Vehicle Detection,
Re-Identification, and Tracking [58.95210121654722]
理想化されたビデオストリームやキュレートされたビデオストリームの代わりに,リアルタイムで低解像度のCCTVを処理する,リアルタイムな都市規模のマルチカメラ車両追跡システムを提案する。
私たちの手法は、公共のリーダーボードで上位5人のパフォーマーにランク付けされています。
論文 参考訳(メタデータ) (2022-04-15T12:47:01Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。