論文の概要: S3KF: Spherical State-Space Kalman Filtering for Panoramic 3D Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2603.27534v1
- Date: Sun, 29 Mar 2026 06:01:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.010415
- Title: S3KF: Spherical State-Space Kalman Filtering for Panoramic 3D Multi-Object Tracking
- Title(参考訳): S3KF:パノラマ3次元多物体追跡のための球状状態空間カルマンフィルタ
- Authors: Zhongyuan Liu, Shaonan Yu, Jianping Li, Pengfei Wan, Xinhang Xu, Pengfei Wang, Maggie Y. Gao, Lihua Xie,
- Abstract要約: パノラマ多対象追跡は、産業安全監視、広域ロボット認識、大規模ワークスペースにおけるインフラストラクチャライト展開において重要である。
既存の画像平面トラッカーは、カメラ投影に強く結合され、パノラマ画像では信頼性が低い。
回転する電動LiDARとクワッドフィッシュカメラリグをベースとしたパノラマ3次元多物体追跡フレームワークを提案する。
- 参考スコア(独自算出の注目度): 24.79542959759503
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Panoramic multi-object tracking is important for industrial safety monitoring, wide-area robotic perception, and infrastructure-light deployment in large workspaces. In these settings, the sensing system must provide full-surround coverage, metric geometric cues, and stable target association under wide field-of-view distortion and occlusion. Existing image-plane trackers are tightly coupled to the camera projection and become unreliable in panoramic imagery, while conventional Euclidean 3D formulations introduce redundant directional parameters and do not naturally unify angular, scale, and depth estimation. In this paper, we present $\mathbf{S^3KF}$, a panoramic 3D multi-object tracking framework built on a motorized rotating LiDAR and a quad-fisheye camera rig. The key idea is a geometry-consistent state representation on the unit sphere $\mathbb{S}^2$, where object bearing is modeled by a two-degree-of-freedom tangent-plane parameterization and jointly estimated with box scale and depth dynamics. Based on this state, we derive an extended spherical Kalman filtering pipeline that fuses panoramic camera detections with LiDAR depth observations for multimodal tracking. We further establish a map-based ground-truth generation pipeline using wearable localization devices registered to a shared global LiDAR map, enabling quantitative evaluation without motion-capture infrastructure. Experiments on self-collected real-world sequences show decimeter-level planar tracking accuracy, improved identity continuity over a 2D panoramic baseline in dynamic scenes, and real-time onboard operation on a Jetson AGX Orin platform. These results indicate that the proposed framework is a practical solution for panoramic perception and industrial-scale multi-object tracking.The project page can be found at https://kafeiyin00.github.io/S3KF/.
- Abstract(参考訳): パノラマ多対象追跡は、産業安全監視、広域ロボット認識、大規模ワークスペースにおけるインフラストラクチャライト展開において重要である。
これらの設定では、センシングシステムは、広視野の歪みと閉塞の下で、全周のカバレッジ、計量幾何学的手がかり、安定したターゲットアソシエーションを提供する必要がある。
既存の画像平面トラッカーはカメラ投影と密結合しており、パノラマ画像では信頼性が低いが、従来のユークリッド3次元定式化では冗長な方向パラメータを導入し、角、スケール、深さ推定を自然に統一しない。
本稿では,電動回転LiDARとクワッドフィッシュカメラを用いたパノラマ3D多物体追跡フレームワークである$\mathbf{S^3KF}$を提案する。
鍵となるアイデアは、単位球面 $\mathbb{S}^2$ 上の幾何整合状態表現である。
この状態に基づいて,マルチモーダルトラッキングのためのパノラマカメラ検出とLiDAR深度観測を融合した拡張球面カルマンフィルタパイプラインを導出する。
さらに、共有グローバルLiDARマップに登録されたウェアラブルローカライゼーションデバイスを用いて、地図ベースの地中構造生成パイプラインを構築し、モーションキャプチャーインフラストラクチャなしで定量的な評価を可能にする。
動的シーンにおける2次元パノラマベースライン上のアイデンティティ連続性の向上,Jetson AGX Orinプラットフォーム上でのリアルタイムオンボード操作,などである。
これらの結果から,提案フレームワークはパノラマ認識と産業用マルチオブジェクト追跡の実践的ソリューションであり,プロジェクトページはhttps://kafeiyin00.github.io/S3KF/で見ることができる。
関連論文リスト
- TAPVid-3D: A Benchmark for Tracking Any Point in 3D [63.060421798990845]
我々は,3Dにおける任意の点の追跡作業を評価するための新しいベンチマークTAPVid-3Dを導入する。
このベンチマークは、モノクロビデオから正確な3Dの動きと表面の変形を理解する能力を改善するためのガイドポストとして機能する。
論文 参考訳(メタデータ) (2024-07-08T13:28:47Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Calibrating Panoramic Depth Estimation for Practical Localization and
Mapping [20.621442016969976]
周囲環境の絶対深度値は, 局所化, ナビゲーション, 3次元構造推定など, 様々な補助技術にとって重要な手がかりとなる。
本研究では,パノラマ画像から推定される精度の高い深度が,3次元情報を必要とする幅広い下流タスクに対して,強力で軽量な入力として機能することを提案する。
論文 参考訳(メタデータ) (2023-08-27T04:50:05Z) - SRCN3D: Sparse R-CNN 3D for Compact Convolutional Multi-View 3D Object
Detection and Tracking [12.285423418301683]
本稿では,スパースクエリ,ボックスワイズサンプリングによるスパースアテンション,スパース予測を組み込んだ新しい2段フルスパース検出器であるスパースR-CNN3Dを提案する。
nuScenesデータセットの実験では、SRCN3Dは3Dオブジェクト検出とマルチオブジェクト追跡の両方で競合性能を達成している。
論文 参考訳(メタデータ) (2022-06-29T07:58:39Z) - Monocular Road Planar Parallax Estimation [25.36368935789501]
乾燥可能な表面および周囲環境の3次元構造を推定することは、補助的かつ自律的な運転にとって重要な課題である。
単眼画像からの3Dセンシングのための新しいディープニューラルネットワークであるRoad Planar Parallax Attention Network (RPANet)を提案する。
RPANetは、路面のホモグラフィに整列した一対の画像を入力として取り、3D再構成のための$gamma$mapを出力する。
論文 参考訳(メタデータ) (2021-11-22T10:03:41Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - PC-DAN: Point Cloud based Deep Affinity Network for 3D Multi-Object
Tracking (Accepted as an extended abstract in JRDB-ACT Workshop at CVPR21) [68.12101204123422]
点雲は3次元座標における空間データの密集したコンパイルである。
我々は3次元多目的追跡(MOT)のためのPointNetベースのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-03T05:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。