論文の概要: MCOO-SLAM: A Multi-Camera Omnidirectional Object SLAM System
- arxiv url: http://arxiv.org/abs/2506.15402v1
- Date: Wed, 18 Jun 2025 12:20:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.657468
- Title: MCOO-SLAM: A Multi-Camera Omnidirectional Object SLAM System
- Title(参考訳): MCOO-SLAM:マルチカメラ全方位オブジェクトSLAMシステム
- Authors: Miaoxin Pan, Jinnan Li, Yaowen Zhang, Yi Yang, Yufeng Yue,
- Abstract要約: 本稿では,MCOO-SLAMを提案する。
我々のアプローチは、オープン語彙意味論で強化された点特徴とオブジェクトレベルのランドマークを統合する。
実世界の大規模な実験により、MCOO-SLAMは正確なローカライゼーションとスケーラブルなオブジェクトレベルのマッピングを実現することが示された。
- 参考スコア(独自算出の注目度): 19.16370123474815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object-level SLAM offers structured and semantically meaningful environment representations, making it more interpretable and suitable for high-level robotic tasks. However, most existing approaches rely on RGB-D sensors or monocular views, which suffer from narrow fields of view, occlusion sensitivity, and limited depth perception-especially in large-scale or outdoor environments. These limitations often restrict the system to observing only partial views of objects from limited perspectives, leading to inaccurate object modeling and unreliable data association. In this work, we propose MCOO-SLAM, a novel Multi-Camera Omnidirectional Object SLAM system that fully leverages surround-view camera configurations to achieve robust, consistent, and semantically enriched mapping in complex outdoor scenarios. Our approach integrates point features and object-level landmarks enhanced with open-vocabulary semantics. A semantic-geometric-temporal fusion strategy is introduced for robust object association across multiple views, leading to improved consistency and accurate object modeling, and an omnidirectional loop closure module is designed to enable viewpoint-invariant place recognition using scene-level descriptors. Furthermore, the constructed map is abstracted into a hierarchical 3D scene graph to support downstream reasoning tasks. Extensive experiments in real-world demonstrate that MCOO-SLAM achieves accurate localization and scalable object-level mapping with improved robustness to occlusion, pose variation, and environmental complexity.
- Abstract(参考訳): オブジェクトレベルのSLAMは、構造化され意味のある環境表現を提供し、より解釈可能で、ハイレベルなロボットタスクに適している。
しかし、既存のほとんどのアプローチはRGB-Dセンサーやモノクラービューに依存しており、特に大規模または屋外環境では視野が狭く、閉塞感度が低く、奥行きの認識が限られている。
これらの制限はしばしば、限られた視点からオブジェクトの部分的なビューのみを観察するシステムに制限され、不正確なオブジェクトモデリングと信頼性の低いデータアソシエーションをもたらす。
本研究では,複雑な屋外シナリオにおいて,サラウンドビューカメラの構成を完全に活用し,堅牢で一貫性があり,セマンティックにリッチなマッピングを実現する,新しいマルチカメラOmnidirectional Object SLAMシステムであるMCOO-SLAMを提案する。
我々のアプローチは、オープン語彙意味論で強化された点特徴とオブジェクトレベルのランドマークを統合する。
複数のビューにまたがるロバストなオブジェクトアソシエーションのためのセマンティック・ジオメトリ・時間的融合戦略を導入し、一貫性と正確なオブジェクトモデリングを改善し、一方向ループクロージャモジュールはシーンレベルの記述子を用いた視点不変の場所認識を可能にするように設計されている。
さらに、構築されたマップを階層的な3Dシーングラフに抽象化し、下流の推論タスクをサポートする。
実世界の大規模な実験により、MCOO-SLAMは正確な局所化と拡張性のあるオブジェクトレベルのマッピングを実現し、密閉性、ポーズのバリエーション、環境の複雑さを改善した。
関連論文リスト
- Go-SLAM: Grounded Object Segmentation and Localization with Gaussian Splatting SLAM [12.934788858420752]
Go-SLAMは動的環境の再構築に3DガウススティングSLAMを利用する新しいフレームワークである。
本システムは,自然言語記述によるオブジェクトの検索を容易にする。
論文 参考訳(メタデータ) (2024-09-25T13:56:08Z) - LOSS-SLAM: Lightweight Open-Set Semantic Simultaneous Localization and Mapping [9.289001828243512]
オブジェクトを識別,ローカライズ,符号化するシステムは,オープンセットのセマンティックな同時ローカライゼーションとマッピングを行う確率的グラフィカルモデルと密結合していることを示す。
提案した軽量オブジェクト符号化は,既存のオープンセット手法よりも高精度なオブジェクトベースSLAMを実現することができることを示す。
論文 参考訳(メタデータ) (2024-04-05T19:42:55Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - NeuSE: Neural SE(3)-Equivariant Embedding for Consistent Spatial
Understanding with Objects [53.111397800478294]
本稿では,ニューラルSE(3)-等価なオブジェクトの埋め込みであるNeuSEを紹介する。
NeuSE は完全なオブジェクトモデルのためのコンパクトな点クラウドサロゲートとして機能する。
提案するSLAMパラダイムは,物体形状やポーズ特性にNeuSEを用いて,通常のSLAMシステムと独立に,あるいは連携して動作することができる。
論文 参考訳(メタデータ) (2023-03-13T17:30:43Z) - Visual-Inertial Multi-Instance Dynamic SLAM with Object-level
Relocalisation [14.302118093865849]
密結合型ビジュアル・慣性オブジェクトレベルのマルチインスタンス動的SLAMシステムを提案する。
カメラのポーズ、速度、IMUバイアスを強く最適化し、環境の高密度な3D再構成オブジェクトレベルマップを構築することができる。
論文 参考訳(メタデータ) (2022-08-08T17:13:24Z) - Compositional Scalable Object SLAM [29.349829139625403]
室内シーンをオブジェクトのグラフとして表現し,高速でスケーラブルで高精度なSLAMシステムを提案する。
ドリフトフリーで大規模屋内再構築を行うため,構成性に富んだオブジェクトマッピングの定式化が,ロバストなSLAMソリューションに適用可能であることを示す。
論文 参考訳(メタデータ) (2020-11-05T04:46:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。