論文の概要: VOOM: Robust Visual Object Odometry and Mapping using Hierarchical
Landmarks
- arxiv url: http://arxiv.org/abs/2402.13609v2
- Date: Mon, 26 Feb 2024 10:02:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 23:52:18.889693
- Title: VOOM: Robust Visual Object Odometry and Mapping using Hierarchical
Landmarks
- Title(参考訳): VOOM:階層的ランドマークを用いたロバストなビジュアルオブジェクトオードメトリーとマッピング
- Authors: Yutong Wang, Chaoyang Jiang, Xieyuanli Chen
- Abstract要約: 本稿では,ビジュアルオブジェクトのオドメトリとマッピングフレームワーク VOOM を提案する。
粗い方法で階層的なランドマークとして、高レベルのオブジェクトと低レベルのポイントを使用します。
VOOMはオブジェクト指向SLAMと特徴点SLAMシステムの両方をローカライゼーションで上回る。
- 参考スコア(独自算出の注目度): 19.789761641342043
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, object-oriented simultaneous localization and mapping (SLAM)
has attracted increasing attention due to its ability to provide high-level
semantic information while maintaining computational efficiency. Some
researchers have attempted to enhance localization accuracy by integrating the
modeled object residuals into bundle adjustment. However, few have demonstrated
better results than feature-based visual SLAM systems, as the generic coarse
object models, such as cuboids or ellipsoids, are less accurate than feature
points. In this paper, we propose a Visual Object Odometry and Mapping
framework VOOM using high-level objects and low-level points as the
hierarchical landmarks in a coarse-to-fine manner instead of directly using
object residuals in bundle adjustment. Firstly, we introduce an improved
observation model and a novel data association method for dual quadrics,
employed to represent physical objects. It facilitates the creation of a 3D map
that closely reflects reality. Next, we use object information to enhance the
data association of feature points and consequently update the map. In the
visual object odometry backend, the updated map is employed to further optimize
the camera pose and the objects. Meanwhile, local bundle adjustment is
performed utilizing the objects and points-based covisibility graphs in our
visual object mapping process. Experiments show that VOOM outperforms both
object-oriented SLAM and feature points SLAM systems such as ORB-SLAM2 in terms
of localization. The implementation of our method is available at
https://github.com/yutongwangBIT/VOOM.git.
- Abstract(参考訳): 近年、オブジェクト指向同時ローカライゼーション・マッピング(slam: object-oriented concurrent localization and mapping)が、計算効率を維持しつつ高レベルの意味情報を提供する能力によって注目を集めている。
一部の研究者は、モデル化されたオブジェクト残基をバンドル調整に統合することにより、局所化の精度を高めようと試みている。
しかし,cuboids や ellipsoids といった汎用的な粗オブジェクトモデルは特徴点よりも精度が低いため,機能ベースのビジュアルスラムシステムよりも優れた結果が得られていない。
本稿では,高レベルオブジェクトと低レベルポイントを階層的なランドマークとして,バンドル調整でオブジェクトの残差を直接使用するのではなく,粒度から細かな方法で使用するビジュアルオブジェクトオドメトリおよびマッピングフレームワークvoomを提案する。
まず,物理オブジェクトを表現するために用いられる,改良された観測モデルと2次二次の新たなデータアソシエーション手法を提案する。
現実をよく反映した3Dマップの作成を容易にする。
次に、オブジェクト情報を用いて特徴点のデータ関連性を高め、その結果、マップを更新する。
ビジュアルオブジェクト計測バックエンドでは、更新されたマップを使用して、カメラのポーズとオブジェクトをさらに最適化する。
一方,視覚オブジェクトマッピングプロセスでは,オブジェクトと点ベースの可視性グラフを用いて局所バンドル調整を行う。
実験により、VOOMはオブジェクト指向SLAMとORB-SLAM2のような特徴点SLAMシステムの両方をローカライゼーションで上回ることがわかった。
このメソッドの実装はhttps://github.com/yutongwangbit/voom.gitで利用可能です。
関連論文リスト
- GOReloc: Graph-based Object-Level Relocalization for Visual SLAM [17.608119427712236]
本稿では,ロボットシステムのオブジェクトレベル再ローカライズのための新しい手法を紹介する。
軽量なオブジェクトレベルマップにおいて、現在のフレーム内の物体検出と3Dオブジェクトとの密接な関連付けにより、カメラセンサのポーズを決定する。
論文 参考訳(メタデータ) (2024-08-15T03:54:33Z) - Semantic Object-level Modeling for Robust Visual Camera Relocalization [14.998133272060695]
本稿では,オブジェクトの楕円形表現のためのオブジェクトレベルの自動ボクセルモデリング手法を提案する。
これらのモジュールはすべて、視覚的SLAMシステムに完全に介在している。
論文 参考訳(メタデータ) (2024-02-10T13:39:44Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドは、自由形式の言語記述によって、ターゲットオブジェクトを3Dポイントクラウドにローカライズすることを目的としている。
3次元相対位置認識ネットワーク(3-Net)という,関係性を考慮した一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T09:33:25Z) - An Object SLAM Framework for Association, Mapping, and High-Level Tasks [12.62957558651032]
本稿では,オブジェクト指向認識とオブジェクト指向ロボットタスクに焦点を当てた包括的オブジェクトSLAMフレームワークを提案する。
提案したオブジェクトSLAMフレームワークを効率よく評価するために,さまざまな公開データセットと実世界の結果が使用されている。
論文 参考訳(メタデータ) (2023-05-12T08:10:14Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - NeuSE: Neural SE(3)-Equivariant Embedding for Consistent Spatial
Understanding with Objects [53.111397800478294]
本稿では,ニューラルSE(3)-等価なオブジェクトの埋め込みであるNeuSEを紹介する。
NeuSE は完全なオブジェクトモデルのためのコンパクトな点クラウドサロゲートとして機能する。
提案するSLAMパラダイムは,物体形状やポーズ特性にNeuSEを用いて,通常のSLAMシステムと独立に,あるいは連携して動作することができる。
論文 参考訳(メタデータ) (2023-03-13T17:30:43Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - Object-Augmented RGB-D SLAM for Wide-Disparity Relocalisation [3.888848425698769]
本稿では、一貫したオブジェクトマップを構築し、地図内のオブジェクトのセントロイドに基づいて再局在を行うことができるオブジェクト拡張RGB-D SLAMシステムを提案する。
論文 参考訳(メタデータ) (2021-08-05T11:02:25Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - OrcVIO: Object residual constrained Visual-Inertial Odometry [18.3130718336919]
この研究は、構造化対象モデルに対する追跡と最適化と密結合した視覚慣性オドメトリーのためのOrcVIOを提示する。
OrcVIOの正確な軌道推定および大規模オブジェクトレベルのマッピング能力は実データを用いて評価する。
論文 参考訳(メタデータ) (2020-07-29T21:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。