論文の概要: Superquadric Object Representation for Optimization-based Semantic SLAM
- arxiv url: http://arxiv.org/abs/2109.09627v1
- Date: Mon, 20 Sep 2021 15:27:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 21:01:04.861912
- Title: Superquadric Object Representation for Optimization-based Semantic SLAM
- Title(参考訳): 最適化に基づく意味的SLAMのためのスーパークワッドリックオブジェクト表現
- Authors: Florian Tschopp, Juan Nieto, Roland Siegwart, Cesar Cadena
- Abstract要約: 本研究では,SQパラメータを多視点カメラ観測に適合させるためにセマンティックマスク計測を利用するパイプラインを提案する。
マルチビューマスク観測からランダムに生成されたSQパラメータを検索するシステムの能力を実証する。
- 参考スコア(独自算出の注目度): 31.13636619458275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Introducing semantically meaningful objects to visual Simultaneous
Localization And Mapping (SLAM) has the potential to improve both the accuracy
and reliability of pose estimates, especially in challenging scenarios with
significant view-point and appearance changes. However, how semantic objects
should be represented for an efficient inclusion in optimization-based SLAM
frameworks is still an open question. Superquadrics(SQs) are an efficient and
compact object representation, able to represent most common object types to a
high degree, and typically retrieved from 3D point-cloud data. However,
accurate 3D point-cloud data might not be available in all applications. Recent
advancements in machine learning enabled robust object recognition and semantic
mask measurements from camera images under many different appearance
conditions. We propose a pipeline to leverage such semantic mask measurements
to fit SQ parameters to multi-view camera observations using a multi-stage
initialization and optimization procedure. We demonstrate the system's ability
to retrieve randomly generated SQ parameters from multi-view mask observations
in preliminary simulation experiments and evaluate different initialization
stages and cost functions.
- Abstract(参考訳): 意味的に意味のあるオブジェクトを視覚的局所化とマッピング(SLAM)に導入することは、ポーズ推定の正確性と信頼性の両方を改善する可能性がある。
しかしながら、最適化ベースのslamフレームワークにおける効率的な包含のためにセマンティックオブジェクトをどのように表現すべきかは、まだ疑問の余地がある。
スーパークワッドリック(SQ)は効率的でコンパクトなオブジェクト表現であり、ほとんどの一般的なオブジェクトの型を高いレベルで表現することができ、典型的には3Dポイントクラウドデータから取得される。
しかし、正確な3Dポイントクラウドデータは、すべてのアプリケーションで利用できないかもしれない。
機械学習の最近の進歩は、多くの異なる外観条件下でのカメラ画像からの堅牢な物体認識とセマンティックマスク計測を可能にした。
本研究では,SQパラメータを多段階初期化と最適化手法を用いて,多視点カメラ観測に適合させるパイプラインを提案する。
予備シミュレーション実験において,マルチビューマスク観測からランダムに生成したSQパラメータを抽出し,初期化段階とコスト関数の差異を評価する。
関連論文リスト
- LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - Object-based SLAM utilizing unambiguous pose parameters considering
general symmetry types [20.579218922577244]
異なる視点での観測が同一である対称物体は、同時局在化とマッピングの性能を低下させる可能性がある。
本研究は,対称物体の存在下でも,カメラや物体の姿勢を頑健に最適化するシステムを提案する。
論文 参考訳(メタデータ) (2023-03-13T03:07:59Z) - Ambiguity-Aware Multi-Object Pose Optimization for Visually-Assisted
Robot Manipulation [17.440729138126162]
あいまいさを意識した6Dオブジェクトポーズ推定ネットワークPrimA6D++を汎用的不確実性予測手法として提案する。
提案手法は,T-LESS と YCB-Video のデータセットの性能向上を示す。
さらに,視覚支援ロボット操作のためのリアルタイムシーン認識機能を示す。
論文 参考訳(メタデータ) (2022-11-02T08:57:20Z) - CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。
RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。
高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文 参考訳(メタデータ) (2022-10-11T10:20:01Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Towards Multimodal Multitask Scene Understanding Models for Indoor
Mobile Agents [49.904531485843464]
本稿では,現実世界の屋内環境におけるラベル付きデータの不十分,あるいは不可能,といった主な課題について論じる。
MMISM (Multi-modality input Multi-task output Indoor Scene Understanding Model) について述べる。
MMISMは、RGB画像だけでなく、スパースライダーポイントを入力と3Dオブジェクト検出、深さ完了、人間のポーズ推定、セマンティックセグメンテーションを出力タスクとみなしている。
MMISMはシングルタスクモデルよりも同等かそれ以上の性能を示す。
論文 参考訳(メタデータ) (2022-09-27T04:49:19Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Category Level Object Pose Estimation via Neural Analysis-by-Synthesis [64.14028598360741]
本稿では、勾配に基づくフィッティング法とパラメトリックニューラルネットワーク合成モジュールを組み合わせる。
画像合成ネットワークは、ポーズ設定空間を効率的に分散するように設計されている。
本研究では,2次元画像のみから高精度に物体の向きを復元できることを実験的に示す。
論文 参考訳(メタデータ) (2020-08-18T20:30:47Z) - Object-Centric Multi-View Aggregation [86.94544275235454]
本稿では,オブジェクトのスパースなビュー集合を集約して,半単純3次元表現を容積特徴格子の形で計算する手法を提案する。
我々のアプローチの鍵となるのは、カメラのポーズを明示することなく、ビューを持ち上げることができるオブジェクト中心の標準3D座標システムである。
画素から標準座標系への対称対応マッピングの計算により、未知の領域への情報伝達がより良くなることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:38:31Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。