Fugu-MT 論文翻訳(概要): Superquadric Object Representation for Optimization-based Semantic SLAM

論文の概要: Superquadric Object Representation for Optimization-based Semantic SLAM

arxiv url: http://arxiv.org/abs/2109.09627v1
Date: Mon, 20 Sep 2021 15:27:56 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-21 21:01:04.861912
Title: Superquadric Object Representation for Optimization-based Semantic SLAM
Title（参考訳）: 最適化に基づく意味的SLAMのためのスーパークワッドリックオブジェクト表現
Authors: Florian Tschopp, Juan Nieto, Roland Siegwart, Cesar Cadena
Abstract要約: 本研究では,SQパラメータを多視点カメラ観測に適合させるためにセマンティックマスク計測を利用するパイプラインを提案する。マルチビューマスク観測からランダムに生成されたSQパラメータを検索するシステムの能力を実証する。
参考スコア（独自算出の注目度）: 31.13636619458275
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Introducing semantically meaningful objects to visual Simultaneous Localization And Mapping (SLAM) has the potential to improve both the accuracy and reliability of pose estimates, especially in challenging scenarios with significant view-point and appearance changes. However, how semantic objects should be represented for an efficient inclusion in optimization-based SLAM frameworks is still an open question. Superquadrics(SQs) are an efficient and compact object representation, able to represent most common object types to a high degree, and typically retrieved from 3D point-cloud data. However, accurate 3D point-cloud data might not be available in all applications. Recent advancements in machine learning enabled robust object recognition and semantic mask measurements from camera images under many different appearance conditions. We propose a pipeline to leverage such semantic mask measurements to fit SQ parameters to multi-view camera observations using a multi-stage initialization and optimization procedure. We demonstrate the system's ability to retrieve randomly generated SQ parameters from multi-view mask observations in preliminary simulation experiments and evaluate different initialization stages and cost functions.
Abstract（参考訳）: 意味的に意味のあるオブジェクトを視覚的局所化とマッピング(SLAM)に導入することは、ポーズ推定の正確性と信頼性の両方を改善する可能性がある。しかしながら、最適化ベースのslamフレームワークにおける効率的な包含のためにセマンティックオブジェクトをどのように表現すべきかは、まだ疑問の余地がある。スーパークワッドリック(SQ)は効率的でコンパクトなオブジェクト表現であり、ほとんどの一般的なオブジェクトの型を高いレベルで表現することができ、典型的には3Dポイントクラウドデータから取得される。しかし、正確な3Dポイントクラウドデータは、すべてのアプリケーションで利用できないかもしれない。機械学習の最近の進歩は、多くの異なる外観条件下でのカメラ画像からの堅牢な物体認識とセマンティックマスク計測を可能にした。本研究では,SQパラメータを多段階初期化と最適化手法を用いて,多視点カメラ観測に適合させるパイプラインを提案する。予備シミュレーション実験において,マルチビューマスク観測からランダムに生成したSQパラメータを抽出し,初期化段階とコスト関数の差異を評価する。

関連論文リスト

SQS: Enhancing Sparse Perception Models via Query-based Splatting in Autonomous Driving [56.198745862311824]
スパースパーセプションモデル(SPM)のための新しいクエリベーススプラッティング事前トレーニングであるSQSを紹介する。 SQSは、事前トレーニング中にスパースクエリから3Dガウス表現を予測する。自律運転ベンチマークの実験では、SQSは複数のクエリベースの3D知覚タスクでかなりのパフォーマンス向上を達成している。
論文参考訳（メタデータ） (2025-09-20T09:25:19Z)
IAAO: Interactive Affordance Learning for Articulated Objects in 3D Environments [56.85804719947]
IAAOは知的エージェントのための明示的な3Dモデルを構築するフレームワークで,対話を通して環境内の明瞭な物体の理解を得る。マスク特徴とビュー一貫性ラベルを多視点画像から抽出し,まず3次元ガウススティング(3DGS)を用いて各オブジェクト状態の階層的特徴とラベルフィールドを構築する。次に、3Dガウスプリミティブ上でオブジェクトと部分レベルのクエリを実行し、静的および明瞭な要素を識別し、大域的な変換と局所的な調音パラメータをアベイランスとともに推定する。
論文参考訳（メタデータ） (2025-04-09T12:36:48Z)
Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。 LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文参考訳（メタデータ） (2024-10-24T17:54:42Z)
CVAM-Pose: Conditional Variational Autoencoder for Multi-Object Monocular Pose Estimation [3.5379836919221566]
剛体物体のポーズを推定することはコンピュータビジョンの基本的な問題の一つである。本稿では,多目的単分子ポーズ推定のための新しいアプローチCVAM-Poseを提案する。
論文参考訳（メタデータ） (2024-10-11T17:26:27Z)
KRONC: Keypoint-based Robust Camera Optimization for 3D Car Reconstruction [58.04846444985808]
KRONCは、オブジェクトに関する事前知識を活用して、セマンティックキーポイントを通してその表現を再構築することで、ビューポーズを推論する新しいアプローチである。車両シーンに焦点を当てたKRONCは、キーポイントのバックプロジェクションを特異点に収束させることを目的とした光最適化問題の解として、ビューの位置を推定することができる。
論文参考訳（メタデータ） (2024-09-09T08:08:05Z)
Divide and Conquer: Improving Multi-Camera 3D Perception with 2D Semantic-Depth Priors and Input-Dependent Queries [30.17281824826716]
既存の手法は、しばしば意味と深さの手がかりの相乗効果を無視し、分類と位置推定誤差をもたらす。本稿では,SemanticsとDepthを先行として活用した入力対応トランスフォーマーフレームワークを提案する。我々のアプローチは、意味と深さの事前を明示的にモデル化するS-Dを用いることで、オブジェクトの分類と位置推定の学習プロセスを阻害する。
論文参考訳（メタデータ） (2024-08-13T13:51:34Z)
InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds [91.77050739918037]
スパース画像からの新しいビュー合成(NVS)は3次元コンピュータビジョンにおいて大きく進歩している。これはStructure-from-Motion (SfM) を用いたカメラパラメータの正確な初期推定に依存する本研究では,スパースビュー画像から堅牢なNVSを向上するための,新規で効率的なフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-29T17:29:58Z)
PoIFusion: Multi-Modal 3D Object Detection via Fusion at Points of Interest [65.48057241587398]
PoIFusionは、関心点(PoIs)におけるRGBイメージとLiDARポイントクラウドに関する情報を融合するフレームワークである。提案手法は,各モダリティの視点を維持し,計算にやさしいプロジェクションと計算によってマルチモーダル特徴を得る。我々はnuScenesとArgoverse2データセットについて広範囲に実験を行い、我々のアプローチを評価した。
論文参考訳（メタデータ） (2024-03-14T09:28:12Z)
Object-based SLAM utilizing unambiguous pose parameters considering general symmetry types [20.579218922577244]
異なる視点での観測が同一である対称物体は、同時局在化とマッピングの性能を低下させる可能性がある。本研究は,対称物体の存在下でも,カメラや物体の姿勢を頑健に最適化するシステムを提案する。
論文参考訳（メタデータ） (2023-03-13T03:07:59Z)
Ambiguity-Aware Multi-Object Pose Optimization for Visually-Assisted Robot Manipulation [17.440729138126162]
あいまいさを意識した6Dオブジェクトポーズ推定ネットワークPrimA6D++を汎用的不確実性予測手法として提案する。提案手法は,T-LESS と YCB-Video のデータセットの性能向上を示す。さらに,視覚支援ロボット操作のためのリアルタイムシーン認識機能を示す。
論文参考訳（メタデータ） (2022-11-02T08:57:20Z)
Generative Category-Level Shape and Pose Estimation with Semantic Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文参考訳（メタデータ） (2022-10-03T17:51:54Z)
RelPose: Predicting Probabilistic Relative Rotation for Single Objects in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文参考訳（メタデータ） (2022-08-11T17:59:59Z)
Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文参考訳（メタデータ） (2020-07-18T22:31:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。