論文の概要: SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps
- arxiv url: http://arxiv.org/abs/2502.06519v1
- Date: Mon, 10 Feb 2025 14:41:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:30:01.313048
- Title: SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps
- Title(参考訳): SIREN: マルチロボットガウススプレイティングマップのセマンティック,初期化自由登録
- Authors: Ola Shorinwa, Jiankai Sun, Mac Schwager, Anirudha Majumdar,
- Abstract要約: 本稿では、カメラポーズ、画像、マップ間変換へのアクセスをゼロにするマルチロボット・ガウス・スプレイティング(GSplat)マップの登録について述べる。
実世界のデータセットにおける競合するベースラインと比較して,SIRENの優れた性能を示す。
- 参考スコア(独自算出の注目度): 24.25365541452187
- License:
- Abstract: We present SIREN for registration of multi-robot Gaussian Splatting (GSplat) maps, with zero access to camera poses, images, and inter-map transforms for initialization or fusion of local submaps. To realize these capabilities, SIREN harnesses the versatility and robustness of semantics in three critical ways to derive a rigorous registration pipeline for multi-robot GSplat maps. First, SIREN utilizes semantics to identify feature-rich regions of the local maps where the registration problem is better posed, eliminating the need for any initialization which is generally required in prior work. Second, SIREN identifies candidate correspondences between Gaussians in the local maps using robust semantic features, constituting the foundation for robust geometric optimization, coarsely aligning 3D Gaussian primitives extracted from the local maps. Third, this key step enables subsequent photometric refinement of the transformation between the submaps, where SIREN leverages novel-view synthesis in GSplat maps along with a semantics-based image filter to compute a high-accuracy non-rigid transformation for the generation of a high-fidelity fused map. We demonstrate the superior performance of SIREN compared to competing baselines across a range of real-world datasets, and in particular, across the most widely-used robot hardware platforms, including a manipulator, drone, and quadruped. In our experiments, SIREN achieves about 90x smaller rotation errors, 300x smaller translation errors, and 44x smaller scale errors in the most challenging scenes, where competing methods struggle. We will release the code and provide a link to the project page after the review process.
- Abstract(参考訳): 本稿では,マルチロボット・ガウス・スプレイティング (GSplat) マップの登録のためのSIRENを提案し,カメラポーズ,画像,および局所部分マップの初期化や融合のためのマップ間変換へのアクセスをゼロにする。
これらの機能を実現するために、SIRENはセマンティクスの汎用性と堅牢性を3つの重要な方法で活用し、マルチロボットGSplatマップの厳密な登録パイプラインを導出する。
まず、SIRENはセマンティクスを用いて、登録問題がより適切に設定されたローカルマップの特徴豊富な領域を特定する。
第二に、SIRENはロバストな意味的特徴を用いて局所写像におけるガウスアン間の候補対応を同定し、ロバストな幾何学的最適化の基礎を構成し、局所写像から抽出された3次元ガウス原始体を粗く整列する。
第3に,SIRENはGSplatマップの新規ビュー合成とセマンティクスに基づく画像フィルタを利用して,高忠実な融合写像を生成するための高精度な非剛性変換を計算する。
我々は、現実世界のさまざまなデータセット、特にマニピュレータ、ドローン、四足歩行を含む最も広く使われているロボットハードウェアプラットフォームにおける、競合するベースラインと比較して、SIRENの優れたパフォーマンスを実証する。
我々の実験では、SIRENは約90倍の回転誤差、300倍の翻訳誤差、44倍のスケール誤差を、競合する手法が苦労する最も困難な場面で達成した。
レビュープロセスの後、コードをリリースし、プロジェクトページへのリンクを提供します。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - LoGS: Visual Localization via Gaussian Splatting with Fewer Training Images [7.363332481155945]
本稿では,3D Splatting (GS) 技術をシーン表現として活用した視覚に基づくローカライゼーションパイプラインを提案する。
マッピングフェーズでは、まずStructure-from-motion(SfM)を適用し、続いてGSマップを生成する。
高精度なポーズは、地図上で解析的に達成される。
論文 参考訳(メタデータ) (2024-10-15T11:17:18Z) - GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving [9.023864430027333]
マルチモーダル位置認識は ユニセンサーシステムの弱点を克服する能力によって 注目を集めています
本稿では,GSPRと呼ばれる3次元ガウス型マルチモーダル位置認識ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-01T00:43:45Z) - SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.179377002092416]
より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。
提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T08:46:16Z) - OG-Mapping: Octree-based Structured 3D Gaussians for Online Dense Mapping [19.176488228253483]
3DGSは最近、RGB-Dオンライン高密度マッピングの有望な進歩を実証した。
既存の手法では、マップのデシフィケーションを行うためにピクセルごとの奥行きを過度に頼っている。
スパースオクツリーの頑丈なシーン構造表現機能を活用したOG-Mappingを提案する。
論文 参考訳(メタデータ) (2024-08-30T12:01:59Z) - 3DGS-ReLoc: 3D Gaussian Splatting for Map Representation and Visual ReLocalization [13.868258945395326]
本稿では,3次元ガウススプラッティングを用いた3次元マッピングと視覚的再局在のための新しいシステムを提案する。
提案手法は、LiDARとカメラデータを用いて、環境の正確な視覚的表現を生成する。
論文 参考訳(メタデータ) (2024-03-17T23:06:12Z) - SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [48.190398577764284]
SplaTAMは、単一のRGB-Dカメラからの高忠実度再構成を可能にするアプローチである。
基礎となるガウス表現に合わせて、単純なオンライントラッキングとマッピングシステムを採用している。
実験により,SplaTAMはカメラポーズ推定,マップ構築,既存手法に対する新規ビュー合成において最大2倍の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-12-04T18:53:24Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。