論文の概要: LaLaLoc: Latent Layout Localisation in Dynamic, Unvisited Environments
- arxiv url: http://arxiv.org/abs/2104.09169v1
- Date: Mon, 19 Apr 2021 09:49:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 13:49:56.305916
- Title: LaLaLoc: Latent Layout Localisation in Dynamic, Unvisited Environments
- Title(参考訳): LaLaLoc: 動的で目に見えない環境での遅延レイアウトのローカライズ
- Authors: Henry Howard-Jenkins, Jose-Raul Ruiz-Sarmiento, Victor Adrian
Prisacariu
- Abstract要約: 事前訪問を必要とせず, 環境のローカライズにLaLaLocを提案する。
LaLaLocは、RGBパノラマと既知のフロアプランから推測されるレイアウトの間で共有されるリッチな埋め込み空間を学習する。
国内環境において、LaLaLocは、事前にフロアプランのみを与えられたRGBパノラマ画像を8.3cm以内まで正確にローカライズできることを示しています。
- 参考スコア(独自算出の注目度): 13.313550853441976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present LaLaLoc to localise in environments without the need for prior
visitation, and in a manner that is robust to large changes in scene
appearance, such as a full rearrangement of furniture. Specifically, LaLaLoc
performs localisation through latent representations of room layout. LaLaLoc
learns a rich embedding space shared between RGB panoramas and layouts inferred
from a known floor plan that encodes the structural similarity between
locations. Further, LaLaLoc introduces direct, cross-modal pose optimisation in
its latent space. Thus, LaLaLoc enables fine-grained pose estimation in a scene
without the need for prior visitation, as well as being robust to dynamics,
such as a change in furniture configuration. We show that in a domestic
environment LaLaLoc is able to accurately localise a single RGB panorama image
to within 8.3cm, given only a floor plan as a prior.
- Abstract(参考訳): 室内環境におけるLaLaLocのローカライズには,事前の来訪を必要とせず,家具の全面的な再配置など,外観の大きな変化に頑健な方法を提案する。
具体的には、LaLaLocは部屋レイアウトの潜在表現を通じてローカライズを行う。
lalalocは、rgbパノラマと、場所間の構造的類似性をエンコードする既知のフロアプランから推測されるレイアウト間で共有されるリッチな埋め込み空間を学ぶ。
さらにLaLaLocは、その潜在空間において、直接的、クロスモーダルなポーズ最適化を導入する。
したがって、LaLaLocは、事前に訪問する必要がなく、家具構成の変更のような動的に堅牢なシーンで、きめ細かいポーズ推定を可能にする。
室内環境において,ララロックは1枚のrgbパノラマ画像を8.3cm以内に正確に配置できることを示した。
関連論文リスト
- LCP-Fusion: A Neural Implicit SLAM with Enhanced Local Constraints and Computable Prior [22.948360879064758]
LCP-Fusionは、局所的な制約が強化され、計算可能な事前計算が可能な、神経暗黙のSLAMシステムである。
提案手法は,既存のRGB-D暗黙SLAMよりも高精度な局所化精度と再構成整合性を実現する。
論文 参考訳(メタデータ) (2024-11-06T02:05:44Z) - LLplace: The 3D Indoor Scene Layout Generation and Editing via Large Language Model [58.24851949945434]
LLplace は軽量な微調整のオープンソース LLM Llama3 に基づく新しい3D屋内シーンレイアウトデザイナである。
LLplaceは、空間的関係の先行とコンテキスト内例の必要性を回避し、効率的で信頼性の高い部屋レイアウト生成を可能にする。
提案手法は,高品質な3D設計ソリューションを実現する上で,LLplaceがインタラクティブに3D屋内レイアウトを効果的に生成・編集できることを示す。
論文 参考訳(メタデータ) (2024-06-06T08:53:01Z) - PLGSLAM: Progressive Neural Scene Represenation with Local to Global Bundle Adjustment [24.05634277422078]
PLGSLAMは、高忠実な表面再構成とロバストなカメラトラッキングをリアルタイムで実現可能な、ニューラルビジュアルSLAMシステムである。
PLGSLAMは,様々なデータセットやシナリオにまたがって,最先端のシーン再構築結果を達成し,性能の追跡を行う。
論文 参考訳(メタデータ) (2023-12-15T15:09:30Z) - RoomDesigner: Encoding Anchor-latents for Style-consistent and
Shape-compatible Indoor Scene Generation [26.906174238830474]
室内シーン生成は、空間的に合理的なレイアウトで形状に整合したスタイルの家具配置を作成することを目的としている。
家具をアンカーラテント表現としてエンコードすることで,形状先行を室内シーン生成に組み込む2段階モデルを提案する。
論文 参考訳(メタデータ) (2023-10-16T03:05:19Z) - iBARLE: imBalance-Aware Room Layout Estimation [54.819085005591894]
ルームレイアウト推定は、1つのパノラマからレイアウトを予測する。
実際のデータセットには、レイアウトの複雑さの次元、カメラの位置、シーンの外観の変化など、大きな不均衡がある。
これらの問題に対処するために, imBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。
iBARLEは、(1)外観変化生成(AVG)モジュール、(2)複合構造混合(CSMix)モジュール、(3)勾配に基づくレイアウト目的関数からなる。
論文 参考訳(メタデータ) (2023-08-29T06:20:36Z) - Lazy Visual Localization via Motion Averaging [89.8709956317671]
本研究では,データベースからシーンを再構築することなく,高精度なローカライゼーションを実現することができることを示す。
実験の結果、我々の視覚的ローカライゼーションの提案であるLazyLocは、最先端の構造に基づく手法に対して同等のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-07-19T13:40:45Z) - BlobGAN: Spatially Disentangled Scene Representations [67.60387150586375]
本研究では,シーン生成モデルのための教師なし中間レベル表現を提案する。
この表現は、ピクセル単位でもイメージ単位でもなく、むしろ空間的に、奥行き順に並べられた特徴の「ブロブ」の集合としてモデル化されている。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - LASER: LAtent SpacE Rendering for 2D Visual Localization [16.15081513827044]
本稿では,床図上の2次元ポーズ仮説を幾何学的に構造化された潜在空間に直接描画する潜在空間レンダリングの概念を紹介する。
当社のコードブック方式は,機能符号化とレンダリングを効果的に切り離し,遅延空間レンダリングを10KHz以上の速度で実行可能にする。
LASERは大規模屋内ローカライゼーションデータセット上で最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-04-01T01:39:29Z) - LODE: Deep Local Deblurring and A New Benchmark [106.80269193462712]
我々はBLur-Aware Deblurring Network(BladeNet)と呼ばれる新しいフレームワークを提案する。
ローカルブラー合成モジュールは局所的にぼやけたトレーニングペアを生成し、ローカルブラー知覚モジュールは局所的にぼやけた領域を自動的に捕捉し、Blar-guided Space Attentionモジュールは遅延ネットワークを空間的注意でガイドする。
我々は,REDS と LODE データセットの広範な実験を行い,BladeNet がPSNR を 2.5dB で改善し,SotAs を局所的に改善し,グローバルデブロアに匹敵する性能を維持していることを示す。
論文 参考訳(メタデータ) (2021-09-19T15:57:28Z) - Beyond Controlled Environments: 3D Camera Re-Localization in Changing
Indoor Scenes [74.9814252247282]
長期カメラ再配置は多くのコンピュータビジョンとロボット工学の応用において重要な課題である。
RIO10は、屋内シーンに焦点を当てた、新しい長期カメラ再ローカライゼーションベンチマークである。
論文 参考訳(メタデータ) (2020-08-05T09:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。