論文の概要: SceneAligner: 3D-Grounded Floorplan Localization in the Wild
- arxiv url: http://arxiv.org/abs/2605.22581v1
- Date: Thu, 21 May 2026 14:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.312202
- Title: SceneAligner: 3D-Grounded Floorplan Localization in the Wild
- Title(参考訳): SceneAligner:野生における3Dグラウンドフロアプランの局在
- Authors: Junhyeong Cho, Ruojin Cai, Hadar Averbuch-Elor,
- Abstract要約: 本研究では,現場の3次元再構成表現にタスクを接地することで,野生環境におけるフロアプランのローカライズを行う手法を提案する。
本手法は,重力に整合した3次元シーンを再構成し,フロアプランプロキシとして機能する2次元密度マップに投影する。
密度マップと建築フロアプランの外観ギャップを埋めるために, 2次元基礎モデルを適用し, 相互対応を学習する。
- 参考スコア(独自算出の注目度): 24.114337264203428
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Many public buildings provide floorplans with a "you are here" indicator to help visitors orient themselves. Floorplan localization seeks to computationally replicate this capability by determining where visual observations were captured within a floorplan. However, existing methods typically assume controlled small-scale environments and precise vectorized floorplans, limiting their ability to operate in large-scale buildings and rasterized floorplans. In this work, we present an approach for performing floorplan localization in the wild by grounding the task in a reconstructed 3D representation of the scene. Given an unconstrained image collection, our method reconstructs a gravity-aligned 3D scene and projects it into a 2D density map that serves as a floorplan proxy. Floorplan localization is then formulated as aligning this proxy with the input floorplan via a 2D similarity transform. To bridge the appearance gap between density maps and architectural floorplans, we adapt a 2D foundation model to learn cross-modal correspondences, introducing a fine-tuning scheme that encourages semantically aligned matches while preserving structural consistency. Extensive experiments demonstrate substantial improvements over prior methods, including in extremely sparse settings with as little as a single input image. Our code and data will be publicly available.
- Abstract(参考訳): 多くの公共の建物は、訪問者が自らをオリエントするのを助けるために、"You are here"という指標でフロアプランを提供している。
フロアプランのローカライゼーションは、フロアプラン内で視覚的な観察がどこで取得されたかを決定することによって、この機能を計算的に再現しようとする。
しかし、既存の手法では、制御された小規模な環境と正確なベクトル化フロアプランを前提としており、大規模な建物やラスタ化フロアプランで運用する能力は制限されている。
本研究では,シーンの再構成された3次元表現にタスクを接地することで,野生環境におけるフロアプランのローカライズを行う手法を提案する。
制約のない画像の収集を前提として,重力に整合した3次元シーンを再構成し,フロアプランプロキシとして機能する2次元密度マップに投影する。
フロアプランのローカライゼーションは、このプロキシと入力フロアプランを2次元類似変換によって整列するものとして定式化される。
密度マップと建築フロアプラン間の外観ギャップを埋めるために,2次元基礎モデルを用いて相互対応を学習し,構造的整合性を維持しつつ意味的に整合したマッチングを促進する微調整スキームを導入する。
大規模な実験は、単一の入力画像の少ない非常にスパースな設定を含む、以前の方法よりも大幅に改善されている。
コードとデータは公開されます。
関連論文リスト
- PLANA3R: Zero-shot Metric Planar 3D Reconstruction via Feed-Forward Planar Splatting [56.188624157291024]
提案するPLANA3Rは,提案しない2次元画像から平面3次元再構成を計測するためのポーズレスフレームワークである。
トレーニング中に3次元平面アノテーションを必要とする以前のフィードフォワード法とは異なり、PLANA3Rは明確な平面監督なしで平面3次元構造を学習する。
本研究は,複数の室内環境データセットに対するPLANA3Rの有効性を検証するとともに,領域外屋内環境への強力な一般化を実証する。
論文 参考訳(メタデータ) (2025-10-21T15:15:33Z) - Perspective from a Higher Dimension: Can 3D Geometric Priors Help Visual Floorplan Localization? [8.82283453148819]
建物のフロアプランの自己ローカライズは研究者の興味を引き付けている。
フロアプランは建物の構造を最小限に表現するので、視覚的知覚とフロアプランの様相や幾何学的差異がこの課題に挑戦する。
既存の手法では、2次元幾何学的特徴とポーズフィルタを巧みに利用して有望な性能を実現する。
本稿では,2次元フロアプランの局所化問題を視覚的FLOCアルゴリズムに3次元幾何学的先行点を注入することにより高次元から考察する。
論文 参考訳(メタデータ) (2025-07-25T01:34:26Z) - Supercharging Floorplan Localization with Semantic Rays [11.68879796145804]
本稿では,深度とセマンティック線を共同で推定する意味認識フレームワークを提案する。
提案手法は最先端の手法よりも大幅に優れており,従来の手法と比較して,リコール基準の大幅な改善を実現している。
論文 参考訳(メタデータ) (2025-07-12T14:01:54Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - SGAligner : 3D Scene Alignment with Scene Graphs [84.01002998166145]
3Dシーングラフの構築は、いくつかの具体的AIアプリケーションのためのシーン表現のトピックとして登場した。
オーバーラップ可能な3次元シーングラフのペアをゼロから部分的に整列させるという基本的な問題に着目する。
そこで我々はSGAlignerを提案する。SGAlignerは3次元シーングラフのペアを組合わせるための最初の方法であり、その組込みシナリオに対して堅牢である。
論文 参考訳(メタデータ) (2023-04-28T14:39:22Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Scan2Plan: Efficient Floorplan Generation from 3D Scans of Indoor Scenes [9.71137838903781]
Scan2Planは,室内環境の構造要素の3次元スキャンから,フロアプランを正確に推定するための新しい手法である。
提案手法は、初期ステージがシーンの無秩序な点雲をクラスタリングする2段階のアプローチを取り入れたものである。
その後の段階では、各部屋について単純なポリゴンによってパラメータ化された閉周を推定する。
最後のフロアプランは、グローバル・コーディネート・システムにおけるすべての部屋周計の集合である。
論文 参考訳(メタデータ) (2020-03-16T17:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。