論文の概要: 360-DFPE: Leveraging Monocular 360-Layouts for Direct Floor Plan
Estimation
- arxiv url: http://arxiv.org/abs/2112.06180v1
- Date: Sun, 12 Dec 2021 08:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 17:09:13.577659
- Title: 360-DFPE: Leveraging Monocular 360-Layouts for Direct Floor Plan
Estimation
- Title(参考訳): 360-DFPE: 直接床計画推定のための単分子360レイアウトの活用
- Authors: Bolivar Solarte, Yueh-Cheng Liu, Chin-Hsuan Wu, Yi-Hsuan Tsai, Min Sun
- Abstract要約: 能動センサや3D情報に頼ることなく,360-DFPEを直接入力として利用するシーケンシャルフロアプラン推定法である360-DFPEを提案する。
以上の結果から, 現状のアルゴリズムに対して, 単分子解が良好な性能を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 43.56963653723287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present 360-DFPE, a sequential floor plan estimation method that directly
takes 360-images as input without relying on active sensors or 3D information.
Our approach leverages a loosely coupled integration between a monocular visual
SLAM solution and a monocular 360-room layout approach, which estimate camera
poses and layout geometries, respectively. Since our task is to sequentially
capture the floor plan using monocular images, the entire scene structure, room
instances, and room shapes are unknown. To tackle these challenges, we first
handle the scale difference between visual odometry and layout geometry via
formulating an entropy minimization process, which enables us to directly align
360-layouts without knowing the entire scene in advance. Second, to
sequentially identify individual rooms, we propose a novel room identification
algorithm that tracks every room along the camera exploration using geometry
information. Lastly, to estimate the final shape of the room, we propose a
shortest path algorithm with an iterative coarse-to-fine strategy, which
improves prior formulations with higher accuracy and faster run-time. Moreover,
we collect a new floor plan dataset with challenging large-scale scenes,
providing both point clouds and sequential 360-image information. Experimental
results show that our monocular solution achieves favorable performance against
the current state-of-the-art algorithms that rely on active sensors and require
the entire scene reconstruction data in advance. Our code and dataset will be
released soon.
- Abstract(参考訳): 360-dfpeは, アクティブセンサや3d情報に頼らずに, 直接入力として360度画像を取り込む, シーケンシャルなフロア計画推定手法である。
提案手法は,カメラのポーズとレイアウトのジオメトリを推定する単眼視SLAMソリューションと単眼360室レイアウトアプローチとの疎結合な統合を利用する。
単眼画像を用いたフロアプランの逐次把握が課題であるため,全シーン構造,部屋インスタンス,部屋形状が不明である。
これらの課題に取り組むために,まずエントロピー最小化プロセスを定式化することにより,視覚オドメトリとレイアウト形状のスケール差を処理し,シーン全体を事前に知ることなく360度のレイアウトを直接調整できる。
第2に,各部屋を逐次識別するために,幾何学的情報を用いて,カメラ探索中の各部屋を追跡する新しい部屋識別アルゴリズムを提案する。
最後に、室内の最終的な形状を推定するために、より高精度で高速な実行時間で事前定式化を改善する反復的粗大化戦略を用いた最短経路アルゴリズムを提案する。
さらに,大規模シーンに挑戦する新たなフロアプランデータセットを収集し,ポイントクラウドとシーケンシャルな360画像情報の両方を提供する。
実験結果から,本手法は,能動センサに頼ってシーン再構築データ全体を事前に必要とする最先端のアルゴリズムに対して,良好な性能が得られることが示された。
コードとデータセットはまもなくリリースされます。
関連論文リスト
- Self-supervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712539]
我々は、オブジェクトレベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークであるMAL-SPCを提案する。
私たちのMAL-SPCは3Dの完全な監視を一切必要とせず、各オブジェクトに1つの部分点クラウドを必要とするだけです。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - Sp2360: Sparse-view 360 Scene Reconstruction using Cascaded 2D Diffusion Priors [51.36238367193988]
潜時拡散モデル(LDM)を用いた360度3次元シーンのスパースビュー再構成に挑戦する。
SparseSplat360は,未完成の細部を埋めたり,新しいビューをクリーンにするために,インペイントとアーティファクト除去のカスケードを利用する手法である。
提案手法は,9つの入力ビューから360度映像全体を生成する。
論文 参考訳(メタデータ) (2024-05-26T11:01:39Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and
Multi-view Geometric Consistency Perception [60.23832277827669]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元する傾向がある。
水平深度と比表現に適した教師なし適応手法を提案する。
また,決定レベルのレイアウト解析のための最適化手法と,特徴レベルのマルチビューアグリゲーションのための1次元コストボリューム構築手法も導入する。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Monocular Spherical Depth Estimation with Explicitly Connected Weak
Layout Cues [27.15511982413305]
幾何的視覚(360V)データセットを生成し、複数のモジュラリティ、多視点ステレオデータ、そして、自動的に弱レイアウトキューを生成する。
我々は、深さに基づくレイアウトの再構築とレイアウトに基づく深さの注意に頼り、両方のタスクにまたがるパフォーマンスの向上を示す。
360度カメラで部屋をスキャンすることで、ファクシブルで素早く3Dスキャンする機会が生まれる。
論文 参考訳(メタデータ) (2022-06-22T20:10:45Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - Scan2Plan: Efficient Floorplan Generation from 3D Scans of Indoor Scenes [9.71137838903781]
Scan2Planは,室内環境の構造要素の3次元スキャンから,フロアプランを正確に推定するための新しい手法である。
提案手法は、初期ステージがシーンの無秩序な点雲をクラスタリングする2段階のアプローチを取り入れたものである。
その後の段階では、各部屋について単純なポリゴンによってパラメータ化された閉周を推定する。
最後のフロアプランは、グローバル・コーディネート・システムにおけるすべての部屋周計の集合である。
論文 参考訳(メタデータ) (2020-03-16T17:59:41Z) - A Fixation-based 360{\deg} Benchmark Dataset for Salient Object
Detection [21.314578493964333]
パノラマコンテンツ中の固定予測(FP)は、仮想現実(VR)アプリケーションの普及傾向とともに広く研究されている。
静止物体検出(SOD)は、実際のシーンを表すデータセットが欠如しているため、360度画像ではめったに探索されていない。
論文 参考訳(メタデータ) (2020-01-22T11:16:39Z) - General 3D Room Layout from a Single View by Render-and-Compare [36.94817376590415]
一つの視点から部屋の3次元レイアウトを再構築する新しい手法を提案する。
データセットはScanNetの293の画像で構成されており、正確な3Dレイアウトで注釈を付けました。
論文 参考訳(メタデータ) (2020-01-07T16:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。