論文の概要: GeoLayout: Geometry Driven Room Layout Estimation Based on Depth Maps of
Planes
- arxiv url: http://arxiv.org/abs/2008.06286v1
- Date: Fri, 14 Aug 2020 10:34:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:29:22.214870
- Title: GeoLayout: Geometry Driven Room Layout Estimation Based on Depth Maps of
Planes
- Title(参考訳): GeoLayout: 平面の深さマップに基づく幾何駆動型ルームレイアウト推定
- Authors: Weidong Zhang, Wei Zhang and Yinda Zhang
- Abstract要約: レイアウト推定のための深層学習に幾何学的推論を取り入れることを提案する。
提案手法では,画素レベルの表面パラメータを推定することにより,シーン内の支配面の深さマップを推測する。
支配平面の画素レベル深度アノテーションを用いた新しいデータセットを提案する。
- 参考スコア(独自算出の注目度): 18.900646770506256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of room layout estimation is to locate the wall-floor, wall-ceiling,
and wall-wall boundaries. Most recent methods solve this problem based on
edge/keypoint detection or semantic segmentation. However, these approaches
have shown limited attention on the geometry of the dominant planes and the
intersection between them, which has significant impact on room layout. In this
work, we propose to incorporate geometric reasoning to deep learning for layout
estimation. Our approach learns to infer the depth maps of the dominant planes
in the scene by predicting the pixel-level surface parameters, and the layout
can be generated by the intersection of the depth maps. Moreover, we present a
new dataset with pixel-level depth annotation of dominant planes. It is larger
than the existing datasets and contains both cuboid and non-cuboid rooms.
Experimental results show that our approach produces considerable performance
gains on both 2D and 3D datasets.
- Abstract(参考訳): 部屋のレイアウト推定のタスクは、壁床、壁壁、壁壁の境界を見つけることである。
最近の手法では、エッジ/キーポイント検出やセマンティックセグメンテーションに基づいてこの問題を解決する。
しかし、これらのアプローチは支配的な平面の幾何学とそれらの間の交叉に限定的な関心を示しており、部屋のレイアウトに大きな影響を与えている。
本研究では,レイアウト推定のための幾何学的推論を深層学習に組み込むことを提案する。
本手法では,画素レベルの表面パラメータを予測することにより,シーン内の支配面の深度マップを推定し,深度マップの交叉によってレイアウトを生成する。
さらに,支配平面の画素レベル深度アノテーションを用いた新しいデータセットを提案する。
既存のデータセットよりも大きく、立方体室と非立方体室の両方を含んでいる。
実験結果から,本手法は2次元データセットと3次元データセットの両方でかなりの性能向上を示した。
関連論文リスト
- Ground Plane Matters: Picking Up Ground Plane Prior in Monocular 3D
Object Detection [92.75961303269548]
先行する地平面は、モノクル3次元物体検出(M3OD)における非常に情報的な幾何学的手がかりである
本稿では,両問題を一度に解決するGPENetを提案する。
我々のGPENetは、他の手法よりも優れ、最先端のパフォーマンスを実現し、提案手法の有効性と優位性を示すことができる。
論文 参考訳(メタデータ) (2022-11-03T02:21:35Z) - 3D Room Layout Estimation from a Cubemap of Panorama Image via Deep
Manhattan Hough Transform [17.51123287432334]
学習可能なハフ変換ブロックにおける長距離幾何学的パターンをモデル化することにより、3次元空間の壁面を推定する別の手法を提案する。
我々は、この特徴を立方体写像タイルからマンハッタン世界のハフ空間に変換し、その特徴を直接幾何学的出力にマッピングする。
畳み込み層は局所勾配のような線の特徴を学習するだけでなく、グローバル情報を利用して単純なネットワーク構造で閉塞壁を予測する。
論文 参考訳(メタデータ) (2022-07-19T14:22:28Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Depth Completion using Geometry-Aware Embedding [22.333381291860498]
本稿では,幾何認識の埋め込みを効率的に学習する手法を提案する。
局所的および大域的な幾何学的構造情報を、例えば、シーンレイアウト、オブジェクトのサイズと形状などの3Dポイントから符号化し、深度推定を導く。
論文 参考訳(メタデータ) (2022-03-21T12:06:27Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Monocular Road Planar Parallax Estimation [25.36368935789501]
乾燥可能な表面および周囲環境の3次元構造を推定することは、補助的かつ自律的な運転にとって重要な課題である。
単眼画像からの3Dセンシングのための新しいディープニューラルネットワークであるRoad Planar Parallax Attention Network (RPANet)を提案する。
RPANetは、路面のホモグラフィに整列した一対の画像を入力として取り、3D再構成のための$gamma$mapを出力する。
論文 参考訳(メタデータ) (2021-11-22T10:03:41Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - Depth Completion using Piecewise Planar Model [94.0808155168311]
深度マップは一連の学習された基底で表現することができ、閉じた解法で効率的に解ける。
しかし、この方法の1つの問題は、色境界が深さ境界と矛盾する場合にアーチファクトを生成することである。
私たちは、より厳密な深度回復モデルを実行します。
論文 参考訳(メタデータ) (2020-12-06T07:11:46Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。