論文の概要: Disentangling Orthogonal Planes for Indoor Panoramic Room Layout
Estimation with Cross-Scale Distortion Awareness
- arxiv url: http://arxiv.org/abs/2303.00971v2
- Date: Sat, 4 Mar 2023 02:48:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 12:19:30.490705
- Title: Disentangling Orthogonal Planes for Indoor Panoramic Room Layout
Estimation with Cross-Scale Distortion Awareness
- Title(参考訳): クロススケール歪みを考慮した室内パノラマルームレイアウト推定のための直交面の分離
- Authors: Zhijie Shen, Zishuo Zheng, Chunyu Lin, Lang Nie, Kang Liao, Shuai
Zheng and Yao Zhao
- Abstract要約: 複素シーンから平面を前分割することで1次元表現を解き放つことを提案する。
床の境界と天井の境界の対称性を考えると,ソフトフリップ融合戦略も設計する。
4つの人気のあるベンチマークの実験は、既存のSoTAソリューションよりも優れていることを示している。
- 参考スコア(独自算出の注目度): 38.096482841789275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Based on the Manhattan World assumption, most existing indoor layout
estimation schemes focus on recovering layouts from vertically compressed 1D
sequences. However, the compression procedure confuses the semantics of
different planes, yielding inferior performance with ambiguous
interpretability.
To address this issue, we propose to disentangle this 1D representation by
pre-segmenting orthogonal (vertical and horizontal) planes from a complex
scene, explicitly capturing the geometric cues for indoor layout estimation.
Considering the symmetry between the floor boundary and ceiling boundary, we
also design a soft-flipping fusion strategy to assist the pre-segmentation.
Besides, we present a feature assembling mechanism to effectively integrate
shallow and deep features with distortion distribution awareness. To compensate
for the potential errors in pre-segmentation, we further leverage triple
attention to reconstruct the disentangled sequences for better performance.
Experiments on four popular benchmarks demonstrate our superiority over
existing SoTA solutions, especially on the 3DIoU metric. The code is available
at \url{https://github.com/zhijieshen-bjtu/DOPNet}.
- Abstract(参考訳): マンハッタン世界想定に基づき、既存の屋内レイアウト推定スキームのほとんどは、垂直圧縮された1dシーケンスからレイアウトを復元することに焦点を当てている。
しかし、圧縮手順は異なる平面のセマンティクスを混乱させ、不明瞭な解釈性で劣る性能をもたらす。
そこで本研究では, 複雑なシーンから直交面(垂直面と水平面)を事前セグメンテーションし, 室内レイアウト推定のための幾何学的手がかりを明示的に捉えることにより, この1次元表現を解消する。
床の境界と天井の境界の対称性を考慮し,プレセグメンテーションを支援するソフトフリップ融合戦略を設計する。
さらに,浅層・深部の特徴と歪み分布認識を効果的に統合する機能組立機構を提案する。
プレセグメンテーションにおける潜在的なエラーを補うために,さらに3重の注意を生かして,絡み合ったシーケンスを再構築し,性能を向上する。
4つの人気のあるベンチマークの実験は、既存のSoTAソリューション、特に3DIoUメトリックよりも優れていることを示している。
コードは \url{https://github.com/zhijieshen-bjtu/dopnet} で入手できる。
関連論文リスト
- 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - PlaneDepth: Self-supervised Depth Estimation via Orthogonal Planes [41.517947010531074]
複数の前頭平行面に基づく深度推定は、自己教師付き単眼深度推定(MDE)において顕著な結果を示した
本研究では,垂直面と接地面を含む新しい平面ベースプレゼンテーションであるPlaneDepthを提案する。
本手法は, 自律走行において重要な, 教師なしの方法で地上面を抽出することができる。
論文 参考訳(メタデータ) (2022-10-04T13:51:59Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Transferable End-to-end Room Layout Estimation via Implicit Encoding [34.99591465853653]
一つのパノラマ画像から部屋のレイアウトを推定する問題について検討する。
入力パノラマ画像からパラメトリックレイアウトを直接予測するエンドツーエンド手法を提案する。
論文 参考訳(メタデータ) (2021-12-21T16:33:14Z) - LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth
Rendering [59.63979143021241]
パノラマの地平線上での深度予測問題として360度レイアウト推定のタスクを定式化する。
レイアウトから深度予測への変換を区別できるように、差分可能な深度レンダリング手順を提案します。
提案手法は,360 レイアウトのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T15:48:41Z) - Plane Pair Matching for Efficient 3D View Registration [7.920114031312631]
室内シーンにおける重なり合う3次元ビュー間の動き行列を推定する新しい手法を提案する。
マンハッタンの世界仮定を用いて、平面の四角形の下での軽量な幾何学的制約を問題に導入する。
我々は,玩具の例にアプローチを検証し,最近の最先端手法と比較し,公開RGB-Dデータセットの定量的実験を行った。
論文 参考訳(メタデータ) (2020-01-20T11:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。