論文の概要: Polygon Detection for Room Layout Estimation using Heterogeneous Graphs
and Wireframes
- arxiv url: http://arxiv.org/abs/2306.12203v1
- Date: Wed, 21 Jun 2023 11:55:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 13:39:37.849713
- Title: Polygon Detection for Room Layout Estimation using Heterogeneous Graphs
and Wireframes
- Title(参考訳): 不均一グラフとワイヤフレームを用いた部屋レイアウト推定のためのポリゴン検出
- Authors: David Gillsj\"o, Gabrielle Flood, Kalle {\AA}str\"om
- Abstract要約: 本稿では,部屋配置推定タスクを解くネットワーク手法を提案する。
ネットワークはRGB画像を撮り、ワイヤーフレームと時間ガラスのバックボーンを使ってスペースを推定する。
- 参考スコア(独自算出の注目度): 2.76240219662896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a neural network based semantic plane detection method
utilizing polygon representations. The method can for example be used to solve
room layout estimations tasks. The method is built on, combines and further
develops several different modules from previous research. The network takes an
RGB image and estimates a wireframe as well as a feature space using an
hourglass backbone. From these, line and junction features are sampled. The
lines and junctions are then represented as an undirected graph, from which
polygon representations of the sought planes are obtained. Two different
methods for this last step are investigated, where the most promising method is
built on a heterogeneous graph transformer. The final output is in all cases a
projection of the semantic planes in 2D. The methods are evaluated on the
Structured 3D dataset and we investigate the performance both using sampled and
estimated wireframes. The experiments show the potential of the graph-based
method by outperforming state of the art methods in Room Layout estimation in
the 2D metrics using synthetic wireframe detections.
- Abstract(参考訳): 本稿では,ポリゴン表現を用いたニューラルネットワークに基づく意味平面検出手法を提案する。
この方法は例えば、部屋配置推定タスクの解決に使用することができる。
この手法は、以前の研究からいくつかの異なるモジュールを構築、組み合わせ、さらに開発する。
ネットワークはRGBの画像を撮り、ワイヤーフレームと時間ガラスのバックボーンを使って特徴空間を推定する。
これらから、ラインとジャンクションの機能をサンプリングする。
直線と接合は無向グラフとして表現され、そこから求めた平面の多角形表現が得られる。
この最後のステップでは、2つの異なる手法が検討され、最も有望な方法は不均一なグラフ変換器上に構築される。
最終的な出力は、すべての場合、2Dにおける意味平面の射影である。
提案手法は構造化3次元データセット上で評価され,サンプルおよび推定ワイヤフレームを用いて性能を検証した。
実験では, 合成ワイヤフレーム検出を用いた2次元計測において, 室内レイアウト推定におけるアートメソッドの状態を上回ることで, グラフベース手法の可能性を示す。
関連論文リスト
- Boundary Detection Algorithm Inspired by Locally Linear Embedding [8.259071011958254]
本稿では,広く使用されている局所的線形埋め込みアルゴリズムにインスパイアされた境界点検出手法を提案する。
本手法は,2つの近傍探索スキーム($epsilon$-radius ball scheme)と$K$-nearest neighbor scheme($K$-nearest neighbor scheme)を用いて実装する。
論文 参考訳(メタデータ) (2024-06-26T16:05:57Z) - Contour Context: Abstract Structural Distribution for 3D LiDAR Loop
Detection and Metric Pose Estimation [31.968749056155467]
本稿では,高精度な3DoF距離ポーズ推定を用いた簡易かつ効果的かつ効率的なトポロジカルループ閉包検出パイプラインを提案する。
我々は,3次元LiDAR点から投影されるBEV像を構造層分布として解釈する。
検索キーは、層状KD木でインデックスされたデータベースの検索を高速化するように設計されている。
論文 参考訳(メタデータ) (2023-02-13T07:18:24Z) - Monocular Road Planar Parallax Estimation [25.36368935789501]
乾燥可能な表面および周囲環境の3次元構造を推定することは、補助的かつ自律的な運転にとって重要な課題である。
単眼画像からの3Dセンシングのための新しいディープニューラルネットワークであるRoad Planar Parallax Attention Network (RPANet)を提案する。
RPANetは、路面のホモグラフィに整列した一対の画像を入力として取り、3D再構成のための$gamma$mapを出力する。
論文 参考訳(メタデータ) (2021-11-22T10:03:41Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - Holistically-Attracted Wireframe Parsing [123.58263152571952]
本稿では,入力画像中のベクトル化ワイヤフレームを1つのフォワードパスで検出する高速で類似的な解析手法を提案する。
提案手法は, (i) ラインセグメントとジャンクション提案生成, (ii) ラインセグメントとジャンクションマッチング, (iii) ラインセグメントとジャンクション検証の3つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2020-03-03T17:43:57Z) - From Planes to Corners: Multi-Purpose Primitive Detection in Unorganized
3D Point Clouds [59.98665358527686]
直交平面の分割自由結合推定法を提案する。
このような統合されたシーン探索は、セマンティックプレーンの検出や局所的およびグローバルなスキャンアライメントといった、多目的のアプリケーションを可能にする。
本実験は,壁面検出から6次元トラッキングに至るまで,様々なシナリオにおいて,我々のアプローチの有効性を実証するものである。
論文 参考訳(メタデータ) (2020-01-21T06:51:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。