論文の概要: RoomStructNet: Learning to Rank Non-Cuboidal Room Layouts From Single
View
- arxiv url: http://arxiv.org/abs/2110.00644v1
- Date: Fri, 1 Oct 2021 20:42:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 15:35:10.825225
- Title: RoomStructNet: Learning to Rank Non-Cuboidal Room Layouts From Single
View
- Title(参考訳): RoomStructNet: 単一視点から非立方体ルームレイアウトのランク付けを学ぶ
- Authors: Xi Zhang, Chun-Kai Wang, Kenan Deng, Tomas Yago-Vicente, Himanshu
Arora
- Abstract要約: そこで本研究では,部屋のレイアウトを単一画像から推定する手法を提案する。
提案手法では,最適化を使わずに最終的なレイアウトを推定するために,追加のランキング関数を学習する。
提案手法は,主に立方体配置を持つ標準データセットの最先端結果を示すとともに,非立方体レイアウトを持つ部屋を含むデータセット上でも良好に動作することを示す。
- 参考スコア(独自算出の注目度): 7.427006214471801
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we present a new approach to estimate the layout of a room
from its single image. While recent approaches for this task use robust
features learnt from data, they resort to optimization for detecting the final
layout. In addition to using learnt robust features, our approach learns an
additional ranking function to estimate the final layout instead of using
optimization. To learn this ranking function, we propose a framework to train a
CNN using max-margin structure cost. Also, while most approaches aim at
detecting cuboidal layouts, our approach detects non-cuboidal layouts for which
we explicitly estimates layout complexity parameters. We use these parameters
to propose layout candidates in a novel way. Our approach shows
state-of-the-art results on standard datasets with mostly cuboidal layouts and
also performs well on a dataset containing rooms with non-cuboidal layouts.
- Abstract(参考訳): 本稿では,部屋のレイアウトを単一の画像から推定する新しい手法を提案する。
このタスクの最近のアプローチでは、データから学んだ堅牢な機能を使っているが、最終的なレイアウトを検出する最適化に頼っている。
学習した頑健な機能に加えて,最適化ではなく最終レイアウトを推定するためのランキング関数も提案する。
このランキング関数を学習するために,最大構造コストを用いてCNNを訓練するフレームワークを提案する。
また,ほとんどの手法は立方体レイアウトの検出を目標としているが,本手法では,レイアウト複雑性パラメータを明示的に推定する非立方体レイアウトを検出する。
これらのパラメータを用いてレイアウト候補を新しい方法で提案する。
提案手法は,主に立方体レイアウトを持つ標準データセットの最先端の結果を示し,非立方体レイアウトの部屋を含むデータセット上でも良好に機能する。
関連論文リスト
- 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - ERNIE-Layout: Layout Knowledge Enhanced Pre-training for Visually-rich
Document Understanding [52.3895498789521]
レイアウト知識を向上した新しい文書事前学習ソリューションであるERNIEを提案する。
まず、直列化段階で入力シーケンスを並べ替え、相関的な事前学習タスクを示し、順序予測を行い、文書の適切な読み順序を学習する。
実験の結果、ERNIEは様々な下流タスクにおいて優れた性能を示し、キー情報に新たな最先端設定、文書質問応答を実現している。
論文 参考訳(メタデータ) (2022-10-12T12:59:24Z) - MCTS with Refinement for Proposals Selection Games in Scene
Understanding [32.92475660892122]
本稿では,モンテカルロ木探索(MCTS)アルゴリズムを適用したシーン理解問題に適用可能な新しい手法を提案する。
提案手法は,提案された提案のプールから,目的語を最大化する提案を共同で選択し,最適化する。
本手法は,部屋配置に厳しい制約を加えることなく,Matterport3Dデータセット上で高い性能を示す。
論文 参考訳(メタデータ) (2022-07-07T10:15:54Z) - Learning Canonical Embedding for Non-rigid Shape Matching [36.85782408336389]
本稿では,非剛体形状マッチングのための標準埋め込みを学習する新しいフレームワークを提供する。
我々のフレームワークはエンドツーエンドで訓練されており、一般的に使用されているLaplace-Beltramiベースに関連する不安定性と制約を回避する。
論文 参考訳(メタデータ) (2021-10-06T18:09:13Z) - Graph-Embedded Subspace Support Vector Data Description [98.78559179013295]
一クラス分類のための新しいサブスペース学習フレームワークを提案する。
提案されたフレームワークはグラフ埋め込みという形で問題を提示する。
ベースラインに対する改善されたパフォーマンスと、最近提案された1クラス分類のためのサブスペース学習方法を示す。
論文 参考訳(メタデータ) (2021-04-29T14:30:48Z) - RackLay: Multi-Layer Layout Estimation for Warehouse Racks [17.937062635570268]
本稿では,単一の画像からリアルタイム棚配置推定を行うディープニューラルネットワークracklayを提案する。
racklayは、オブジェクトがポピュレートされたラック内の各棚のトップビューとフロントビューのレイアウトを見積もっている。
また、トップビューとフロントビューの融合により、考慮されたラックの計量自由空間推定などの3D推論アプリケーションを可能にすることも示しています。
論文 参考訳(メタデータ) (2021-03-16T16:22:31Z) - Scene Graph to Image Generation with Contextualized Object Layout
Refinement [92.85331019618332]
シーングラフから画像を生成する新しい手法を提案する。
提案手法では,レイアウトのカバレッジを約20ポイント向上し,オブジェクトの重複量を無視できる量に削減する。
論文 参考訳(メタデータ) (2020-09-23T06:27:54Z) - DrNAS: Dirichlet Neural Architecture Search [88.56953713817545]
ディリクレ分布をモデルとした連続緩和型混合重みをランダム変数として扱う。
最近開発されたパスワイズ微分により、ディリクレパラメータは勾配に基づく一般化で容易に最適化できる。
微分可能なNASの大きなメモリ消費を軽減するために, 単純かつ効果的な進行学習方式を提案する。
論文 参考訳(メタデータ) (2020-06-18T08:23:02Z) - Scan2Plan: Efficient Floorplan Generation from 3D Scans of Indoor Scenes [9.71137838903781]
Scan2Planは,室内環境の構造要素の3次元スキャンから,フロアプランを正確に推定するための新しい手法である。
提案手法は、初期ステージがシーンの無秩序な点雲をクラスタリングする2段階のアプローチを取り入れたものである。
その後の段階では、各部屋について単純なポリゴンによってパラメータ化された閉周を推定する。
最後のフロアプランは、グローバル・コーディネート・システムにおけるすべての部屋周計の集合である。
論文 参考訳(メタデータ) (2020-03-16T17:59:41Z) - General 3D Room Layout from a Single View by Render-and-Compare [36.94817376590415]
一つの視点から部屋の3次元レイアウトを再構築する新しい手法を提案する。
データセットはScanNetの293の画像で構成されており、正確な3Dレイアウトで注釈を付けました。
論文 参考訳(メタデータ) (2020-01-07T16:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。