論文の概要: No More Ambiguity in 360° Room Layout via Bi-Layout Estimation
- arxiv url: http://arxiv.org/abs/2404.09993v1
- Date: Mon, 15 Apr 2024 17:59:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-17 21:08:18.051461
- Title: No More Ambiguity in 360° Room Layout via Bi-Layout Estimation
- Title(参考訳): バイレイアウト推定による360度ルームレイアウトの非曖昧性
- Authors: Yu-Ju Tsai, Jin-Cheng Jhang, Jingjing Zheng, Wei Wang, Albert Y. C. Chen, Min Sun, Cheng-Hao Kuo, Ming-Hsuan Yang,
- Abstract要約: レイアウトアノテーションの曖昧さは、正確な360度空間レイアウト推定を開発する上で大きな課題となる。
本稿では、2つの異なるレイアウトタイプを予測できる新しいBi-liaモデルを提案する。
- 参考スコア(独自算出の注目度): 49.371570776130355
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inherent ambiguity in layout annotations poses significant challenges to developing accurate 360{\deg} room layout estimation models. To address this issue, we propose a novel Bi-Layout model capable of predicting two distinct layout types. One stops at ambiguous regions, while the other extends to encompass all visible areas. Our model employs two global context embeddings, where each embedding is designed to capture specific contextual information for each layout type. With our novel feature guidance module, the image feature retrieves relevant context from these embeddings, generating layout-aware features for precise bi-layout predictions. A unique property of our Bi-Layout model is its ability to inherently detect ambiguous regions by comparing the two predictions. To circumvent the need for manual correction of ambiguous annotations during testing, we also introduce a new metric for disambiguating ground truth layouts. Our method demonstrates superior performance on benchmark datasets, notably outperforming leading approaches. Specifically, on the MatterportLayout dataset, it improves 3DIoU from 81.70% to 82.57% across the full test set and notably from 54.80% to 59.97% in subsets with significant ambiguity. Project page: https://liagm.github.io/Bi_Layout/
- Abstract(参考訳): レイアウトアノテーションの不明瞭さは、正確な360{\deg}ルームレイアウト推定モデルを開発する上で大きな課題となる。
この問題に対処するために,2つの異なるレイアウトタイプを予測可能な新しいBi-Layoutモデルを提案する。
1つはあいまいな領域に留まり、もう1つは目に見える全ての領域に広がる。
我々のモデルは2つのグローバルなコンテキスト埋め込みを用いており、それぞれの埋め込みは、レイアウトタイプごとに特定のコンテキスト情報をキャプチャするために設計されている。
新たな特徴誘導モジュールにより、画像機能は、これらの埋め込みから関連するコンテキストを検索し、正確なバイレイアウト予測のためのレイアウト認識機能を生成する。
我々のBi-Layoutモデルの特徴は、この2つの予測を比較することによって、本質的に曖昧な領域を検出する能力である。
テスト中に曖昧なアノテーションを手動で修正する必要性を回避するため,地中真実のレイアウトを曖昧にするための新しい指標も導入する。
提案手法は,ベンチマークデータセット上での優れた性能,特に先行するアプローチよりも優れた性能を示す。
具体的には、MatterportLayoutデータセットでは、3DIoUを81.70%から82.57%に改善し、特に曖昧さのあるサブセットでは54.80%から59.97%に改善している。
プロジェクトページ: https://liagm.github.io/Bi_Layout/
関連論文リスト
- A Parse-Then-Place Approach for Generating Graphic Layouts from Textual
Descriptions [50.469491454128246]
我々は、図形レイアウト、すなわちテキストからラベルへのレイアウトを作成するためのガイダンスとしてテキストを使用し、設計障壁を低くすることを目的としています。
テキストからラベルへの変換は、テキストからの暗黙的、複合的、不完全な制約を考慮する必要があるため、難しい作業である。
この問題に対処するための2段階のアプローチとして,パース・セイン・プレース(parse-then-place)を提案する。
論文 参考訳(メタデータ) (2023-08-24T10:37:00Z) - Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation [147.81509219686419]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。
次に,新しいベースラインであるIterInpaintを提案する。
本研究はIterInpaintに関する総合的アブレーション研究である。
論文 参考訳(メタデータ) (2023-04-13T16:58:33Z) - PosterLayout: A New Benchmark and Approach for Content-aware
Visual-Textual Presentation Layout [62.12447593298437]
コンテンツ対応視覚テキスト提示レイアウトは,所定のキャンバス上の空間空間を予め定義された要素にアレンジすることを目的としている。
本稿では,設計過程を模倣するためにレイアウトの要素を再編成する設計シーケンス形成(DSF)を提案する。
CNN-LSTMに基づく新しい条件生成対向ネットワーク(GAN)を提示し、適切なレイアウトを生成する。
論文 参考訳(メタデータ) (2023-03-28T12:48:36Z) - LayoutDiffusion: Improving Graphic Layout Generation by Discrete
Diffusion Probabilistic Models [50.73105631853759]
レイアウト自動生成のための新しい生成モデルLayoutDiffusionを提案する。
このプロセスでは,前方ステップの成長に伴うレイアウトの混乱が増している。
これにより、プラグアンドプレイ方式で2つの条件付きレイアウト生成タスクを再トレーニングすることなく実現し、既存の方法よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-21T04:41:02Z) - 360-MLC: Multi-view Layout Consistency for Self-training and
Hyper-parameter Tuning [40.93848397359068]
モノクラールームモデルを微調整するための多視点レイアウト整合性に基づく自己学習手法である360-MLCを提案する。
我々は,複数のレイアウト推定におけるエントロピー情報を定量的な指標として活用し,シーンの幾何的整合性を測定する。
論文 参考訳(メタデータ) (2022-10-24T03:31:48Z) - Self-supervised 360$^{\circ}$ Room Layout Estimation [20.062713286961326]
ラベル付きデータを使わずにパノラマ的な部屋配置推定モデルを訓練するための,最初の自己教師方式を提案する。
弊社のアプローチでは、データ共有シナリオとアクティブラーニングにおける有望なソリューションも示しています。
論文 参考訳(メタデータ) (2022-03-30T04:58:07Z) - RoomStructNet: Learning to Rank Non-Cuboidal Room Layouts From Single
View [7.427006214471801]
そこで本研究では,部屋のレイアウトを単一画像から推定する手法を提案する。
提案手法では,最適化を使わずに最終的なレイアウトを推定するために,追加のランキング関数を学習する。
提案手法は,主に立方体配置を持つ標準データセットの最先端結果を示すとともに,非立方体レイアウトを持つ部屋を含むデータセット上でも良好に動作することを示す。
論文 参考訳(メタデータ) (2021-10-01T20:42:49Z) - LayoutTransformer: Layout Generation and Completion with Self-attention [105.21138914859804]
画像やモバイルアプリケーション,ドキュメント,3Dオブジェクトなど,さまざまな領域におけるシーンレイアウト生成の問題に対処する。
レイアウト要素間のコンテキスト的関係を学習するために,自己意識を活用する新しいフレームワークであるLayoutTransformerを提案する。
私たちのフレームワークでは、空のセットから、あるいはプリミティブの最初のシードセットから、新しいレイアウトを生成することができ、レイアウト毎に任意のプリミティブをサポートするために簡単にスケールすることができます。
論文 参考訳(メタデータ) (2020-06-25T17:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。