論文の概要: iBARLE: imBalance-Aware Room Layout Estimation
- arxiv url: http://arxiv.org/abs/2308.15050v1
- Date: Tue, 29 Aug 2023 06:20:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 15:41:58.854032
- Title: iBARLE: imBalance-Aware Room Layout Estimation
- Title(参考訳): iBARLE: imBalance-Aware Room Layout Estimation
- Authors: Taotao Jing, Lichen Wang, Naji Khosravan, Zhiqiang Wan, Zachary
Bessinger, Zhengming Ding, Sing Bing Kang
- Abstract要約: ルームレイアウト推定は、1つのパノラマからレイアウトを予測する。
実際のデータセットには、レイアウトの複雑さの次元、カメラの位置、シーンの外観の変化など、大きな不均衡がある。
これらの問題に対処するために, imBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。
iBARLEは、(1)外観変化生成(AVG)モジュール、(2)複合構造混合(CSMix)モジュール、(3)勾配に基づくレイアウト目的関数からなる。
- 参考スコア(独自算出の注目度): 54.819085005591894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Room layout estimation predicts layouts from a single panorama. It requires
datasets with large-scale and diverse room shapes to train the models. However,
there are significant imbalances in real-world datasets including the
dimensions of layout complexity, camera locations, and variation in scene
appearance. These issues considerably influence the model training performance.
In this work, we propose the imBalance-Aware Room Layout Estimation (iBARLE)
framework to address these issues. iBARLE consists of (1) Appearance Variation
Generation (AVG) module, which promotes visual appearance domain
generalization, (2) Complex Structure Mix-up (CSMix) module, which enhances
generalizability w.r.t. room structure, and (3) a gradient-based layout
objective function, which allows more effective accounting for occlusions in
complex layouts. All modules are jointly trained and help each other to achieve
the best performance. Experiments and ablation studies based on
ZInD~\cite{cruz2021zillow} dataset illustrate that iBARLE has state-of-the-art
performance compared with other layout estimation baselines.
- Abstract(参考訳): 部屋レイアウト推定は、1つのパノラマからレイアウトを予測する。
モデルのトレーニングには大規模で多様な部屋形状のデータセットが必要である。
しかし、レイアウトの複雑さ、カメラの位置、シーンの外観の変化など、実際のデータセットには大きな不均衡がある。
これらの問題はモデルトレーニングのパフォーマンスに大きな影響を与えます。
そこで本研究では,ImBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。
iBARLEは,(1)外観領域の一般化を促進する外観変化生成(AVG)モジュール,(2)複合構造混合(CSMix)モジュール,(3)複雑なレイアウトにおけるオクルージョンをより効果的に説明できる勾配に基づくレイアウト目的関数から構成される。
すべてのモジュールは共同でトレーニングされ、最高のパフォーマンスを達成するのに役立ちます。
ZInD~\cite{cruz2021zillow}データセットに基づく実験とアブレーション研究は、iBARLEが他のレイアウト推定ベースラインと比較して最先端の性能を持っていることを示している。
関連論文リスト
- Towards Aligned Layout Generation via Diffusion Model with Aesthetic
Constraints [51.48125123822496]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and
Multi-view Geometric Consistency Perception [60.23832277827669]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元する傾向がある。
水平深度と比表現に適した教師なし適応手法を提案する。
また,決定レベルのレイアウト解析のための最適化手法と,特徴レベルのマルチビューアグリゲーションのための1次元コストボリューム構築手法も導入する。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Towards Robust and Expressive Whole-body Human Pose and Shape Estimation [51.457517178632756]
全体のポーズと形状の推定は、単眼画像から人体全体の異なる振る舞いを共同で予測することを目的としている。
既存の手法では、既存のシナリオの複雑さの下で、しばしば劣化したパフォーマンスを示す。
全身のポーズと形状推定の堅牢性を高める新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-12-14T08:17:42Z) - RGM: A Robust Generalist Matching Model [53.223624323416914]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - RoomDesigner: Encoding Anchor-latents for Style-consistent and
Shape-compatible Indoor Scene Generation [26.906174238830474]
室内シーン生成は、空間的に合理的なレイアウトで形状に整合したスタイルの家具配置を作成することを目的としている。
家具をアンカーラテント表現としてエンコードすることで,形状先行を室内シーン生成に組み込む2段階モデルを提案する。
論文 参考訳(メタデータ) (2023-10-16T03:05:19Z) - Towards Unseen Triples: Effective Text-Image-joint Learning for Scene
Graph Generation [30.79358827005448]
SGG(Scene Graph Generation)は、画像内のオブジェクトとその接続を構造的かつ包括的に表現することを目的としている。
既存のSGGモデルは、バイアス付きデータセットによって引き起こされる長い尾の問題を解決するのに苦労することが多い。
テキスト画像結合Scene Graph Generation (TISGG) モデルを提案する。
論文 参考訳(メタデータ) (2023-06-23T10:17:56Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - End-to-end Generative Floor-plan and Layout with Attributes and Relation
Graph [6.259404056725123]
インテリアシーン合成のための家具レイアウトをランダムベクターから作成するためのエンドエンドモデルを提案する。
提案モデルは部屋の条件付きフロアプランモジュールと部屋の条件付きグラフィカルフロアプランモジュールと条件付きレイアウトモジュールを組み合わせたものである。
我々は,プロのデザイナーによる191208ドルのデザインを含む,現実世界のレイアウトデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-12-15T07:37:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。