Fugu-MT 論文翻訳(概要): iBARLE: imBalance-Aware Room Layout Estimation

論文の概要: iBARLE: imBalance-Aware Room Layout Estimation

arxiv url: http://arxiv.org/abs/2308.15050v1
Date: Tue, 29 Aug 2023 06:20:36 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-30 15:41:58.854032
Title: iBARLE: imBalance-Aware Room Layout Estimation
Title（参考訳）: iBARLE: imBalance-Aware Room Layout Estimation
Authors: Taotao Jing, Lichen Wang, Naji Khosravan, Zhiqiang Wan, Zachary Bessinger, Zhengming Ding, Sing Bing Kang
Abstract要約: ルームレイアウト推定は、1つのパノラマからレイアウトを予測する。実際のデータセットには、レイアウトの複雑さの次元、カメラの位置、シーンの外観の変化など、大きな不均衡がある。これらの問題に対処するために, imBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。 iBARLEは、(1)外観変化生成(AVG)モジュール、(2)複合構造混合(CSMix)モジュール、(3)勾配に基づくレイアウト目的関数からなる。
参考スコア（独自算出の注目度）: 54.819085005591894
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Room layout estimation predicts layouts from a single panorama. It requires datasets with large-scale and diverse room shapes to train the models. However, there are significant imbalances in real-world datasets including the dimensions of layout complexity, camera locations, and variation in scene appearance. These issues considerably influence the model training performance. In this work, we propose the imBalance-Aware Room Layout Estimation (iBARLE) framework to address these issues. iBARLE consists of (1) Appearance Variation Generation (AVG) module, which promotes visual appearance domain generalization, (2) Complex Structure Mix-up (CSMix) module, which enhances generalizability w.r.t. room structure, and (3) a gradient-based layout objective function, which allows more effective accounting for occlusions in complex layouts. All modules are jointly trained and help each other to achieve the best performance. Experiments and ablation studies based on ZInD~\cite{cruz2021zillow} dataset illustrate that iBARLE has state-of-the-art performance compared with other layout estimation baselines.
Abstract（参考訳）: 部屋レイアウト推定は、1つのパノラマからレイアウトを予測する。モデルのトレーニングには大規模で多様な部屋形状のデータセットが必要である。しかし、レイアウトの複雑さ、カメラの位置、シーンの外観の変化など、実際のデータセットには大きな不均衡がある。これらの問題はモデルトレーニングのパフォーマンスに大きな影響を与えます。そこで本研究では,ImBalance-Aware Room Layout Estimation (iBARLE) フレームワークを提案する。 iBARLEは,(1)外観領域の一般化を促進する外観変化生成(AVG)モジュール,(2)複合構造混合(CSMix)モジュール,(3)複雑なレイアウトにおけるオクルージョンをより効果的に説明できる勾配に基づくレイアウト目的関数から構成される。すべてのモジュールは共同でトレーニングされ、最高のパフォーマンスを達成するのに役立ちます。 ZInD~\cite{cruz2021zillow}データセットに基づく実験とアブレーション研究は、iBARLEが他のレイアウト推定ベースラインと比較して最先端の性能を持っていることを示している。

関連論文リスト

BADGR: Bundle Adjustment Diffusion Conditioned by GRadients for Wide-Baseline Floor Plan Reconstruction [9.490537585601395]
BADGRはリコンストラクションとバンドル調整(BA)を共同で行う新しい拡散モデルである BadGRは単一ステップのLeeenberg Marquardt(LM)からの高密度遠心率出力に条件付けされる実験と解析により提案手法の有効性を検証し,入力密度の異なる現状のポーズとフロアプランのレイアウトを著しく上回る結果を得た。
論文参考訳（メタデータ） (2025-03-25T04:15:20Z)
Ev-Layout: A Large-scale Event-based Multi-modal Dataset for Indoor Layout Estimation and Tracking [9.808718117070102]
本稿では,屋内レイアウト推定と追跡を目的とした大規模イベントベースマルチモーダルデータセットであるEv-を提案する。データセットは、771.3K RGBイメージと100億のイベントデータポイントを含む2.5Kシーケンスで構成されている。
論文参考訳（メタデータ） (2025-03-11T12:26:39Z)
ToLo: A Two-Stage, Training-Free Layout-To-Image Generation Framework For High-Overlap Layouts [2.799190378263432]
ToLoは、ハイオーバーラップレイアウトのための2段階のトレーニング不要なレイアウト・ツー・イメージ生成フレームワークである。 ToLoは,高オーバラップレイアウトを扱う場合,既存の手法の性能を大幅に向上させることを示す。
論文参考訳（メタデータ） (2025-03-03T15:41:51Z)
PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection [65.84604846389624]
我々は,より強力な単一点制御OODフレームワークであるPointOBB-v3を提案する。追加のプリミティブなしで擬似回転ボックスを生成し、エンドツーエンドのパラダイムをサポートする。本手法は従来の最先端手法と比較して3.56%の精度向上を実現している。
論文参考訳（メタデータ） (2025-01-23T18:18:15Z)
BFA-YOLO: A balanced multiscale object detection network for building façade attachments detection [24.100350794625882]
本研究では,BFA-YOLOモデルとBFA-3Dデータセットを開発した。 BFA-YOLOモデルは、ファサードアタッチメントのマルチビュー画像の分析に特化して設計された高度なアーキテクチャである。 BFA-YOLOは、BFA-3DデータセットとパブリックなFacade-WHUデータセットにおいて、mAP$_50$で1.8%と2.9%の改善を示した。
論文参考訳（メタデータ） (2024-09-06T04:44:52Z)
OmniBal: Towards Fast Instruct-tuning for Vision-Language Models via Omniverse Computation Balance [65.48009829137824]
視覚言語インストラクションチューニングモデルにおける大規模3D並列トレーニングは、異なるデバイス間で不均衡な計算負荷をもたらす。私たちはこの問題に対処するために、データ、モデル、メモリの観点から計算負荷を再バランスさせました。提案手法の有効性と一般化性は,様々なモデルやデータセットでさらに実証された。
論文参考訳（メタデータ） (2024-07-30T12:02:58Z)
LayoutDiT: Exploring Content-Graphic Balance in Layout Generation with Diffusion Transformer [46.67415676699221]
我々は、高品質で視覚的に魅力的なレイアウトを生成するために、コンテンツとグラフィック機能のバランスをとるフレームワークを導入する。具体的には、レイアウト生成空間に対するモデルの認識を最適化する適応係数を設計する。また、視覚領域における画像と幾何学パラメータ領域におけるレイアウトのモダリティ差を橋渡しするために、図形条件であるサリエンシ境界ボックスを導入する。
論文参考訳（メタデータ） (2024-07-21T17:58:21Z)
GroupMamba: Parameter-Efficient and Accurate Group Visual State Space Model [66.35608254724566]
状態空間モデル(SSM)は、二次的複雑性を伴う長距離依存のモデリングにおいて効果的な性能を示した。しかし、純粋なSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最適性能の達成に関連する課題に直面している。本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文参考訳（メタデータ） (2024-07-18T17:59:58Z)
Mixed Diffusion for 3D Indoor Scene Synthesis [55.94569112629208]
混合離散連続拡散モデルアーキテクチャであるMiDiffusionを提案する。シーンレイアウトを2次元のフロアプランとオブジェクトの集合で表現し、それぞれがそのカテゴリ、場所、サイズ、方向で定義する。実験により,MiDiffusionは床条件下での3次元シーン合成において,最先端の自己回帰モデルや拡散モデルよりもかなり優れていることが示された。
論文参考訳（メタデータ） (2024-05-31T17:54:52Z)
360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。また,水平深度と比表現に適した教師なし適応手法を提案する。本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文参考訳（メタデータ） (2023-12-26T12:16:03Z)
Towards Robust and Expressive Whole-body Human Pose and Shape Estimation [51.457517178632756]
全体のポーズと形状の推定は、単眼画像から人体全体の異なる振る舞いを共同で予測することを目的としている。既存の手法では、既存のシナリオの複雑さの下で、しばしば劣化したパフォーマンスを示す。全身のポーズと形状推定の堅牢性を高める新しい枠組みを提案する。
論文参考訳（メタデータ） (2023-12-14T08:17:42Z)
RoomDesigner: Encoding Anchor-latents for Style-consistent and Shape-compatible Indoor Scene Generation [26.906174238830474]
室内シーン生成は、空間的に合理的なレイアウトで形状に整合したスタイルの家具配置を作成することを目的としている。家具をアンカーラテント表現としてエンコードすることで,形状先行を室内シーン生成に組み込む2段階モデルを提案する。
論文参考訳（メタデータ） (2023-10-16T03:05:19Z)
Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文参考訳（メタデータ） (2021-05-07T03:49:26Z)
End-to-end Generative Floor-plan and Layout with Attributes and Relation Graph [6.259404056725123]
インテリアシーン合成のための家具レイアウトをランダムベクターから作成するためのエンドエンドモデルを提案する。提案モデルは部屋の条件付きフロアプランモジュールと部屋の条件付きグラフィカルフロアプランモジュールと条件付きレイアウトモジュールを組み合わせたものである。我々は,プロのデザイナーによる191208ドルのデザインを含む,現実世界のレイアウトデータセットについて実験を行った。
論文参考訳（メタデータ） (2020-12-15T07:37:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。