論文の概要: DiffDesign: Controllable Diffusion with Meta Prior for Efficient Interior Design Generation
- arxiv url: http://arxiv.org/abs/2411.16301v1
- Date: Mon, 25 Nov 2024 11:36:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:22:56.378527
- Title: DiffDesign: Controllable Diffusion with Meta Prior for Efficient Interior Design Generation
- Title(参考訳): DiffDesign: 効率的な内部設計生成のためのメタプリミティブによる制御可能な拡散
- Authors: Yuxuan Yang, Jingyao Wang, Tao Geng, Wenwen Qiang, Changwen Zheng, Fuchun Sun,
- Abstract要約: DiffDesignは、メタプリミティブを持つ制御可能な拡散モデルであり、効率的な内部設計生成を実現する。
具体的には,画像データセット上で事前学習した2次元拡散モデルの生成先行をレンダリングバックボーンとして利用する。
さらに、外観、ポーズ、サイズといったデザイン属性を横断的に制御し、視点整合性を強制する最適な転送ベースのアライメントモジュールを導入することで、デノナイジングプロセスをガイドする。
- 参考スコア(独自算出の注目度): 25.532400438564334
- License:
- Abstract: Interior design is a complex and creative discipline involving aesthetics, functionality, ergonomics, and materials science. Effective solutions must meet diverse requirements, typically producing multiple deliverables such as renderings and design drawings from various perspectives. Consequently, interior design processes are often inefficient and demand significant creativity. With advances in machine learning, generative models have emerged as a promising means of improving efficiency by creating designs from text descriptions or sketches. However, few generative works focus on interior design, leading to substantial discrepancies between outputs and practical needs, such as differences in size, spatial scope, and the lack of controllable generation quality. To address these challenges, we propose DiffDesign, a controllable diffusion model with meta priors for efficient interior design generation. Specifically, we utilize the generative priors of a 2D diffusion model pre-trained on a large image dataset as our rendering backbone. We further guide the denoising process by disentangling cross-attention control over design attributes, such as appearance, pose, and size, and introduce an optimal transfer-based alignment module to enforce view consistency. Simultaneously, we construct an interior design-specific dataset, DesignHelper, consisting of over 400 solutions across more than 15 spatial types and 15 design styles. This dataset helps fine-tune DiffDesign. Extensive experiments conducted on various benchmark datasets demonstrate the effectiveness and robustness of DiffDesign.
- Abstract(参考訳): インテリアデザインは、美学、機能性、エルゴノミクス、材料科学を含む複雑で創造的な分野である。
効果的なソリューションは、様々な要件を満たす必要があり、典型的には、様々な視点からレンダリングや設計図面など、複数の成果物を生成する。
その結果、内部設計プロセスは効率が悪く、創造性が要求されることが多い。
機械学習の進歩に伴い、生成モデルはテキスト記述やスケッチからデザインを作成することで効率を向上させるための有望な手段として現れてきた。
しかし、内部設計に焦点をあてる生成的作品はほとんどなく、サイズや空間範囲の違い、制御可能な生成品質の欠如など、出力と実用的ニーズの間にかなりの相違が生じている。
これらの課題に対処するために,メタプリミティブを持つ制御可能な拡散モデルDiffDesignを提案する。
具体的には,画像データセット上で事前学習した2次元拡散モデルの生成先行をレンダリングバックボーンとして利用する。
さらに、外観、ポーズ、サイズといったデザイン属性を横断的に制御し、視点整合性を強制する最適な転送ベースのアライメントモジュールを導入することで、デノナイジングプロセスをガイドする。
同時に15以上の空間型と15以上のデザインスタイルにまたがる400以上のソリューションからなるインテリアデザイン特化データセットであるDesignHelperを構築した。
このデータセットはDiffDesignの微調整に役立つ。
さまざまなベンチマークデータセットで実施された大規模な実験は、DiffDesignの有効性と堅牢性を示している。
関連論文リスト
- PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - I-Design: Personalized LLM Interior Designer [57.00412237555167]
I-Designはパーソナライズされたインテリアデザイナで、自然言語によるコミュニケーションを通じて設計目標の生成と視覚化を可能にする。
I-Designは、対話や論理的推論に従事する大きな言語モデルエージェントのチームから始まる。
最終的な設計は、既存のオブジェクトデータベースから資産を取り出し、統合することで、3Dで構築されます。
論文 参考訳(メタデータ) (2024-04-03T16:17:53Z) - Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - iDesigner: A High-Resolution and Complex-Prompt Following Text-to-Image
Diffusion Model for Interior Design [42.061819736162356]
本稿では,CLIPフィードバックによるカリキュラム学習と強化学習による微調整戦略を提案する。
収集したデータセットに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-12-07T14:37:01Z) - Design Space Exploration and Explanation via Conditional Variational
Autoencoders in Meta-model-based Conceptual Design of Pedestrian Bridges [52.77024349608834]
本稿では,条件付き変分オートエンコーダ(CVAE)による人間設計者向上のための性能駆動型設計探索フレームワークを提案する。
CVAEはスイスの歩行者橋の合成例18万件で訓練されている。
論文 参考訳(メタデータ) (2022-11-29T17:28:31Z) - Investigating Positive and Negative Qualities of Human-in-the-Loop
Optimization for Designing Interaction Techniques [55.492211642128446]
設計者は、与えられた目的の集合を最大化する設計パラメータの組み合わせを見つけるよう求められる設計最適化タスクに苦労すると言われている。
モデルベースの計算設計アルゴリズムは、設計中に設計例を生成することでデザイナを支援する。
一方、補助のためのブラックボックスメソッドは、あらゆる設計問題に対処できる。
論文 参考訳(メタデータ) (2022-04-15T20:40:43Z) - Physical Design using Differentiable Learned Simulators [9.380022457753938]
逆設計では、学習したフォワードシミュレータは勾配に基づく設計最適化と組み合わせられる。
この枠組みは数百歩の軌跡を伝播することで高品質な設計を行う。
この結果から,機械学習をベースとしたシミュレータは,いくつかの課題があるにもかかわらず,汎用設計の最適化をサポートできる段階まで成熟していることが示唆された。
論文 参考訳(メタデータ) (2022-02-01T19:56:39Z) - PaDGAN: A Generative Adversarial Network for Performance Augmented
Diverse Designs [13.866787416457454]
本研究では, 優れた設計空間を網羅した新規な高品質な設計を創出可能な, 高性能拡張多言語生成ネットワーク(Performance Augmented Diverse Generative Adversarial Network) または PaDGAN を開発した。
バニラ生成適応ネットワークと比較して、平均的な平均品質スコアが28%高く、多様性が大きく、モード崩壊の問題がないサンプルを生成する。
論文 参考訳(メタデータ) (2020-02-26T04:53:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。