論文の概要: ChatHouseDiffusion: Prompt-Guided Generation and Editing of Floor Plans
- arxiv url: http://arxiv.org/abs/2410.11908v1
- Date: Tue, 15 Oct 2024 02:41:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:41:28.532375
- Title: ChatHouseDiffusion: Prompt-Guided Generation and Editing of Floor Plans
- Title(参考訳): ChatHouseDiffusion: プロンプトガイドによるフロアプランの生成と編集
- Authors: Sizhong Qin, Chengyu He, Qiaoyun Chen, Sen Yang, Wenjie Liao, Yi Gu, Xinzheng Lu,
- Abstract要約: 本稿では,大規模言語モデル(LLM)を利用して自然言語入力を解釈するChatHouseDiffusionを提案する。
また、トポロジカルな関係をエンコードするためにグラマーを使用し、拡散モデルを使用してフロアプランを柔軟に生成し編集する。
既存のモデルと比較すると、ChatHouseDiffusionはより高いIoU(Intersection over Union)スコアを達成し、完了を必要とせずに正確な局所的な調整を可能にする。
- 参考スコア(独自算出の注目度): 10.82348603357201
- License:
- Abstract: The generation and editing of floor plans are critical in architectural planning, requiring a high degree of flexibility and efficiency. Existing methods demand extensive input information and lack the capability for interactive adaptation to user modifications. This paper introduces ChatHouseDiffusion, which leverages large language models (LLMs) to interpret natural language input, employs graphormer to encode topological relationships, and uses diffusion models to flexibly generate and edit floor plans. This approach allows iterative design adjustments based on user ideas, significantly enhancing design efficiency. Compared to existing models, ChatHouseDiffusion achieves higher Intersection over Union (IoU) scores, permitting precise, localized adjustments without the need for complete redesigns, thus offering greater practicality. Experiments demonstrate that our model not only strictly adheres to user specifications but also facilitates a more intuitive design process through its interactive capabilities.
- Abstract(参考訳): フロアプランの生成と編集はアーキテクチャ計画において重要であり、高い柔軟性と効率性を必要とする。
既存の手法では広範囲な入力情報を必要としており、ユーザ修正へのインタラクティブな適応能力が欠如している。
本稿では,大規模言語モデル(LLM)を活用して自然言語入力を解釈するChatHouseDiffusionを紹介し,トポロジカルな関係をエンコードするためにGraphormerを使用し,拡散モデルを用いてフロアプランを柔軟に生成・編集する。
このアプローチは、ユーザアイデアに基づいた反復的な設計調整を可能にし、設計効率を大幅に向上させる。
既存のモデルと比較して、ChatHouseDiffusionはより高いIoU(Intersection over Union)スコアを達成し、完全な再設計を必要とせずに正確な局所的な調整を可能にする。
実験により、我々のモデルはユーザー仕様に厳密に準拠するだけでなく、インタラクティブな機能を通じてより直感的な設計プロセスを促進することが示されている。
関連論文リスト
- PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - An Interpretable Ensemble of Graph and Language Models for Improving
Search Relevance in E-Commerce [22.449320058423886]
プラグアンドプレイグラフLanguage Model (PP-GLAM) を提案する。
このアプローチでは、均一なデータ処理パイプラインを備えたモジュラーフレームワークを使用します。
PP-GLAMは,実世界のマルチリンガル,マルチリージョンのeコマースデータセット上で,最先端のベースラインとプロプライエタリなモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-01T19:08:25Z) - Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - Aligning Large Language Models with Counterfactual DPO [1.8130068086063336]
本稿では,人的介入に頼らずにモデルスタイルを整列させる反事実的プロンプトの利用について検討する。
本研究では,この手法が望ましい行動を効果的に抑制し,望ましくない行動を緩和し,不適切な指示を無視するようモデルに促すことを実証する。
論文 参考訳(メタデータ) (2024-01-17T19:43:43Z) - PROMISE: A Framework for Developing Complex Conversational Interactions (Technical Report) [33.7054351451505]
本稿では,情報システムとの複雑な言語によるインタラクションを開発するためのフレームワークであるPROMISEを提案する。
本稿では、健康情報システムにおけるアプリケーションシナリオの文脈におけるPROMISEの利点を示し、複雑なインタラクションを扱う能力を示す。
論文 参考訳(メタデータ) (2023-12-06T18:59:11Z) - GroupBERT: Enhanced Transformer Architecture with Efficient Grouped
Structures [57.46093180685175]
トランスフォーマー層の構造を改良し,より効率的なアーキテクチャを実現する。
自己認識モジュールを補完する畳み込みモジュールを追加し、局所的およびグローバルな相互作用の学習を分離する。
得られたアーキテクチャを言語表現学習に適用し、異なるスケールのBERTモデルと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2021-06-10T15:41:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。