論文の概要: Intelligent Co-Design: An Interactive LLM Framework for Interior Spatial Design via Multi-Modal Agents
- arxiv url: http://arxiv.org/abs/2603.15341v1
- Date: Mon, 16 Mar 2026 14:28:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:58.430329
- Title: Intelligent Co-Design: An Interactive LLM Framework for Interior Spatial Design via Multi-Modal Agents
- Title(参考訳): Intelligent Co-Design:マルチモーダルエージェントによる内部空間設計のための対話型LLMフレームワーク
- Authors: Ren Jian Lim, Rushi Dai,
- Abstract要約: クライアントは設計知識を欠いているため、遅れたタイムラインや金銭的損失につながるため、通信ミスが頻繁に発生します。
生成的レイアウトツールの最近の進歩は、3Dビジュアライゼーションの自動化によってギャップを狭めている。
本研究では,自然言語記述や画像を動的に3D設計に変換するLLMベースのマルチモーダルマルチエージェントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In architectural interior design, miscommunication frequently arises as clients lack design knowledge, while designers struggle to explain complex spatial relationships, leading to delayed timelines and financial losses. Recent advancements in generative layout tools narrow the gap by automating 3D visualizations. However, prevailing methodologies exhibit limitations: rule-based systems implement hard-coded spatial constraints that restrict participatory engagement, while data-driven models rely on extensive training datasets. Recent large language models (LLMs) bridge this gap by enabling intuitive reasoning about spatial relationships through natural language. This research presents an LLM-based, multimodal, multi-agent framework that dynamically converts natural language descriptions and imagery into 3D designs. Specialized agents (Reference, Spatial, Interactive, Grader), operating via prompt guidelines, collaboratively address core challenges: the agent system enables real-time user interaction for iterative spatial refinement, while Retrieval-Augmented Generation (RAG) reduces data dependency without requiring task-specific model training. This framework accurately interprets spatial intent and generates optimized 3D indoor design, improving productivity, and encouraging nondesigner participation. Evaluations across diverse floor plans and user questionnaires demonstrate effectiveness. An independent LLM evaluator consistently rated participatory layouts higher in user intent alignment, aesthetic coherence, functionality, and circulation. Questionnaire results indicated 77% satisfaction and a clear preference over traditional design software. These findings suggest the framework enhances user-centric communication and fosters more inclusive, effective, and resilient design processes. Project page: https://rsigktyper.github.io/AICodesign/
- Abstract(参考訳): インテリアデザインでは、クライアントが設計知識を欠いているため、設計者は複雑な空間的関係を説明するのに苦労し、スケジュールの遅れや財政的損失につながるため、誤通信が頻繁に発生する。
生成的レイアウトツールの最近の進歩は、3Dビジュアライゼーションの自動化によってギャップを狭めている。
ルールベースのシステムは、参加型エンゲージメントを制限するハードコードされた空間制約を実装し、データ駆動モデルは広範なトレーニングデータセットに依存している。
近年の大規模言語モデル(LLM)はこのギャップを埋め、自然言語による空間的関係の直感的な推論を可能にしている。
本研究では,自然言語記述や画像を動的に3D設計に変換するLLMベースのマルチモーダルマルチエージェントフレームワークを提案する。
エージェントシステムは、反復的な空間的洗練のためにリアルタイムのユーザインタラクションを可能にし、Retrieval-Augmented Generation (RAG)は、タスク固有のモデルトレーニングを必要とせずに、データ依存を減らす。
空間的意図を正確に解釈し、最適化された3次元屋内デザインを生成し、生産性を向上し、非設計者の参加を促す。
多様なフロアプランとユーザアンケートによる評価は,有効性を示す。
独立したLCM評価器は、ユーザ意図のアライメント、審美的コヒーレンス、機能、循環における参加型レイアウトを常に高く評価した。
アンケートの結果、従来のデザインソフトウェアよりも77%の満足感と明確な嗜好が示された。
これらの結果は、このフレームワークがユーザ中心のコミュニケーションを強化し、より包括的で効果的でレジリエントな設計プロセスを促進することを示唆している。
プロジェクトページ: https://rsigktyper.github.io/AICodesign/
関連論文リスト
- Lemon: A Unified and Scalable 3D Multimodal Model for Universal Spatial Understanding [80.66591664266744]
Lemonは3Dポイントクラウドパッチと言語トークンを単一のシーケンスとして処理する統合トランスフォーマーアーキテクチャである。
3次元データの複雑さに対処するため,空間的コンテキストを保存するための構造化パッチやトークン化方式を開発した。
Lemonは、総合的な3D理解と推論タスクにまたがって、最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2025-12-14T20:02:43Z) - DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis [76.7196710324494]
3次元屋内レイアウト合成は仮想環境構築に不可欠である。
DisCoは、物理的および意味的な洗練を歪め、調整する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-10-02T16:30:37Z) - LLMs as Layout Designers: Enhanced Spatial Reasoning for Content-Aware Layout Generation [27.377286708795506]
LaySPAは、レイアウト設計のための空間的推論機能を備えた大規模言語モデルを強化する強化学習ベースのフレームワークである。
また,LaySPAは構造的に有効かつ視覚的に魅力的なレイアウトの生成を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-09-21T03:02:59Z) - Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [91.17994756436259]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。
既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。
協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文 参考訳(メタデータ) (2025-07-24T09:17:41Z) - EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks [24.41705039390567]
EmbodiedVSR (Embodied Visual Space Reasoning) は動的シーングラフ誘導型Chain-of-Thought (CoT)推論を統合する新しいフレームワークである。
本手法はタスク固有の微調整なしでゼロショット空間推論を可能にする。
実験により,我々のフレームワークは,既存のMLLM法よりも精度と推論コヒーレンスにおいて優れていることが示された。
論文 参考訳(メタデータ) (2025-03-14T05:06:07Z) - FlairGPT: Repurposing LLMs for Interior Designs [29.903931425159925]
大規模言語モデル (LLM) が内部設計に直接活用できるかどうかを検討する。
LLMを体系的に探索することにより、関連する制約とともにオブジェクトのリストを確実に生成できる。
この情報を設計レイアウトグラフに変換し、オフザシェルフ制約最適化設定を用いて解決する。
論文 参考訳(メタデータ) (2025-01-08T18:01:49Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - I-Design: Personalized LLM Interior Designer [57.00412237555167]
I-Designはパーソナライズされたインテリアデザイナで、自然言語によるコミュニケーションを通じて設計目標の生成と視覚化を可能にする。
I-Designは、対話や論理的推論に従事する大きな言語モデルエージェントのチームから始まる。
最終的な設計は、既存のオブジェクトデータベースから資産を取り出し、統合することで、3Dで構築されます。
論文 参考訳(メタデータ) (2024-04-03T16:17:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。