論文の概要: Design-MLLM: A Reinforcement Alignment Framework for Verifiable and Aesthetic Interior Design
- arxiv url: http://arxiv.org/abs/2603.13312v1
- Date: Wed, 04 Mar 2026 06:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.294583
- Title: Design-MLLM: A Reinforcement Alignment Framework for Verifiable and Aesthetic Interior Design
- Title(参考訳): Design-MLLM: 審美的インテリアデザインのための強化アライメントフレームワーク
- Authors: Yuxuan Yang, Xiaotong Mao, Jingyao Wang, Fuchun Sun,
- Abstract要約: インテリアデザインは要件から視覚的なプラン生成プロセスである。
MLLMは、構築不可能で、審美的に一貫性のないレイアウトを生成する。
強化アライメントフレームワークであるDesign-MLLMを提案する。
- 参考スコア(独自算出の注目度): 23.825603561362627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interior design is a requirements-to-visual-plan generation process that must simultaneously satisfy verifiable spatial feasibility and comparative aesthetic preferences. While recent multimodal large language models (MLLMs) offer a unified foundation for interpreting user intent and producing design rationales, our empirical analysis reveals a persistent contradiction in real-world deployment: MLLMs often produce layouts that are unbuildable and aesthetically inconsistent. These findings indicate that simply adding in-domain text is insufficient; effective interior design requires an alignment mechanism that separates hard constraints from soft preferences and coordinates them during optimization. To address this, we propose Design-MLLM, a reinforcement alignment framework that optimizes a feasibility-first preference objective via a dual-branch, aesthetic-oriented reward. Specifically, Design-MLLM (i) explicitly evaluates spatial feasibility using programmatic constraint checks, (ii) assesses aesthetic preference only among feasible candidates to avoid visually appealing but unexecutable shortcuts, and (iii) performs group-relative optimization to obtain stable preference signals. Through this process, Design-MLLM learns a controllable policy that consistently selects and generates solutions that are both executable and aesthetically coherent, rather than occasionally producing visually appealing but infeasible designs. Extensive experiments on various benchmark datasets demonstrate the advantages of Design-MLLM.
- Abstract(参考訳): インテリアデザインは、検証可能な空間実現可能性と比較美的嗜好を同時に満たさなければならない要件から視覚的プランの生成プロセスである。
最近のマルチモーダルな大規模言語モデル(MLLM)は、ユーザ意図を解釈し、設計の合理性を生み出すための統一的な基盤を提供するが、我々の経験的分析は、現実のデプロイメントにおいて永続的な矛盾を明らかにしている。
効果的な内部設計には、ソフトな嗜好からハードな制約を分離し、最適化中にそれらを調整するアライメント機構が必要である。
これを解決するために,両ブランチ,美学指向の報酬によって実現可能性優先の優先目標を最適化する強化アライメントフレームワークであるDesign-MLLMを提案する。
特にデザイン・MLLM
(i)プログラムによる制約チェックを用いて空間的実現可能性を明確に評価する。
二 視覚的にアピールするが実行不能なショートカットを避けるために、実施可能な候補のうちの美的嗜好を評価すること。
(iii) 安定な優先信号を得るためにグループ相対最適化を行う。
このプロセスを通じて、Design-MLLMは、視覚的に魅力的だが実現不可能な設計を時々生成するのではなく、実行可能かつ審美的に一貫性のあるソリューションを一貫して選択し、生成するコントロール可能なポリシーを学習する。
さまざまなベンチマークデータセットに対する大規模な実験は、Design-MLLMの利点を示している。
関連論文リスト
- Advancing Automated Algorithm Design via Evolutionary Stagewise Design with LLMs [69.91297564489464]
EvoStageは、産業規模のアルゴリズム設計の厳密な要求とLLMベースのアルゴリズム設計のギャップを埋める新しい進化パラダイムである。
EvoStageは、アルゴリズム設計プロセスを逐次的に管理可能なステージに分解し、リアルタイム中間フィードバックを反復的に洗練されたアルゴリズム設計方向に統合する。
商用グレードの3Dチップ配置ツールにデプロイすると、EvoStageはオリジナルのパフォーマンス指標を大幅に上回り、記録破りの効率を達成する。
論文 参考訳(メタデータ) (2026-03-09T05:13:44Z) - From One-to-One to Many-to-Many: Dynamic Cross-Layer Injection for Deep Vision-Language Fusion [91.35078719566472]
VLM(Vision-Language Models)は、粗い非対称接続を使用することで、深刻な視覚的特徴のボトルネックを生み出す。
CLI(Cross-Layer Injection)は,2つのモダリティの間に動的に多対多の橋を架ける,斬新で軽量なフレームワークである。
論文 参考訳(メタデータ) (2026-01-15T18:59:10Z) - Co-Layout: LLM-driven Co-optimization for Interior Layout [8.182031753612875]
本稿では,大規模言語モデル(LLM)とグリッド型整数プログラミングを組み合わせて室内レイアウトと家具配置を協調的に最適化する,自動内装設計のためのフレームワークを提案する。
我々の定式化は、廊下接続、部屋のアクセシビリティ、空間的排他性、ユーザ指定の嗜好など、重要な設計要件を考慮に入れている。
論文 参考訳(メタデータ) (2025-11-16T06:20:55Z) - DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis [76.7196710324494]
3次元屋内レイアウト合成は仮想環境構築に不可欠である。
DisCoは、物理的および意味的な洗練を歪め、調整する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-10-02T16:30:37Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation [3.1627400208503653]
条件付きレイアウト生成は、ユーザが定義した制約から視覚的に魅力的でセマンティックに一貫性のあるレイアウトを自動的に生成することを目的としている。
本稿では,Large Language Models (LLMs) の推論能力を活用する新しい手法として,検索型拡張生成(RAG) とChain-of-Thought (CoT) 技術の組み合わせを提案する。
我々は3つの条件付きレイアウト生成タスクにまたがる5つの公開データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2025-04-15T03:12:01Z) - FlairGPT: Repurposing LLMs for Interior Designs [29.903931425159925]
大規模言語モデル (LLM) が内部設計に直接活用できるかどうかを検討する。
LLMを体系的に探索することにより、関連する制約とともにオブジェクトのリストを確実に生成できる。
この情報を設計レイアウトグラフに変換し、オフザシェルフ制約最適化設定を用いて解決する。
論文 参考訳(メタデータ) (2025-01-08T18:01:49Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。