論文の概要: Unified Vector Floorplan Generation via Markup Representation
- arxiv url: http://arxiv.org/abs/2604.04859v1
- Date: Mon, 06 Apr 2026 17:04:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.299931
- Title: Unified Vector Floorplan Generation via Markup Representation
- Title(参考訳): マークアップ表現による統一ベクトルフロアプラン生成
- Authors: Kaede Shiohara, Toshihiko Yamasaki,
- Abstract要約: 本稿ではフロアプランマークアップ言語(FML)を紹介し,フロアプラン情報を単一構造文法内にエンコードする表現について述べる。
本研究では,多種多様な条件下で高忠実かつ機能的なフロアプランを生成可能なトランスフォーマーベース生成モデルFMLMを開発した。
- 参考スコア(独自算出の注目度): 36.228613615394856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic residential floorplan generation has long been a central challenge bridging architecture and computer graphics, aiming to make spatial design more efficient and accessible. While early methods based on constraint satisfaction or combinatorial optimization ensure feasibility, they lack diversity and flexibility. Recent generative models achieve promising results but struggle to generalize across heterogeneous conditional tasks, such as generation from site boundaries, room adjacency graphs, or partial layouts, due to their suboptimal representations. To address this gap, we introduce Floorplan Markup Language (FML), a general representation that encodes floorplan information within a single structured grammar, which casts the entire floorplan generation problem into a next token prediction task. Leveraging FML, we develop a transformer-based generative model, FMLM, capable of producing high-fidelity and functional floorplans under diverse conditions. Comprehensive experiments on the RPLAN dataset demonstrate that FMLM, despite being a single model, surpasses the previous task-specific state-of-the-art methods.
- Abstract(参考訳): 自動的なフロアプラン生成は、空間設計をより効率的かつアクセスしやすいものにすることを目的として、長い間、アーキテクチャとコンピュータグラフィックスを橋渡しする中心的な課題であった。
制約満足度や組合せ最適化に基づく初期の手法は実現可能性を保証するが、多様性と柔軟性は欠如している。
最近の生成モデルは、期待できる結果を得るが、その準最適表現のために、サイト境界、部屋隣接グラフ、部分レイアウトなどの不均一な条件タスクを一般化するのに苦労する。
このギャップに対処するために、フロアプラン生成問題を次のトークン予測タスクにキャストする単一構造文法にフロアプラン情報をエンコードする一般的な表現であるフロアプランマークアップ言語(FML)を導入する。
FMLを活用し,多種多様な条件下で高忠実かつ機能的なフロアプランを作成できるトランスフォーマーベース生成モデルFMLMを開発した。
RPLANデータセットに関する総合的な実験により、FMLMは単一のモデルであるにもかかわらず、従来のタスク固有の最先端手法を超越していることが示された。
関連論文リスト
- TodoEvolve: Learning to Architect Agent Planning Systems [68.48983335970901]
TodoEvolveは、タスク固有の計画を自律的に合成し、動的に修正するメタプランニングパラダイムである。
PlanFactoryは異種計画パターンの共通インターフェースを提供する。
TodoEvolveは、経済的なAPIコストとランタイムオーバーヘッドを維持しながら、慎重に設計された計画モジュールを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-08T06:37:01Z) - TLC-Plan: A Two-Level Codebook Based Network for End-to-End Vector Floorplan Generation [19.063941053235567]
空間入力境界からベクトルを直接合成する階層的生成モデルであるTLC-Planを提案する。
TLC-Planは、グローバルレイアウトをセマンティックラベル付きルームバウンディングボックスとしてエンコードするために、2レベルVQ-VAEを使用している。
実験では、RPLANデータセット上での最先端のパフォーマンスと、LIデータセット上でのリード結果が示されている。
論文 参考訳(メタデータ) (2026-02-06T15:36:50Z) - FloorPlan-DeepSeek (FPDS): A multimodal approach to floorplan generation using vector-based next room prediction [25.35768485637194]
既存のフロアプラン生成モデルは、主にエンド・ツー・エンドの世代であり、単一のパスでピクセルベースのレイアウト全体を生成する。
建築フロア・プラン・モデリングに適した新しい「次の部屋予測」パラダイムを提案する。
FPDSは、テキストからフロアプランタスクにおける拡散モデルとTell2Designと比較して、競合性能を示す。
論文 参考訳(メタデータ) (2025-06-12T04:33:27Z) - HouseTune: Two-Stage Floorplan Generation with LLM Assistance [10.558141230827847]
本稿では,大規模言語モデルの推論能力と拡散モデルの生成能力を組み合わせた2段階のテキスト・ツー・フロアプラン・フレームワークを提案する。
実験結果から,本手法は全指標の最先端性能を実現し,実用的ホームデザインアプリケーションにおける有効性を検証した。
論文 参考訳(メタデータ) (2024-11-19T06:57:45Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [36.300564378022315]
本稿では,移動環境における移動操作問題を解決するための学習可能なタスク・アンド・モーション・プランニング(TAMP)アルゴリズムを提案する。
本アルゴリズムのコアは,タスク計画,目標,初期状態を考慮したトランスフォーマーに基づく新しい学習手法であるPIGINetであり,タスク計画に関連する運動軌跡の発見確率を予測する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。