論文の概要: DStruct2Design: Data and Benchmarks for Data Structure Driven Generative Floor Plan Design
- arxiv url: http://arxiv.org/abs/2407.15723v1
- Date: Mon, 22 Jul 2024 15:27:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 14:20:51.556339
- Title: DStruct2Design: Data and Benchmarks for Data Structure Driven Generative Floor Plan Design
- Title(参考訳): DStruct2Design:データ構造駆動生成フロアプラン設計のためのデータとベンチマーク
- Authors: Zhi Hao Luo, Luis Lara, Ge Ya Luo, Florian Golemo, Christopher Beckham, Christopher Pal,
- Abstract要約: フロアプラン生成のデータ構造定式化のための新しいデータセットを構築した。
部分的あるいは完全な制約が与えられたフロアプラン生成の課題について検討する。
数値制約を考慮したフロアプラン生成問題に対するフロアプランデータ構造LLMの適用可能性を示す。
- 参考スコア(独自算出の注目度): 5.567585193148804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text conditioned generative models for images have yielded impressive results. Text conditioned floorplan generation as a special type of raster image generation task also received particular attention. However there are many use cases in floorpla generation where numerical properties of the generated result are more important than the aesthetics. For instance, one might want to specify sizes for certain rooms in a floorplan and compare the generated floorplan with given specifications Current approaches, datasets and commonly used evaluations do not support these kinds of constraints. As such, an attractive strategy is to generate an intermediate data structure that contains numerical properties of a floorplan which can be used to generate the final floorplan image. To explore this setting we (1) construct a new dataset for this data-structure to data-structure formulation of floorplan generation using two popular image based floorplan datasets RPLAN and ProcTHOR-10k, and provide the tools to convert further procedurally generated ProcTHOR floorplan data into our format. (2) We explore the task of floorplan generation given a partial or complete set of constraints and we design a series of metrics and benchmarks to enable evaluating how well samples generated from models respect the constraints. (3) We create multiple baselines by finetuning a large language model (LLM), Llama3, and demonstrate the feasibility of using floorplan data structure conditioned LLMs for the problem of floorplan generation respecting numerical constraints. We hope that our new datasets and benchmarks will encourage further research on different ways to improve the performance of LLMs and other generative modelling techniques for generating designs where quantitative constraints are only partially specified, but must be respected.
- Abstract(参考訳): 画像のテキスト条件付き生成モデルは印象的な結果を得た。
特殊タイプのラスタ画像生成タスクとしてのテキストコンディショニングフロアプラン生成も特に注目を集めた。
しかし、フロアプラ生成では、生成した結果の数値的性質が美学よりも重要である場合が多い。
例えば、フロアプランの特定の部屋のサイズを指定して、生成されたフロアプランを所定の仕様と比較したい場合、現在のアプローチ、データセット、そして一般的に使用される評価は、この種の制約をサポートしない。
そのため、最終的なフロアプラン画像を生成するために使用できるフロアプランの数値特性を含む中間データ構造を生成することが魅力的な戦略である。
本研究では,(1)一般的な画像ベースフロアプランデータセットRPLANとProcTHOR-10kを用いてフロアプラン生成のデータ構造を定式化するための新しいデータセットを構築し,さらにプロシージャ生成したProcTHORフロアプランデータを我々のフォーマットに変換するためのツールを提供する。
2) 制約の一部あるいは完全なセットを与えられたフロアプラン生成の課題について検討し, モデルから生成されたサンプルがいかに制約を尊重するかを評価するために, 一連の指標とベンチマークを設計する。
3) 大規模言語モデル(LLM), Llama3 を微調整し, 数値制約を考慮したフロアプラン生成問題に対するフロアプランデータ構造条件付き LLM の有効性を示す。
我々の新しいデータセットとベンチマークは、量的制約が部分的に指定されているだけで、尊重されなければならない設計を生成するLLMやその他の生成モデリング技術の性能を改善するための様々な方法について、さらなる研究を促進することを願っている。
関連論文リスト
- PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z) - Learning to Plan and Generate Text with Citations [69.56850173097116]
提案手法は, テキストの忠実性, 接地性, 制御性を向上させるために最近実証されたプランベースモデルの帰属性について検討する。
本稿では,異なるブループリントの変種を利用する帰属モデルと,質問をゼロから生成する抽象モデルと,質問を入力からコピーする抽出モデルを提案する。
論文 参考訳(メタデータ) (2024-04-04T11:27:54Z) - Dynamic Retrieval-Augmented Generation [4.741884506444161]
動的検索・拡張生成(DRAG)のための新しい手法を提案する。
DRAGは、取得したエンティティの圧縮埋め込みを生成モデルに注入する。
提案手法は,(1)コンテキストウィンドウの長さ制限を解除し,迅速なサイズを節約すること,(2)コンテキストに利用可能な検索エンティティの数を膨大に拡張すること,(3)ミススペルや関連エンティティ名検索の失敗を緩和すること,の3つの目標を達成する。
論文 参考訳(メタデータ) (2023-12-14T14:26:57Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - End-to-end Graph-constrained Vectorized Floorplan Generation with
Panoptic Refinement [16.103152098205566]
本研究では,1次元ベクトルのシーケンスとしてフロアプランを合成することを目的としている。
最初の段階では,ユーザが入力した部屋接続グラフをGCN(Graphal Network)でエンコードし,自動回帰トランスフォーマネットワークを適用して初期フロアプランを生成する。
初期設計を洗練し、より視覚的に魅力的なフロアプランを生成するために、GCNとトランスフォーマーネットワークからなる新しい汎視補正ネットワーク(PRN)を提案する。
論文 参考訳(メタデータ) (2022-07-27T03:19:20Z) - FloorGenT: Generative Vector Graphic Model of Floor Plans for Robotics [5.71097144710995]
フロアプランを特定の視点から見たラインセグメントのシーケンスとしてモデル化することにより、最近の自己回帰シーケンスモデリングの進歩をフロアプランのモデル化と予測に活用できることが示される。
論文 参考訳(メタデータ) (2022-03-07T13:42:48Z) - Data-to-text Generation with Variational Sequential Planning [74.3955521225497]
非言語的な入力からテキスト出力を生成することを目的としたデータ・ツー・テキスト生成の課題について考察する。
協調的かつ有意義な方法で高レベルの情報を整理する責任を負う計画要素を付加したニューラルモデルを提案する。
我々は、計画と生成のステップをインターリーブしながら、構造化された変動モデルで逐次、潜在計画を推測する。
論文 参考訳(メタデータ) (2022-02-28T13:17:59Z) - Few-Shot Table-to-Text Generation with Prototype Memory [14.69889589370148]
本稿では,プロトタイプ・ツー・ジェネレーション (P2G) という,プロトタイプ・トゥ・ジェネレーション(Prototype-to-Generate, P2G) を用いたテーブル・トゥ・テキスト生成手法を提案する。
提案フレームワークは、IRシステムと新しいプロトタイプセレクタによって共同で選択された、検索されたプロトタイプを利用する。
3つの最先端モデルを用いた3つのベンチマークデータセットの実験結果から,提案手法がモデル性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2021-08-27T22:16:30Z) - Data-to-text Generation with Macro Planning [61.265321323312286]
本稿では,マクロ計画段階のニューラルモデルと,従来の手法を連想させる生成段階を提案する。
提案手法は, 自動評価と人的評価の両面で, 競争ベースラインを上回っている。
論文 参考訳(メタデータ) (2021-02-04T16:32:57Z) - Graph-Based Generative Representation Learning of Semantically and
Behaviorally Augmented Floorplans [12.488287536032747]
本稿では,アトリビュートグラフを用いて幾何学的情報を表現するフロアプラン埋め込み手法と,ノード属性やエッジ属性として住民のセマンティクスや行動特徴をデザインする手法を提案する。
長短期記憶(LSTM)変動オートエンコーダ(VAE)アーキテクチャを提案し,連続空間に属性グラフをベクトルとして埋め込むように訓練した。
入力に対する埋め込み空間から得られた類似のフロアプランの結合度を評価するために,ユーザ調査を行った。
論文 参考訳(メタデータ) (2020-12-08T20:51:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。