論文の概要: Evaluation of Architectural Synthesis Using Generative AI
- arxiv url: http://arxiv.org/abs/2503.02861v1
- Date: Tue, 04 Mar 2025 18:39:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:15:46.408795
- Title: Evaluation of Architectural Synthesis Using Generative AI
- Title(参考訳): 生成AIを用いた建築合成の評価
- Authors: Jingfei Huang, Alexandros Haridis,
- Abstract要約: 本稿では,GPT-4o と Claude 3.5 の2つのシステムの比較評価を行った。
Palladio's Four Books of Architecture (1965) のヴィラ・ロトンダ (Villa Rotonda) とパラッツォ・ポルト (Palazo Porto) の2つの建物についてケーススタディを行った。
本研究では,(1)図面から建物の2次元および3次元表現を解釈し,(2)CADソフトウェアスクリプトに建物をエンコードし,(3)アウトプットに基づく自己改善を行うシステムの能力を評価する。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License:
- Abstract: Recent advancements in multimodal Generative AI have the potential to democratize specialized architectural tasks, such as interpreting technical drawings and creating 3D CAD models, which traditionally require expert knowledge. This paper presents a comparative evaluation of two systems: GPT-4o and Claude 3.5, in the task of architectural 3D synthesis. We conduct a case study on two buildings from Palladio's Four Books of Architecture (1965): Villa Rotonda and Palazzo Porto. High-level architectural models and drawings of these buildings were prepared, inspired by Palladio's original texts and drawings. Through sequential text and image prompting, we assess the systems' abilities in (1) interpreting 2D and 3D representations of buildings from drawings, (2) encoding the buildings into a CAD software script, and (3) self-improving based on outputs. While both systems successfully generate individual parts, they struggle to accurately assemble these parts into the desired spatial relationships, with Claude 3.5 demonstrating better performance, particularly in self-correcting its output. This study contributes to ongoing research on benchmarking the strengths and weaknesses of off-the-shelf AI systems in performing intelligent human tasks that require discipline-specific knowledge. The findings highlight the potential of language-enabled AI systems to act as collaborative technical assistants in the architectural design process.
- Abstract(参考訳): マルチモーダル生成AIの最近の進歩は、技術的図面の解釈や、伝統的に専門知識を必要とする3DCADモデルの作成など、特殊なアーキテクチャタスクを民主化する可能性がある。
本稿では,GPT-4o と Claude 3.5 の2つのシステムの比較評価を行った。
Palladio's Four Books of Architecture (1965) のヴィラ・ロトンダ (Villa Rotonda) とパラッツォ・ポルト (Palazo Porto) の2つの建物についてケーススタディを行った。
これらの建物の高階建築モデルと図面は、パッラーディオの原文や図面に触発されて準備された。
本研究では,(1)図面から2次元および3次元の建物表現を解釈し,(2)CADソフトウェアスクリプトに建物をエンコードし,(3)アウトプットに基づく自己改善を行うシステムの性能を評価する。
どちらのシステムもそれぞれの部品を正確に組み立てるのに苦労し、クロード3.5は特に出力の自己補正に優れた性能を示した。
この研究は、専門的な知識を必要とするインテリジェントなヒューマンタスクの実行において、既成のAIシステムの長所と短所のベンチマーク研究に貢献する。
この発見は、アーキテクチャ設計プロセスにおいて協調的な技術アシスタントとして機能する言語対応AIシステムの可能性を浮き彫りにした。
関連論文リスト
- Proc-GS: Procedural Building Generation for City Assembly with 3D Gaussians [65.09942210464747]
資産の創出は労働集約的であり、設計ルールを開発するには専門的なスキルが必要である。
作成のための最近の生成モデルは、しばしばこれらのパターンを見落とし、視覚的忠実度が低く、スケーラビリティが制限される。
手続き的なコードを操作することで、このプロセスを合理化し、無限に多様な建物を生成することができます。
論文 参考訳(メタデータ) (2024-12-10T16:45:32Z) - SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。
SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。
SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-01T21:23:03Z) - Sketch-to-Architecture: Generative AI-aided Architectural Design [20.42779592734634]
簡単なスケッチから概念的なフロアプランと3Dモデルを生成するために,AIモデルを利用する新しいワークフローを提案する。
我々の研究は、アーキテクチャ設計プロセスにおける生成AIの可能性を示し、コンピュータ支援アーキテクチャ設計の新しい方向性を指し示している。
論文 参考訳(メタデータ) (2024-03-29T14:04:45Z) - Multi-task Learning with 3D-Aware Regularization [55.97507478913053]
本稿では,画像エンコーダから抽出した特徴を共有3D特徴空間に投影することで,複数のタスクをインタフェースする構造化3D認識正規化器を提案する。
提案手法はアーキテクチャ非依存であり,従来のマルチタスクバックボーンにプラグインすることで,性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-10-02T08:49:56Z) - Multi-CLIP: Contrastive Vision-Language Pre-training for Question
Answering tasks in 3D Scenes [68.61199623705096]
一般的な言語知識と視覚概念を2次元画像から3次元シーン理解に適用するためのトレーニングモデルは、研究者が最近探求を始めたばかりの有望な方向である。
そこで本研究では,モデルによる3次元シーンポイントクラウド表現の学習を可能にする,新しい3次元事前学習手法であるMulti-CLIPを提案する。
論文 参考訳(メタデータ) (2023-06-04T11:08:53Z) - Towards AI-Architecture Liberty: A Comprehensive Survey on Design and Generation of Virtual Architecture by Deep Learning [23.58793497403681]
ディープラーニングを活用した3D形状生成技術は、コンピュータビジョンとアーキテクチャデザインコミュニティの両方から大きな関心を集めている。
建築設計, 3次元形状技術, 仮想環境に関する149の関連記事について概説する。
深層学習支援アーキテクチャ生成における没入型システムとのユビキタスインタラクションの4つの重要な実現方法を強調した。
論文 参考訳(メタデータ) (2023-04-30T15:38:36Z) - Unfinished Architectures: A Perspective from Artificial Intelligence [73.52315464582637]
人工知能(AI)の開発は、未完成のアーキテクチャの完成の可能性を提案する新たな道を開く。
DALL-Eのような最近のツールでは、テキスト記述でガイドされた画像が完成する。
本稿では、歴史的寺院の未完成のファサードの完成にこれらの新しいAIツールを使用することについて検討し、建築図学の分野におけるまだ老朽化したスタジアムの分析を行う。
論文 参考訳(メタデータ) (2023-03-03T13:05:10Z) - A Compositional Approach to Creating Architecture Frameworks with an
Application to Distributed AI Systems [16.690434072032176]
構成的思考が複雑なシステムのためのアーキテクチャフレームワークの作成と管理のルールをいかに提供できるかを示す。
論文の目的は、AIシステム特有の視点やアーキテクチャモデルを提供することではなく、既存の、または新しく作成された視点で一貫したフレームワークを構築する方法についてのガイドラインを提供することである。
論文 参考訳(メタデータ) (2022-12-27T18:05:02Z) - Vitruvio: 3D Building Meshes via Single Perspective Sketches [0.8001739956625484]
一つのスケッチを3Dビルディングメッシュに変換することを目的とした建物のみに焦点を当てた,最初のディープラーニング手法であるVitruvioを紹介した。
まず、推論プロセスを26%以上(0.5から0.37まで)加速する。
第二に、再建精度(チャンファー距離で測定される)を18%向上させる。
論文 参考訳(メタデータ) (2022-10-24T22:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。