論文の概要: Large Language Model Agent for Structural Drawing Generation Using ReAct Prompt Engineering and Retrieval Augmented Generation
- arxiv url: http://arxiv.org/abs/2507.19771v1
- Date: Sat, 26 Jul 2025 03:47:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.174598
- Title: Large Language Model Agent for Structural Drawing Generation Using ReAct Prompt Engineering and Retrieval Augmented Generation
- Title(参考訳): 構造図作成のための大規模言語モデルエージェント
- Authors: Xin Zhang, Lissette Iturburu, Juan Nicolas Villamizar, Xiaoyu Liu, Manuel Salmeron, Shirley J. Dyke, Julio Ramirez,
- Abstract要約: 土木工学では、建築図面は建築家、技術者、建築者の間の主要なコミュニケーションツールとして機能する。
ソフトウェア能力の進歩にもかかわらず、構造図を作成するタスクは、労働集約的で時間を要するままである。
本稿では,大規模言語モデル(LLM)エージェントを用いた構造図を生成するための,新しい生成AIベースの手法を提案する。
- 参考スコア(独自算出の注目度): 3.326690511274941
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Structural drawings are widely used in many fields, e.g., mechanical engineering, civil engineering, etc. In civil engineering, structural drawings serve as the main communication tool between architects, engineers, and builders to avoid conflicts, act as legal documentation, and provide a reference for future maintenance or evaluation needs. They are often organized using key elements such as title/subtitle blocks, scales, plan views, elevation view, sections, and detailed sections, which are annotated with standardized symbols and line types for interpretation by engineers and contractors. Despite advances in software capabilities, the task of generating a structural drawing remains labor-intensive and time-consuming for structural engineers. Here we introduce a novel generative AI-based method for generating structural drawings employing a large language model (LLM) agent. The method incorporates a retrieval-augmented generation (RAG) technique using externally-sourced facts to enhance the accuracy and reliability of the language model. This method is capable of understanding varied natural language descriptions, processing these to extract necessary information, and generating code to produce the desired structural drawing in AutoCAD. The approach developed, demonstrated and evaluated herein enables the efficient and direct conversion of a structural drawing's natural language description into an AutoCAD drawing, significantly reducing the workload compared to current working process associated with manual drawing production, facilitating the typical iterative process of engineers for expressing design ideas in a simplified way.
- Abstract(参考訳): 構造図面は、機械工学、土木工学など、多くの分野で広く使われている。
土木工学において、構造図面は、アーキテクト、エンジニア、建築者の間の主要なコミュニケーションツールとして機能し、紛争を避け、法的文書として機能し、将来のメンテナンスや評価のニーズへの参照を提供する。
それらはしばしば、タイトル/サブタイトルブロック、スケール、プランビュー、標高ビュー、セクション、詳細セクションといった重要な要素を使って編成される。
ソフトウェア能力の進歩にもかかわらず、構造図を作成するタスクは、構造エンジニアにとって労働集約的で時間を要するままである。
本稿では,大規模言語モデル(LLM)エージェントを用いた構造図を生成するための,新しい生成AIベースの手法を提案する。
言語モデルの精度と信頼性を高めるために、外部ソースの事実を用いた検索拡張生成(RAG)技術が組み込まれている。
この方法は、様々な自然言語記述を理解し、それらを処理して必要な情報を抽出し、AutoCADで所望の構造図を作成するコードを生成することができる。
提案手法は, 構造図面の自然言語記述をAutoCAD図面に効率よく直接変換し, 作業負荷を手作業による図面作成に関連する現在の作業プロセスと比較して著しく低減し, 設計アイデアを簡易に表現するための技術者の典型的な反復プロセスを容易にする。
関連論文リスト
- CADDesigner: Conceptual Design of CAD Models Based on General-Purpose Agent [15.288461787523604]
大規模言語モデル(LLM)を用いたCAD概念設計のためのエージェントを提案する。
CIP(Context-Independent Imperative Paradigm)に基づいて構築され、高品質なCADモデリングコードを生成する。
論文 参考訳(メタデータ) (2025-08-01T19:15:56Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - From Idea to CAD: A Language Model-Driven Multi-Agent System for Collaborative Design [0.06749750044497731]
本稿では,このチーム構造を視覚言語モデル(VLM)に基づくマルチエージェントシステムで再現する手法を提案する。
モデルはスケッチやテキスト記述から自動的に生成される。
得られたモデルは、ユーザとの反復的検証ループで協調的に洗練することができる。
論文 参考訳(メタデータ) (2025-03-06T13:21:27Z) - OmniParser V2: Structured-Points-of-Thought for Unified Visual Text Parsing and Its Generality to Multimodal Large Language Models [58.45517851437422]
VsTP(Visually-situated text parsing)は、自動化された文書理解の需要が高まり、最近顕著な進歩を遂げている。
既存のソリューションは、タスク固有のアーキテクチャと個々のタスクの目的に依存していることが多い。
本稿では,テキストスポッティング,キー情報抽出,テーブル認識,レイアウト解析など,VsTPの典型的なタスクを統一する汎用モデルであるOmni V2を紹介する。
論文 参考訳(メタデータ) (2025-02-22T09:32:01Z) - An Agentic Approach to Automatic Creation of P&ID Diagrams from Natural Language Descriptions [2.8039483625021258]
本稿では,自然言語記述からのP&IDの自動生成のための新しい協調手法を提案する。
ワークフローの健全性と完全性を評価して生成プロセスの実現可能性を示し、バニラゼロショットや少数ショット生成手法と比較して改善された結果を示す。
論文 参考訳(メタデータ) (2024-12-17T13:21:26Z) - GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts [53.568057283934714]
本稿では,コンテンツ対応のテキストロゴレイアウトを生成するVLM(Vision-Language Model)ベースのフレームワークを提案する。
本稿では,複数のグリフ画像を同時に処理するための計算コストを削減する2つのモデル手法を提案する。
本モデルでは,既存の公開データセットの5倍の広義のテキストロゴデータセットを2つ構築する。
論文 参考訳(メタデータ) (2024-11-18T10:04:10Z) - Text2CAD: Text to 3D CAD Generation via Technical Drawings [45.3611544056261]
Text2CADは、生成プロセスを自動化するために調整された安定した拡散モデルを利用する新しいフレームワークである。
テキスト2CADは,高品質な3次元CADモデルに正確に変換された技術図面を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-11-09T15:12:06Z) - Geometric Deep Learning for Computer-Aided Design: A Survey [76.3325417461511]
幾何学的深層学習技術は、コンピュータ支援設計の分野における変革の原動力となっている。
幾何データで表されるCAD設計を処理し、それらの符号化された特徴を解析することで、類似性を識別することができる。
本調査は, コンピュータ支援設計における学習手法の総合的な概要を, 様々なカテゴリーにまたがって紹介する。
論文 参考訳(メタデータ) (2024-02-27T17:11:35Z) - Zero-Shot RTL Code Generation with Attention Sink Augmented Large
Language Models [0.0]
本稿では,大規模言語モデルを利用したハードウェア設計におけるコード生成プロセスの合理化の可能性について論じる。
RTLコード生成で大きな言語モデルを使用する能力は、設計サイクルを高速化するだけでなく、設計空間の探索を促進する。
論文 参考訳(メタデータ) (2024-01-12T17:41:38Z) - Parrot Mind: Towards Explaining the Complex Task Reasoning of Pretrained Large Language Models with Template-Content Structure [66.33623392497599]
テンプレート・コンテント構造(T-C構造)と呼ばれる構造は指数レベルから線形レベルへの可能な空間を減少させることができることを示す。
モデルがタスク構成を達成でき、線形から対数への学習に必要なスペースをさらに削減できることを実証する。
論文 参考訳(メタデータ) (2023-10-09T06:57:45Z) - InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists [66.85125112199898]
我々は,タスク固有の設計選択を抽象化する,コンピュータビジョンタスクのための統一言語インタフェースを開発する。
InstructCVと呼ばれる我々のモデルは、他のジェネラリストやタスク固有の視覚モデルと比較して競合的に機能する。
論文 参考訳(メタデータ) (2023-09-30T14:26:43Z) - Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.68385617116854]
トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部の動作や推論メカニズムを理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがCFG定義階層を正確に学習し、推論し、それに基づいて文を生成することを実証する。
論文 参考訳(メタデータ) (2023-05-23T04:28:16Z) - Natural Language Processing for Systems Engineering: Automatic
Generation of Systems Modelling Language Diagrams [0.10312968200748115]
構造化されていない自然言語テキストからシステム図の自動生成を支援する手法が提案されている。
目的は、より標準化され、包括的で自動化されたスタートポイントをユーザに提供することです。
論文 参考訳(メタデータ) (2022-08-09T19:20:33Z) - Intelligent requirements engineering from natural language and their
chaining toward CAD models [0.6091702876917279]
本稿では,デザイナーの創造性を設計する上で,デザイン言語が重要な役割を担っていると仮定する。
設計者は、思考、議論と意思決定の焦点、提案の信頼性を評価する手段としてモデルを使用し、開発する。
論文 参考訳(メタデータ) (2020-07-14T17:53:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。