論文の概要: Self-Improving CAD Generation Agents with Finite Element Analysis as Feedback
- arxiv url: http://arxiv.org/abs/2605.17448v1
- Date: Sun, 17 May 2026 13:47:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.093785
- Title: Self-Improving CAD Generation Agents with Finite Element Analysis as Feedback
- Title(参考訳): 有限要素解析による自己改善CAD生成エージェントのフィードバック
- Authors: Guijin Son, Jehyun Park, Seyeon Park, Sunghee Ahn, Youngjae Yu,
- Abstract要約: 我々は、自由形式のエンジニアリングブリーフから完全に組み立てられたマルチパートSTEPファイルを生成するモデルを必要とする、より業界固有のタスク定式化を導入する。
FEAの検証によると、Codex (GPT-5.5) と Claude Code (Opus-4.7) のエージェントは、メインのファースト・アタプティブ・スイープにおいて1つの厳密な通過アーティファクトを生成していない。
S2OとFusion360では、同じフィードバックツールが幾何再構成を改善し、GPT-5.5/xhighはS2Oでは0.444から0.592Box-IoU、Fusion360では0.397から0.505に上昇した。
- 参考スコア(独自算出の注目度): 21.804668679670655
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Computer-aided design (CAD) is the backbone of modern industrial design, yet learned CAD generators still fall short of real engineering pipelines: they neither iterate like engineers nor evaluate what engineering requires. Prior work has treated CAD generation as two disjoint steps, part synthesis and assembly, where the former is graded by proximity to a gold reference and the latter, when handled at all, is reduced to a separate constraint solving step. In this work, we introduce a more industry-native task formulation that requires a model to produce a fully assembled multi-part STEP file from a free-form engineering brief, which is then validated via finite element analysis (FEA). FEA validation reveals that Codex (GPT-5.5) and Claude Code (Opus-4.7) agents do not produce a single strict-passing artifact in the main first-attempt sweep, with the best configuration meeting only about 20% of typed requirements on average. Moreover, we introduce two additional supervision signals, a novel text-only blueprint schema and a 21-view image renderer that aids the agent's visual inspection, that better align the generation loop with how engineers iterate in practice. On S2O and Fusion360, the same feedback tools improve geometric reconstruction, with GPT-5.5/xhigh rising from 0.444 to 0.592 Box-IoU on S2O and from 0.397 to 0.505 on Fusion360. Together these signals move CAD programs toward artifacts that are not only visually plausible but also checked against physical and structural requirements.
- Abstract(参考訳): CAD(Computer-Aided Design)は、現代の工業デザインのバックボーンであるが、CADジェネレータは依然として実際のエンジニアリングパイプラインに不足している。
従来の作業ではCAD生成を2つの不整合ステップとして扱い、前者は金基準に近接してグレードされ、後者は処理時に別個の制約解決ステップに還元される。
そこで本研究では, 有限要素解析(FEA)により, 有限要素解析(FEA)を用いて, 有限要素解析により, 自由形式工学ブリーフから, 完全に組み立てられた多部分STEPファイルを生成するモデルを必要とする, より産業的なタスク定式化を導入する。
FEAの検証によると、Codex (GPT-5.5) と Claude Code (Opus-4.7) のエージェントは、メインのファースト・アタプティブ・スイープで1つの厳密な通過アーティファクトを生成していない。
さらに、新しいテキストのみの青写真スキーマと、エージェントの視覚検査を支援する21ビュー画像レンダラーという、2つの追加の監視信号を導入する。
S2OとFusion360では、同じフィードバックツールが幾何再構成を改善し、GPT-5.5/xhighはS2Oでは0.444から0.592Box-IoU、Fusion360では0.397から0.505に上昇した。
これらの信号はCADプログラムを視覚的に可視であるだけでなく、物理的および構造的要求に対してチェック可能なアーティファクトへと移動させる。
関連論文リスト
- Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data [8.896486786253766]
実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。
我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。
このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
論文 参考訳(メタデータ) (2026-04-27T13:46:41Z) - MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale [92.09717763663873]
我々は、データエンジニアリングとトレーニング戦略設計を通じて、純粋に最先端の技術を進化させるMinerU2.5-Proを提案する。
コアとなるのは、カバレッジ、情報性、アノテーションの正確性を中心に設計されたData Engineだ。
我々は,MinerU2.5-Pro が OmniDocBench v1.6 上で 95.69 を達成することを示す。
論文 参考訳(メタデータ) (2026-04-06T15:44:18Z) - CADReasoner: Iterative Program Editing for CAD Reverse Engineering [8.468103398438917]
多くのAIシステムはCADのリバースエンジニアリングに取り組むが、その多くはシングルパスであり、細かい幾何学的詳細を見逃している。
CADReasonerは幾何差分を用いた予測を反復的に洗練するよう訓練されたモデルである。
モデルは、次のステップでレンダリングメッシュが返される実行可能なCadQuery Pythonプログラムを出力する。
論文 参考訳(メタデータ) (2026-02-18T10:27:29Z) - Using GUI Agent for Electronic Design Automation [123.86509061313912]
Graphical User Interface (GUI)エージェントは、スクリーンショットをアクションシーケンスにマッピングするエンドツーエンドパラダイムを採用する。
既存のGUIエージェントは、Microsoft WordやExcelのようなコモディティソフトウェアにのみ評価される。
この作業は、GUIエージェントを一般的なオフィス自動化から、専門的で高価値なエンジニアリングドメインまで拡張する。
論文 参考訳(メタデータ) (2025-12-12T14:49:32Z) - PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文 参考訳(メタデータ) (2025-03-23T17:24:32Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。