論文の概要: Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data
- arxiv url: http://arxiv.org/abs/2604.24479v1
- Date: Mon, 27 Apr 2026 13:46:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.060639
- Title: Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data
- Title(参考訳): Zero-to-CAD:実データのない数百万スケールの解釈可能なCADプログラムのエージェント合成
- Authors: Mohammadmehdi Ataei, Farzaneh Askari, Kamal Rahimi Malekshan, Pradeep Kumar Jayaraman,
- Abstract要約: 実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。
我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。
このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
- 参考スコア(独自算出の注目度): 8.896486786253766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer-Aided Design (CAD) models are defined by their construction history: a parametric recipe that encodes design intent. However, existing large-scale 3D datasets predominantly consist of boundary representations (B-Reps) or meshes, stripping away this critical procedural information. To address this scarcity, we introduce Zero-to-CAD, a scalable framework for synthesizing executable CAD construction sequences. We frame synthesis as an agentic search problem: by embedding a large language model (LLM) within a feedback-driven CAD environment, our system iteratively generates, executes, and validates code using tools and documentation lookup to promote geometric validity and operation diversity. This agentic approach enables the synthesis of approximately one million executable, readable, editable CAD sequences, covering a rich vocabulary of operations beyond sketch-and-extrude workflows. We also release a curated subset of 100,000 high-quality models selected for geometric diversity. To demonstrate the dataset's utility, we fine-tune a vision-language model on our synthetic data to reconstruct editable CAD programs from multi-view images, outperforming strong baselines, including GPT-5.2, and effectively bootstrapping sequence generation capabilities without real construction-history training data. Zero-to-CAD bridges the gap between geometric scale and parametric interpretability, offering a vital resource for the next generation of CAD AI.
- Abstract(参考訳): CADモデル(Computer-Aided Design)は、設計意図を符号化するパラメトリックレシピである。
しかし、既存の大規模3Dデータセットは主に境界表現(B-Reps)またはメッシュで構成されており、この重要な手続き情報を削除している。
この不足に対処するため、Zero-to-CADは実行可能なCAD構築シーケンスを合成するためのスケーラブルなフレームワークである。
我々は,大規模言語モデル(LLM)をフィードバック駆動型CAD環境に組み込むことで,ツールやドキュメントによるコード生成,実行,検証を行い,幾何的妥当性と操作の多様性を促進する。
このエージェントアプローチにより、約100万の実行可能な可読性、編集可能なCADシーケンスを合成することができ、スケッチ・アンド・エクスクルードワークフローを超えて、操作の豊富な語彙をカバーできる。
また、幾何学的多様性のために選択された10,000の高品質モデルのキュレートされたサブセットもリリースします。
データセットの有用性を実証するため、我々は合成データ上に視覚言語モデルを微調整し、多視点画像から編集可能なCADプログラムを再構築し、GPT-5.2を含む強力なベースラインを上回り、実際の建設履歴のトレーニングデータなしで効率的にシーケンス生成機能を起動する。
Zero-to-CADは幾何学的スケールとパラメトリック解釈可能性のギャップを埋め、次世代CAD AIにとって重要なリソースを提供する。
関連論文リスト
- DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文 参考訳(メタデータ) (2026-03-05T19:04:07Z) - CADKnitter: Compositional CAD Generation from Text and Geometry Guidance [8.644079160190175]
幾何誘導拡散サンプリング戦略を用いた構成CAD生成フレームワークCADKnitterを提案する。
CADKnitterは、与えられたCADモデルの幾何学的制約と、所望の設計テキストプロンプトのセマンティック制約の両方に従う補完的なCAD部分を生成することができる。
また、310,000以上のCADモデルのサンプルと、テキストプロンプトとアセンブリメタデータを含むデータセット、いわゆるKnitCADをキュレートする。
論文 参考訳(メタデータ) (2025-12-12T01:06:38Z) - GenCAD-3D: CAD Program Generation using Multimodal Latent Space Alignment and Synthetic Dataset Balancing [3.5539239472975583]
我々は,3次元CADプログラムを生成するマルチモーダル生成フレームワークであるGenCAD-3Dを紹介する。
また、データセットのバランスと拡張を目的とした合成データ拡張戦略であるSynthBalも紹介する。
実験の結果,SynthBalは再構成精度を大幅に向上し,無効なCADモデルの生成を低減し,高精度なジオメトリの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-09-17T19:10:44Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design [14.874524630759332]
我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。
本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
論文 参考訳(メタデータ) (2025-07-13T21:11:53Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。