論文の概要: PR-CAD: Progressive Refinement for Unified Controllable and Faithful Text-to-CAD Generation with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.19773v1
- Date: Fri, 27 Mar 2026 12:13:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.065627
- Title: PR-CAD: Progressive Refinement for Unified Controllable and Faithful Text-to-CAD Generation with Large Language Models
- Title(参考訳): PR-CAD:大規模言語モデルを用いた統一制御可能で忠実なテキスト・ツー・CAD生成のためのプログレッシブ・リファインメント
- Authors: Jiyuan An, Jiachen Zhao, Fan Chen, Liner Yang, Zhenghao Liu, Hongyan Wang, Weihua An, Meishan Zhang, Erhong Yang,
- Abstract要約: PR-CADは、制御可能で忠実なテキスト・ツー・CADモデリングのための生成と編集を統一するプログレッシブ・リファインメント・フレームワークである。
データセットは、編集操作の種類を体系的に定義し、高度にヒューマンライクなインタラクションデータを生成する。
パブリックベンチマークでは、PR-CADは生成シナリオと改善シナリオの両方において最先端の制御性と忠実性を達成する。
- 参考スコア(独自算出の注目度): 32.278474349549704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The construction of CAD models has traditionally relied on labor-intensive manual operations and specialized expertise. Recent advances in large language models (LLMs) have inspired research into text-to-CAD generation. However, existing approaches typically treat generation and editing as disjoint tasks, limiting their practicality. We propose PR-CAD, a progressive refinement framework that unifies generation and editing for controllable and faithful text-to-CAD modeling. To support this, we curate a high-fidelity interaction dataset spanning the full CAD lifecycle, encompassing multiple CAD representations as well as both qualitative and quantitative descriptions. The dataset systematically defines the types of edit operations and generates highly human-like interaction data. Building on a CAD representation tailored for LLMs, we propose a reinforcement learning-enhanced reasoning framework that integrates intent understanding, parameter estimation, and precise edit localization into a single agent. This enables an "all-in-one" solution for both design creation and refinement. Extensive experiments demonstrate strong mutual reinforcement between generation and editing tasks, and across qualitative and quantitative modalities. On public benchmarks, PR-CAD achieves state-of-the-art controllability and faithfulness in both generation and refinement scenarios, while also proving user-friendly and significantly improving CAD modeling efficiency.
- Abstract(参考訳): CADモデルの構築は、伝統的に労働集約的な手作業と専門的な専門知識に依存してきた。
大規模言語モデル(LLM)の最近の進歩は、テキスト・ツー・CAD生成の研究にインスピレーションを与えている。
しかし、既存のアプローチは通常、生成と編集を非結合的なタスクとして扱い、実用性を制限する。
制御可能で忠実なテキスト・ツー・CADモデリングのための生成と編集を統一するプログレッシブ・リファインメント・フレームワークであるPR-CADを提案する。
これをサポートするために,CADのライフサイクル全体にわたる高忠実な相互作用データセットをキュレートし,複数のCAD表現と質的および定量的な記述を包含する。
データセットは、編集操作の種類を体系的に定義し、高度にヒューマンライクなインタラクションデータを生成する。
LLMに適したCAD表現に基づいて、意図理解、パラメータ推定、高精度な編集ローカライゼーションを単一のエージェントに統合する強化学習強化推論フレームワークを提案する。
これによって"オールインワン"なソリューションが,設計生成と改良の両方に実現される。
大規模な実験は、生成タスクと編集タスク、質的および定量的なモダリティの間に強い相互強化を示す。
パブリックベンチマークでは、PR-CADは、生成シナリオと改善シナリオの両方において、最先端の制御性と忠実性を達成すると同時に、ユーザフレンドリでCADモデリング効率を大幅に改善する。
関連論文リスト
- CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation [30.08737988265254]
スケッチから3Dモデルを再構築する既存の方法は、しばしば非編集可能で近似的なモデルを生成する。
本稿では,CADコード生成のための新しい訓練パラダイムであるCME-CAD(Heterogeneous Collaborative Multi-Expert Reinforcement Learning)パラダイムを提案する。
MERL(Multi-Expert Fine-Tuning)とMulti-Expert Reinforcement Learning(MERL)という2段階の学習プロセスを導入する。
論文 参考訳(メタデータ) (2025-12-29T09:37:53Z) - HistCAD: Geometrically Constrained Parametric History-based CAD Dataset [7.7008607520955]
HistCADは制約対応モデリングシーケンスを特徴とする大規模データセットである。
HistCADは、編集可能、制約対応、セマンティックにリッチな生成CADモデリングを進めるための統一されたベンチマークを提供する。
論文 参考訳(メタデータ) (2025-12-08T05:52:14Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - CADDesigner: Conceptual Design of CAD Models Based on General-Purpose Agent [19.923688194902674]
大規模言語モデル(LLM)を用いたCAD概念設計のためのエージェントを提案する。
CIP(Context-Independent Imperative Paradigm)に基づいて構築され、高品質なCADモデリングコードを生成する。
論文 参考訳(メタデータ) (2025-08-01T19:15:56Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。