論文の概要: BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD
- arxiv url: http://arxiv.org/abs/2605.10865v2
- Date: Tue, 12 May 2026 05:46:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:07.143006
- Title: BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD
- Title(参考訳): BenchCAD: プログラムCADのための総合的で業界標準ベンチマーク
- Authors: Haozhe Zhang, Kaichen Liu, Miaomiao Chen, Lei Li, Shaojie Yang, Cheng Peng, Hanjie Chen,
- Abstract要約: 本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。
BenchCADには,106の産業部門を対象とした17,900のCadQueryプログラムが含まれている。
視覚的質問応答、コード質問応答、画像からコードへの生成、命令誘導コード編集を通じてモデルを評価する。
- 参考スコア(独自算出の注目度): 14.284307846349774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial Computer-Aided Design (CAD) code generation requires models to produce executable parametric programs from visual or textual inputs. Beyond recognizing the outer shape of a part, this task involves understanding its 3D structure, inferring engineering parameters, and choosing CAD operations that reflect how the part would be designed and manufactured. Despite the promise of Multimodal large language models (MLLMs) for this task, they are rarely evaluated on whether these capabilities jointly hold in realistic industrial CAD settings. We present BenchCAD, a unified benchmark for industrial CAD reasoning. BenchCAD contains 17,900 execution-verified CadQuery programs across 106 industrial part families, including bevel gears, compression springs, twist drills, and other reusable engineering designs. It evaluates models through visual question answering, code question answering, image-to-code generation, and instruction-guided code editing, enabling fine-grained analysis across perception, parametric abstraction, and executable program synthesis. Across 10+ frontier models, BenchCAD shows that current systems often recover coarse outer geometry but fail to produce faithful parametric CAD programs. Common failures include missing fine 3D structure, misinterpreting industrial design parameters, and replacing essential operations such as sweeps, lofts, and twist-extrudes with simpler sketch-and-extrude patterns. Fine-tuning and reinforcement learning improve in-distribution performance, but generalization to unseen part families remains limited. These results position BenchCAD as a benchmark for measuring and improving the industrial readiness of multimodal CAD automation.
- Abstract(参考訳): CAD(Industrial Computer-Aided Design)コード生成は、視覚的またはテキスト入力から実行可能なパラメトリックプログラムを生成するモデルを必要とする。
このタスクは、部品の外形を認識するだけでなく、その3D構造を理解し、工学的パラメーターを推論し、部品の設計と製造の仕方を反映したCAD操作を選択する。
このタスクにはMLLM(Multimodal large language model)が約束されているが、これらの機能が現実的なCAD設定で協調的に機能するかどうかを評価することは滅多にない。
本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。
BenchCADには、ベベルギア、圧縮スプリング、ねじりドリル、その他の再利用可能なエンジニアリング設計を含む、106の工業部品ファミリーで17,900のCadQueryプログラムが含まれている。
視覚的質問応答、コード質問応答、イメージ・ツー・コード生成、命令誘導コード編集を通じてモデルを評価し、知覚、パラメトリック抽象化、実行可能プログラム合成を含む詳細な分析を可能にする。
10以上のフロンティアモデルを通して、ベンチCADは現在のシステムがしばしば粗い外形状を回復するが、忠実なパラメトリックCADプログラムを作成できないことを示した。
一般的な失敗には、細かな3D構造の欠如、工業設計パラメータの誤解釈、スイープ、ロフト、ツイスト・エクストルーダといった重要な操作を単純なスケッチ・アンド・エクストルードパターンで置き換えることが含まれる。
微調整と強化学習は配当性能を向上させるが、見当たらない家族への一般化は依然として限られている。
これらの結果から,ベンチCADをマルチモーダルCAD自動化の産業的準備性の評価と改善のベンチマークとして位置づけた。
関連論文リスト
- CADBench: A Multimodal Benchmark for AI-Assisted CAD Program Generation [3.6136995620089145]
CADBenchはマルチモーダルCADプログラム生成のための統一ベンチマークである。
CADBenchは6つのベンチマークファミリーにまたがる18,000の評価サンプルを含んでいる。
CADに特化して汎用的な視覚言語システム11のベンチマークを行い,14万以上のCADプログラムを生成した。
論文 参考訳(メタデータ) (2026-05-11T17:25:47Z) - Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data [8.896486786253766]
実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。
我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。
このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
論文 参考訳(メタデータ) (2026-04-27T13:46:41Z) - Learning From Design Procedure To Generate CAD Programs for Data Augmentation [7.894465542100662]
大規模言語モデルに基づくCADプログラム生成における鍵となる課題は、生成した形状の幾何学的複雑さの制限である。
本稿では,LLMが参照曲面プログラムに条件付きCADプログラムを生成することを促す新しいデータ拡張パラダイムを提案する。
有機形状の集合を用いて参照面を変化させることで,生成したCADモデルの幾何学的分布を増大させる。
論文 参考訳(メタデータ) (2026-03-06T21:32:15Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。