論文の概要: CADBench: A Multimodal Benchmark for AI-Assisted CAD Program Generation
- arxiv url: http://arxiv.org/abs/2605.10873v1
- Date: Mon, 11 May 2026 17:25:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:51.028603
- Title: CADBench: A Multimodal Benchmark for AI-Assisted CAD Program Generation
- Title(参考訳): CADBench:AI支援CADプログラム生成のためのマルチモーダルベンチマーク
- Authors: Anna C. Doris, Jacob Thomas Sony, Ghadi Nehme, Era Syla, Amin Heyrani Nobari, Faez Ahmed,
- Abstract要約: CADBenchはマルチモーダルCADプログラム生成のための統一ベンチマークである。
CADBenchは6つのベンチマークファミリーにまたがる18,000の評価サンプルを含んでいる。
CADに特化して汎用的な視覚言語システム11のベンチマークを行い,14万以上のCADプログラムを生成した。
- 参考スコア(独自算出の注目度): 3.6136995620089145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recovering editable CAD programs from images or 3D observations is central to AI-assisted design, but progress is difficult to measure because existing evaluations are fragmented across datasets, modalities, and metrics. We introduce CADBench, a unified benchmark for multimodal CAD program generation. CADBench contains 18,000 evaluation samples spanning six benchmark families derived from DeepCAD, Fusion 360, ABC, MCB, and Objaverse; five input modalities including clean meshes, noisy meshes, single-view renders, photorealistic renders, and multi-view renders; and six metrics covering geometric fidelity, executability, and program compactness. STEP-based families are stratified by B-rep face count and all families are diversity-sampled to support controlled analysis across complexity and object variation. We benchmark eleven CAD-specialized and general-purpose vision-language systems, generating more than 1.4 million CAD programs. Under idealized inputs, specialized mesh-to-CAD models substantially outperform code-generating VLMs, which remain far from reliable CAD program reconstruction. CADBench further reveals three recurring failure modes: reconstruction quality degrades with geometric complexity, CAD-specialized models can be brittle under modality shift, and model rankings change across metrics. Together, these results position CADBench as a diagnostic testbed for measuring progress in editable 3D reconstruction and multimodal CAD understanding. The benchmark is publicly available at https://huggingface.co/datasets/DeCoDELab/CADBench.
- Abstract(参考訳): 画像や3D観察から編集可能なCADプログラムを復元することは、AI支援設計の中心であるが、既存の評価がデータセット、モダリティ、メトリクス間で断片化されているため、測定は困難である。
CADBenchはマルチモーダルCADプログラム生成のための統一ベンチマークである。
CADBenchは、DeepCAD、Fusion 360、ABC、MCB、Objaverseから派生した6つのベンチマークファミリーにまたがる18,000の評価サンプル、クリーンメッシュ、ノイズメッシュ、シングルビューレンダリング、フォトリアリスティックレンダリング、マルチビューレンダリングを含む5つの入力モダリティ、幾何学的忠実性、実行可能性、プログラムのコンパクト性をカバーする6つのメトリクスを含む。
STEPをベースとした家族は、B-repの顔数によって階層化され、すべての家族は、複雑さとオブジェクトの変動の制御分析をサポートするために多様性サンプリングされている。
CADに特化して汎用的な視覚言語システム11のベンチマークを行い,14万以上のCADプログラムを生成した。
理想的な入力の下では、特殊なメッシュ・ツー・CADモデルは、信頼性の高いCADプログラムの再構築には程遠い、コード生成VLMよりも大幅に優れている。
CADBenchはさらに、3つの繰り返し発生する障害モードを明らかにしている。再構築品質は幾何的な複雑さで劣化し、CAD特化モデルはモダリティシフトの下で不安定になり、モデルランキングはメトリクスによって変化する。
これらの結果からCADBenchは,編集可能な3次元再構成とマルチモーダルCAD理解の進展を計測するための診断テストベッドとして位置づけられた。
ベンチマークはhttps://huggingface.co/datasets/DeCoDELab/CADBenchで公開されている。
関連論文リスト
- BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD [14.284307846349774]
本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。
BenchCADには,106の産業部門を対象とした17,900のCadQueryプログラムが含まれている。
視覚的質問応答、コード質問応答、画像からコードへの生成、命令誘導コード編集を通じてモデルを評価する。
論文 参考訳(メタデータ) (2026-05-11T17:13:36Z) - Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data [8.896486786253766]
実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。
我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。
このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
論文 参考訳(メタデータ) (2026-04-27T13:46:41Z) - DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文 参考訳(メタデータ) (2026-03-05T19:04:07Z) - RAG-6DPose: Retrieval-Augmented 6D Pose Estimation via Leveraging CAD as Knowledge Base [112.72361202480154]
本稿では,3次元CADモデルを知識ベースとして活用する検索拡張手法であるRAG-6DPoseを提案する。
標準的なベンチマークと実世界のロボットタスクによる実験結果は、我々のアプローチの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2025-06-23T17:19:41Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。