論文の概要: CADFS: A Big CAD Program Dataset and Framework for Computer-Aided Design with Large Language Models
- arxiv url: http://arxiv.org/abs/2605.01925v1
- Date: Sun, 03 May 2026 15:12:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.997512
- Title: CADFS: A Big CAD Program Dataset and Framework for Computer-Aided Design with Large Language Models
- Title(参考訳): CADFS:大規模言語モデルを用いたコンピュータ支援設計のための大規模CADプログラムデータセットとフレームワーク
- Authors: Vladislav Pyatov, Gleb Bobrovskikh, Saveliy Galochkin, Nikita Boldyrev, Oleg Voynov, Alexander Filippov, Gonzalo Ferrer, Peter Wonka, Evgeny Burnaev,
- Abstract要約: 本稿では,大規模視覚言語モデルによる複雑なCAD設計履歴の生成を可能にするデータ中心型フレームワークCADFSを紹介する。
我々は15のモデリング操作にまたがる450kの実世界のCADモデルのデータセットを構築した。
この表現でVLMを微調整すると、テキスト条件付きCAD生成と画像ベース再構成の最先端結果が得られる。
- 参考スコア(独自算出の注目度): 80.47087401394882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce CADFS, a data-centric framework that enables large vision-language models to generate complex CAD design histories. Existing generative CAD systems are restricted to sketch-extrude operations due to simplified representations and limited datasets. We address this by introducing a FeatureScript-based representation and constructing a dataset of 450k real-world CAD models spanning 15 modeling operations. We obtain the dataset via a new pipeline that reconstructs clean, executable FeatureScript programs and provides multimodal annotations. Fine-tuning a VLM on this representation yields state-of-the-art results in text-conditioned CAD generation and image-based reconstruction, producing more accurate, diverse, and feature-rich designs than prior frameworks. Ablations show that each individual component of our framework, i.e., the FeatureScript representation, the extended operation set, and representation-aligned textual descriptions, significantly improves performance. Our framework substantially broadens the complexity and realism achievable in generative CAD. The CADFS framework and the new dataset are available at https://voyleg.github.io/cadfs/.
- Abstract(参考訳): 本稿では,大規模視覚言語モデルによる複雑なCAD設計履歴の生成を可能にするデータ中心型フレームワークCADFSを紹介する。
既存のCADシステムは、単純化された表現と限られたデータセットのため、スケッチエクストラルド操作に制限される。
本稿では、FeatureScriptベースの表現を導入し、15のモデリング操作にまたがる450万の現実世界CADモデルのデータセットを構築することで、この問題に対処する。
クリーンで実行可能なFeatureScriptプログラムを再構築し、マルチモーダルアノテーションを提供する新しいパイプラインを通じてデータセットを取得する。
この表現でVLMを微調整すると、テキストコンディショニングされたCAD生成と画像ベースの再構築が実現し、以前のフレームワークよりも正確で多様な機能豊富な設計が生み出される。
アブレーションは、我々のフレームワークの各コンポーネント、すなわち、FeatureScript表現、拡張された操作セット、および表現に整合したテキスト記述が、パフォーマンスを著しく改善することを示している。
我々のフレームワークは、生成CADで実現可能な複雑さとリアリズムを大幅に広げる。
CADFSフレームワークと新しいデータセットはhttps://voyleg.github.io/cadfs/で公開されている。
関連論文リスト
- Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data [8.896486786253766]
実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。
我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。
このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
論文 参考訳(メタデータ) (2026-04-27T13:46:41Z) - DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文 参考訳(メタデータ) (2026-03-05T19:04:07Z) - CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design [14.874524630759332]
我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。
本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
論文 参考訳(メタデータ) (2025-07-13T21:11:53Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.67882997399021]
本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は,ユーザのデザイン意図に基づいて編集可能なポスターを生成する自動テキスト投稿システムを開発した。
論文 参考訳(メタデータ) (2024-06-05T03:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。