論文の概要: CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design
- arxiv url: http://arxiv.org/abs/2507.09792v1
- Date: Sun, 13 Jul 2025 21:11:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.983041
- Title: CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design
- Title(参考訳): CADmium:テキスト駆動型シークエンシャルCAD設計のための微調整コード言語モデル
- Authors: Prashant Govindarajan, Davide Baldelli, Jay Pathak, Quentin Fournier, Sarath Chandar,
- Abstract要約: 我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。
本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
- 参考スコア(独自算出の注目度): 10.105055422074734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer-aided design (CAD) is the digital construction of 2D and 3D objects, and is central to a wide range of engineering and manufacturing applications like automobile and aviation. Despite its importance, CAD modeling remains largely a time-intensive, manual task. Recent works have attempted to automate this process with small transformer-based models and handcrafted CAD sequence representations. However, there has been little effort to leverage the potential of large language models (LLMs) for sequential CAD design. In this work, we introduce a new large-scale dataset of more than 170k CAD models annotated with high-quality, human-like descriptions generated with our pipeline based on GPT-4.1. Using this dataset, we fine-tune powerful code-LLMs to generate CAD sequences represented in a JSON-based format from natural language descriptions, demonstrating the viability and effectiveness of this approach for text-conditioned CAD generation. Because simple metrics often fail to reflect the quality of generated objects, we introduce geometric and topological metrics based on sphericity, mean curvature, and Euler characteristic to provide richer structural insights. Our experiments and ablation studies on both synthetic and human-annotated data demonstrate that CADmium is able to automate CAD design, drastically speeding up the design of new objects. The dataset, code, and fine-tuned models are available online.
- Abstract(参考訳): CAD(Computer-Aided Design)は、2Dオブジェクトと3Dオブジェクトのデジタル構築であり、自動車や航空機などの幅広い工学・製造用途の中心となっている。
その重要性にもかかわらず、CADモデリングは主に時間集約的な手作業である。
最近の研究は、小さなトランスモデルと手作りCADシーケンス表現を用いて、このプロセスを自動化しようと試みている。
しかし, 大規模言語モデル (LLM) の可能性を, 逐次CAD設計に活用するための努力はほとんど行われていない。
本稿では,GPT-4.1に基づく高品質な人文的記述を付加した170k以上のCADモデルの大規模データセットを提案する。
このデータセットを用いて、自然言語記述からJSONベースの形式で表現されたCADシーケンスを生成するための強力なコード-LLMを微調整し、テキスト条件付きCAD生成におけるこのアプローチの有効性と有効性を示す。
単純な測度はしばしば生成物の品質を反映しないので、よりリッチな構造的な洞察を提供するために、球状性、平均曲率、オイラー特性に基づく幾何学的および位相的測度を導入する。
CADmiumがCAD設計を自動化し,新しいオブジェクトの設計を劇的に高速化できることを示す。
データセット、コード、微調整されたモデルはオンラインで利用可能だ。
関連論文リスト
- Automated CAD Modeling Sequence Generation from Text Descriptions via Transformer-Based Large Language Models [12.748800287967848]
大規模言語モデル(LLM)とコンピュータ支援設計(CAutoD)を統合した産業設計自動化のための新しいフレームワークを提案する。
提案手法では,LLMと視覚言語による大規模モデル(VLLM)を活用して高品質なパラメータと外観記述を生成する半自動データパイプライン,デュアルチャネル特徴集約によるモデリングシーケンスを予測するトランスフォーマーベースのCADジェネレータ(TCADGen),CADLLMと呼ばれる拡張CADモデリング生成モデル,の3点を紹介する。
論文 参考訳(メタデータ) (2025-05-26T04:17:51Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文 参考訳(メタデータ) (2025-03-23T17:24:32Z) - BlenderLLM: Training Large Language Models for Computer-Aided Design with Self-improvement [45.19076032719869]
我々は,大規模言語モデル(LLM)をCAD(Computer-Aided Design)で訓練するフレームワークであるBlenderLLMを提案する。
以上の結果から,既存のモデルではCADスクリプトの正確な生成に重大な制限があることが明らかとなった。
命令ベースの微調整と反復的な自己改善によって、BlenderLLMはCADスクリプト生成の機能と精度の両方においてこれらのモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2024-12-16T14:34:02Z) - Text2CAD: Text to 3D CAD Generation via Technical Drawings [45.3611544056261]
Text2CADは、生成プロセスを自動化するために調整された安定した拡散モデルを利用する新しいフレームワークである。
テキスト2CADは,高品質な3次元CADモデルに正確に変換された技術図面を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-11-09T15:12:06Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - OpenECAD: An Efficient Visual Language Model for Editable 3D-CAD Design [1.481550828146527]
OpenECADモデル(0.55B, 0.89B, 2.4B, 3.1B)を作成するための事前学習モデルの微調整を行った。
OpenECADモデルは、入力として3Dデザインの画像を処理することができ、高度に構造化された2Dスケッチと3D構築コマンドを生成する。
これらの出力は、プロジェクトファイルを生成するために既存のCADツールのAPIで直接使用することができる。
論文 参考訳(メタデータ) (2024-06-14T10:47:52Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z) - DeepCAD: A Deep Generative Network for Computer-Aided Design Models [37.655225142981564]
形状をコンピュータ支援設計(CAD)操作のシーケンスとして記述した形状表現の3次元生成モデルについて述べる。
CAD操作と自然言語の類似性について,トランスフォーマーに基づくCAD生成ネットワークを提案する。
論文 参考訳(メタデータ) (2021-05-20T03:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。