論文の概要: Automated CAD Modeling Sequence Generation from Text Descriptions via Transformer-Based Large Language Models
- arxiv url: http://arxiv.org/abs/2505.19490v1
- Date: Mon, 26 May 2025 04:17:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.160826
- Title: Automated CAD Modeling Sequence Generation from Text Descriptions via Transformer-Based Large Language Models
- Title(参考訳): 変圧器を用いた大規模言語モデルによるテキスト記述からの自動CADモデリングシーケンス生成
- Authors: Jianxing Liao, Junyan Xu, Yatao Sun, Maowen Tang, Sicheng He, Jingxian Liao, Shui Yu, Yun Li, Hongguan Xiao,
- Abstract要約: 大規模言語モデル(LLM)とコンピュータ支援設計(CAutoD)を統合した産業設計自動化のための新しいフレームワークを提案する。
提案手法では,LLMと視覚言語による大規模モデル(VLLM)を活用して高品質なパラメータと外観記述を生成する半自動データパイプライン,デュアルチャネル特徴集約によるモデリングシーケンスを予測するトランスフォーマーベースのCADジェネレータ(TCADGen),CADLLMと呼ばれる拡張CADモデリング生成モデル,の3点を紹介する。
- 参考スコア(独自算出の注目度): 12.748800287967848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing complex computer-aided design (CAD) models is often time-consuming due to challenges such as computational inefficiency and the difficulty of generating precise models. We propose a novel language-guided framework for industrial design automation to address these issues, integrating large language models (LLMs) with computer-automated design (CAutoD).Through this framework, CAD models are automatically generated from parameters and appearance descriptions, supporting the automation of design tasks during the detailed CAD design phase. Our approach introduces three key innovations: (1) a semi-automated data annotation pipeline that leverages LLMs and vision-language large models (VLLMs) to generate high-quality parameters and appearance descriptions; (2) a Transformer-based CAD generator (TCADGen) that predicts modeling sequences via dual-channel feature aggregation; (3) an enhanced CAD modeling generation model, called CADLLM, that is designed to refine the generated sequences by incorporating the confidence scores from TCADGen. Experimental results demonstrate that the proposed approach outperforms traditional methods in both accuracy and efficiency, providing a powerful tool for automating industrial workflows and generating complex CAD models from textual prompts. The code is available at https://jianxliao.github.io/cadllm-page/
- Abstract(参考訳): 複雑なコンピュータ支援設計(CAD)モデルの設計は、計算の非効率性や正確なモデルを生成することの難しさといった問題により、しばしば時間がかかる。
本稿では,これらの問題に対処し,大規模言語モデル (LLM) とコンピュータ自動設計 (CAutoD) を統合した,産業設計自動化のための新しい言語誘導フレームワークを提案する。
このフレームワークを通じてCADモデルはパラメータや外観記述から自動的に生成され、詳細なCAD設計フェーズにおける設計タスクの自動化をサポートする。
提案手法では,LLMと視覚言語大モデル(VLLM)を利用して高品質なパラメータと外観記述を生成する半自動データアノテーションパイプライン,デュアルチャネル特徴量集計によるモデリングシーケンスの予測を行うトランスフォーマーベースCADジェネレータ(TCADGen),CADLLMと呼ばれる拡張CADモデリング生成モデル,TCADGenの信頼性スコアを組み込むことで生成したシーケンスを改良する。
提案手法は,産業ワークフローの自動化や複雑なCADモデルをテキストプロンプトから生成するための強力なツールとして,精度と効率の両方で従来の手法より優れていることを示す。
コードはhttps://jianxliao.github.io/cadllm-page/で公開されている。
関連論文リスト
- CME-CAD: Heterogeneous Collaborative Multi-Expert Reinforcement Learning for CAD Code Generation [30.08737988265254]
スケッチから3Dモデルを再構築する既存の方法は、しばしば非編集可能で近似的なモデルを生成する。
本稿では,CADコード生成のための新しい訓練パラダイムであるCME-CAD(Heterogeneous Collaborative Multi-Expert Reinforcement Learning)パラダイムを提案する。
MERL(Multi-Expert Fine-Tuning)とMulti-Expert Reinforcement Learning(MERL)という2段階の学習プロセスを導入する。
論文 参考訳(メタデータ) (2025-12-29T09:37:53Z) - From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-08-13T18:30:49Z) - CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design [10.105055422074734]
我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。
本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
論文 参考訳(メタデータ) (2025-07-13T21:11:53Z) - Generative AI for CAD Automation: Leveraging Large Language Models for 3D Modelling [31.94035963354055]
大規模言語モデル(LLM)は、効率性、スケーラビリティ、革新性を向上させることで産業に革命をもたらしている。
本稿では,フリーCAD と LLM をCAD ツールとして統合することにより,CAD の自動設計における LLM の可能性を検討する。
本稿では,LLMが自然言語記述からCADスクリプトを生成するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-05T23:30:17Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [50.867869718716555]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning [55.16668009268005]
3つの入力モードを同時に処理するマルチモーダルCAD再構成モデルを提案する。
大規模プロシージャ生成データに対する教師付き微調整(SFT)と,オンラインフィードバックを用いた強化学習(RL)の2段階パイプラインをプログラム的に取得した。
DeepCADベンチマークでは、SFTモデルは3つの入力モードすべてにおいて既存の単一モードアプローチを同時に上回ります。
論文 参考訳(メタデータ) (2025-05-28T22:32:31Z) - Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek [19.441404313543227]
本研究は,CADモデル生成のための自己補充機構に視覚的および連鎖的フィードバック(CoT)を組み込んだ最初の研究である。
SSR(Sketch, Sketch-based feature, and Refinements)の3次元設計パラダイムを中心に構築された革新的な3次元CADモデルデータセットを提案する。
論文 参考訳(メタデータ) (2025-05-23T10:11:19Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - BlenderLLM: Training Large Language Models for Computer-Aided Design with Self-improvement [45.19076032719869]
我々は,大規模言語モデル(LLM)をCAD(Computer-Aided Design)で訓練するフレームワークであるBlenderLLMを提案する。
以上の結果から,既存のモデルではCADスクリプトの正確な生成に重大な制限があることが明らかとなった。
命令ベースの微調整と反復的な自己改善によって、BlenderLLMはCADスクリプト生成の機能と精度の両方においてこれらのモデルを大幅に上回っている。
論文 参考訳(メタデータ) (2024-12-16T14:34:02Z) - Text2CAD: Text to 3D CAD Generation via Technical Drawings [45.3611544056261]
Text2CADは、生成プロセスを自動化するために調整された安定した拡散モデルを利用する新しいフレームワークである。
テキスト2CADは,高品質な3次元CADモデルに正確に変換された技術図面を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-11-09T15:12:06Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - GenCAD: Image-Conditioned Computer-Aided Design Generation with Transformer-Based Contrastive Representation and Diffusion Priors [3.796768352477804]
CAD(Computer-Aided Design)による製造可能で編集可能な3D形状の作成は、手作業と時間を要する作業である。
本稿では、画像入力をパラメトリックCADコマンドシーケンスに変換するために、コントラスト学習フレームワークと潜時拡散モデルを備えた自己回帰変換器を用いた生成モデルであるGenCADを紹介する。
論文 参考訳(メタデータ) (2024-09-08T23:49:11Z) - Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - Hierarchical Neural Coding for Controllable CAD Model Generation [34.14256897199849]
本稿では,CAD(Computer Aided Design)の新しい生成モデルを提案する。
これはCADモデルの高レベルな設計概念を、ニューラルネットワークの3レベル階層木として表現している。
コードツリーを使用してターゲット設計を指定することでCADモデルの生成や完成を制御する。
論文 参考訳(メタデータ) (2023-06-30T21:49:41Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。