論文の概要: CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation
- arxiv url: http://arxiv.org/abs/2505.04481v2
- Date: Tue, 10 Jun 2025 13:44:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 19:51:30.182723
- Title: CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation
- Title(参考訳): CAD-Llama:コンピュータ支援設計パラメトリック3次元モデル生成のための大規模言語モデルを活用する
- Authors: Jiahao Li, Weijian Ma, Xueyang Li, Yunzhong Lou, Guichun Zhou, Xiangdong Zhou,
- Abstract要約: 本研究では,Large Language Models (LLMs) を用いたCADモデルにおけるパラメトリックシーケンスの生成について検討する。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習LLMの強化を目的としたフレームワークである。
- 参考スコア(独自算出の注目度): 16.212242362122947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Large Language Models (LLMs) have achieved significant success, prompting increased interest in expanding their generative capabilities beyond general text into domain-specific areas. This study investigates the generation of parametric sequences for computer-aided design (CAD) models using LLMs. This endeavor represents an initial step towards creating parametric 3D shapes with LLMs, as CAD model parameters directly correlate with shapes in three-dimensional space. Despite the formidable generative capacities of LLMs, this task remains challenging, as these models neither encounter parametric sequences during their pretraining phase nor possess direct awareness of 3D structures. To address this, we present CAD-Llama, a framework designed to enhance pretrained LLMs for generating parametric 3D CAD models. Specifically, we develop a hierarchical annotation pipeline and a code-like format to translate parametric 3D CAD command sequences into Structured Parametric CAD Code (SPCC), incorporating hierarchical semantic descriptions. Furthermore, we propose an adaptive pretraining approach utilizing SPCC, followed by an instruction tuning process aligned with CAD-specific guidelines. This methodology aims to equip LLMs with the spatial knowledge inherent in parametric sequences. Experimental results demonstrate that our framework significantly outperforms prior autoregressive methods and existing LLM baselines.
- Abstract(参考訳): 近年、Large Language Models (LLMs) は大きな成功を収め、汎用テキストを超えてドメイン固有の領域に生成能力を拡大することへの関心が高まっている。
本研究では,LLMを用いたCADモデルにおけるパラメトリックシーケンスの生成について検討した。
この試みは、CADモデルパラメータが3次元空間の形状と直接相関するので、LCMを用いてパラメトリックな3次元形状を作成するための最初のステップである。
LLMの強大な生成能力にもかかわらず、これらのモデルはトレーニング前の段階でパラメトリックなシーケンスに遭遇せず、3D構造の直接的な認識も持たないため、この課題は依然として困難なままである。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習 LLM を強化するためのフレームワークである。
具体的には、階層的なアノテーションパイプラインとコードライクなフォーマットを開発し、パラメトリックな3DCADコマンドシーケンスを構造化パラメトリックCADコード(SPCC)に変換し、階層的な意味記述を取り入れた。
さらに,SPCCを利用した適応型事前学習手法を提案する。
この方法論は、パラメトリックシーケンスに固有の空間的知識をLLMに装備することを目的としている。
実験の結果,本フレームワークは従来の自己回帰法や既存のLCMベースラインよりも優れていた。
関連論文リスト
- MeshLLM: Empowering Large Language Models to Progressively Understand and Generate 3D Mesh [79.20802127426003]
MeshLLMは、大規模言語モデル(LLM)を活用して、テキストシリアライズされた3Dメッシュを理解して生成するフレームワークである。
我々は3次元メッシュを構造的に意味のあるサブユニットに分割するプリミティブ・メシュ分解戦略を導入する。
実験により、MeshLLMはメッシュ生成の品質と形状理解の両方において最先端のLLaMA-Meshよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-08-02T07:37:37Z) - SeqAffordSplat: Scene-level Sequential Affordance Reasoning on 3D Gaussian Splatting [85.87902260102652]
本稿では, 連続3次元ガウシアン・アフラマンス推論の課題について紹介する。
次に,SeqSplatNetを提案する。SqSplatNetは,命令を直接3Dアベイランスマスクのシーケンスにマッピングするエンドツーエンドフレームワークである。
本手法は,1段階のインタラクションから,シーンレベルでの複雑なシーケンシャルなタスクへの可利用性推論を効果的に向上させる。
論文 参考訳(メタデータ) (2025-07-31T17:56:55Z) - CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [50.867869718716555]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。
われわれはTriView2CADをリリースした。
論文 参考訳(メタデータ) (2025-05-31T13:52:56Z) - Seek-CAD: A Self-refined Generative Modeling for 3D Parametric CAD Using Local Inference via DeepSeek [19.441404313543227]
本研究は,CADモデル生成のための自己補充機構に視覚的および連鎖的フィードバック(CoT)を組み込んだ最初の研究である。
SSR(Sketch, Sketch-based feature, and Refinements)の3次元設計パラダイムを中心に構築された革新的な3次元CADモデルデータセットを提案する。
論文 参考訳(メタデータ) (2025-05-23T10:11:19Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - Text-to-CAD Generation Through Infusing Visual Feedback in Large Language Models [8.216545561416416]
本稿では,Large Language Models (LLM) をバックボーンとして使用するフレームワークであるCADFusionを紹介する。
CADFusionは質的にも定量的にも性能を著しく向上することを示した。
論文 参考訳(メタデータ) (2025-01-31T11:28:16Z) - CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs [15.505120320280007]
本研究では,空間推論強化MLLMを用いたCAD合成法CAD-GPTを紹介する。
空間展開機構を用いて3次元空間位置と3次元スケッチ平面回転角を1次元言語特徴空間にマッピングする。
また、2Dスケッチ座標を適切な平面空間に識別し、空間開始位置、スケッチ方向、および2Dスケッチ座標変換の正確な決定を可能にする。
論文 参考訳(メタデータ) (2024-12-27T14:19:36Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - 3D-PreMise: Can Large Language Models Generate 3D Shapes with Sharp
Features and Parametric Control? [8.893200442359518]
本稿では,大規模言語モデルを用いてテキスト駆動型3次元形状を生成するフレームワークを提案する。
産業形状の3次元パラメトリックモデリングに適したデータセットである3D-PreMiseを提案する。
論文 参考訳(メタデータ) (2024-01-12T08:07:52Z) - 3D-GPT: Procedural 3D Modeling with Large Language Models [47.72968643115063]
命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文 参考訳(メタデータ) (2023-10-19T17:41:48Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。