論文の概要: CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation
- arxiv url: http://arxiv.org/abs/2505.04481v2
- Date: Tue, 10 Jun 2025 13:44:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 19:51:30.182723
- Title: CAD-Llama: Leveraging Large Language Models for Computer-Aided Design Parametric 3D Model Generation
- Title(参考訳): CAD-Llama:コンピュータ支援設計パラメトリック3次元モデル生成のための大規模言語モデルを活用する
- Authors: Jiahao Li, Weijian Ma, Xueyang Li, Yunzhong Lou, Guichun Zhou, Xiangdong Zhou,
- Abstract要約: 本研究では,Large Language Models (LLMs) を用いたCADモデルにおけるパラメトリックシーケンスの生成について検討する。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習LLMの強化を目的としたフレームワークである。
- 参考スコア(独自算出の注目度): 16.212242362122947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Large Language Models (LLMs) have achieved significant success, prompting increased interest in expanding their generative capabilities beyond general text into domain-specific areas. This study investigates the generation of parametric sequences for computer-aided design (CAD) models using LLMs. This endeavor represents an initial step towards creating parametric 3D shapes with LLMs, as CAD model parameters directly correlate with shapes in three-dimensional space. Despite the formidable generative capacities of LLMs, this task remains challenging, as these models neither encounter parametric sequences during their pretraining phase nor possess direct awareness of 3D structures. To address this, we present CAD-Llama, a framework designed to enhance pretrained LLMs for generating parametric 3D CAD models. Specifically, we develop a hierarchical annotation pipeline and a code-like format to translate parametric 3D CAD command sequences into Structured Parametric CAD Code (SPCC), incorporating hierarchical semantic descriptions. Furthermore, we propose an adaptive pretraining approach utilizing SPCC, followed by an instruction tuning process aligned with CAD-specific guidelines. This methodology aims to equip LLMs with the spatial knowledge inherent in parametric sequences. Experimental results demonstrate that our framework significantly outperforms prior autoregressive methods and existing LLM baselines.
- Abstract(参考訳): 近年、Large Language Models (LLMs) は大きな成功を収め、汎用テキストを超えてドメイン固有の領域に生成能力を拡大することへの関心が高まっている。
本研究では,LLMを用いたCADモデルにおけるパラメトリックシーケンスの生成について検討した。
この試みは、CADモデルパラメータが3次元空間の形状と直接相関するので、LCMを用いてパラメトリックな3次元形状を作成するための最初のステップである。
LLMの強大な生成能力にもかかわらず、これらのモデルはトレーニング前の段階でパラメトリックなシーケンスに遭遇せず、3D構造の直接的な認識も持たないため、この課題は依然として困難なままである。
CAD-Llamaは,パラメトリックな3次元CADモデルを生成するための事前学習 LLM を強化するためのフレームワークである。
具体的には、階層的なアノテーションパイプラインとコードライクなフォーマットを開発し、パラメトリックな3DCADコマンドシーケンスを構造化パラメトリックCADコード(SPCC)に変換し、階層的な意味記述を取り入れた。
さらに,SPCCを利用した適応型事前学習手法を提案する。
この方法論は、パラメトリックシーケンスに固有の空間的知識をLLMに装備することを目的としている。
実験の結果,本フレームワークは従来の自己回帰法や既存のLCMベースラインよりも優れていた。
関連論文リスト
- CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - Text-to-CAD Generation Through Infusing Visual Feedback in Large Language Models [8.216545561416416]
本稿では,Large Language Models (LLM) をバックボーンとして使用するフレームワークであるCADFusionを紹介する。
CADFusionは質的にも定量的にも性能を著しく向上することを示した。
論文 参考訳(メタデータ) (2025-01-31T11:28:16Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - 3D-PreMise: Can Large Language Models Generate 3D Shapes with Sharp
Features and Parametric Control? [8.893200442359518]
本稿では,大規模言語モデルを用いてテキスト駆動型3次元形状を生成するフレームワークを提案する。
産業形状の3次元パラメトリックモデリングに適したデータセットである3D-PreMiseを提案する。
論文 参考訳(メタデータ) (2024-01-12T08:07:52Z) - 3D-GPT: Procedural 3D Modeling with Large Language Models [47.72968643115063]
命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文 参考訳(メタデータ) (2023-10-19T17:41:48Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。