論文の概要: FlexCAD: Unified and Versatile Controllable CAD Generation with Fine-tuned Large Language Models
- arxiv url: http://arxiv.org/abs/2411.05823v1
- Date: Tue, 05 Nov 2024 05:45:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:11:01.586614
- Title: FlexCAD: Unified and Versatile Controllable CAD Generation with Fine-tuned Large Language Models
- Title(参考訳): FlexCAD: 微調整大言語モデルによる一元化・多元化可能なCAD生成
- Authors: Zhanwei Zhang, Shizhao Sun, Wenxiao Wang, Deng Cai, Jiang Bian,
- Abstract要約: ユーザ意図に基づいてコンピュータ支援デザイン(CAD)モデルを作成することへの関心が高まっている。
既存の作業は限定的な制御性を提供し、異なるタイプの制御のための別々のモデルが必要です。
大規模言語モデルを微調整した統合モデルFlexCADを提案する。
- 参考スコア(独自算出の注目度): 22.010338370150738
- License:
- Abstract: Recently, there is a growing interest in creating computer-aided design (CAD) models based on user intent, known as controllable CAD generation. Existing work offers limited controllability and needs separate models for different types of control, reducing efficiency and practicality. To achieve controllable generation across all CAD construction hierarchies, such as sketch-extrusion, extrusion, sketch, face, loop and curve, we propose FlexCAD, a unified model by fine-tuning large language models (LLMs). First, to enhance comprehension by LLMs, we represent a CAD model as a structured text by abstracting each hierarchy as a sequence of text tokens. Second, to address various controllable generation tasks in a unified model, we introduce a hierarchy-aware masking strategy. Specifically, during training, we mask a hierarchy-aware field in the CAD text with a mask token. This field, composed of a sequence of tokens, can be set flexibly to represent various hierarchies. Subsequently, we ask LLMs to predict this masked field. During inference, the user intent is converted into a CAD text with a mask token replacing the part the user wants to modify, which is then fed into FlexCAD to generate new CAD models. Comprehensive experiments on public dataset demonstrate the effectiveness of FlexCAD in both generation quality and controllability. Code will be available at https://github.com/microsoft/CADGeneration/FlexCAD.
- Abstract(参考訳): 近年,制御可能なCAD生成として知られるユーザ意図に基づくコンピュータ支援デザイン(CAD)モデルの作成への関心が高まっている。
既存の作業は限定的な制御性を提供し、異なるタイプの制御のための別々のモデルを必要とし、効率と実用性を減らす。
スケッチ・エクストルージョン, エクストルージョン, スケッチ, 顔, ループ, 曲線など, CAD構築階層全体の制御可能な生成を実現するために, 大規模言語モデル(LLM)を微調整した統一モデルFlexCADを提案する。
まず、LLMによる理解を高めるために、各階層をテキストトークンのシーケンスとして抽象化することにより、CADモデルを構造化テキストとして表現する。
次に,様々な制御可能な生成タスクを統一モデルで処理するために,階層型マスキング方式を導入する。
具体的には、トレーニング中にCADテキストの階層認識フィールドをマスクトークンでマスクする。
この分野は一連のトークンで構成され、様々な階層を表現するために柔軟に設定できる。
その後、LLMにこのマスクフィールドの予測を依頼する。
推論中、ユーザーの意図はユーザーが変更したい部分を置き換えるマスクトークンでCADテキストに変換され、新しいCADモデルを生成するためにFlexCADに入力される。
公開データセットに関する総合的な実験は、生成品質と制御性の両方においてFlexCADの有効性を示す。
コードはhttps://github.com/microsoft/CADGeneration/FlexCADで入手できる。
関連論文リスト
- CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts [12.63158811936688]
テキストからパラメトリックCADモデルを生成するための最初のAIフレームワークであるText2CADを提案する。
提案するフレームワークは,AI支援設計アプリケーションにおいて大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-25T17:19:33Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z) - ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Models [0.7373617024876725]
本稿では,ContrastCAD という,CAD モデルを学習するための対照的な学習手法を提案する。
コントラストCADはCADモデルの構成シーケンス内の意味情報を効果的にキャプチャする。
また,RRE法(Random Replace and Extrude)と呼ばれる新しいCADデータ拡張手法を提案し,モデルの学習性能を向上させる。
論文 参考訳(メタデータ) (2024-04-02T05:30:39Z) - Model2Scene: Learning 3D Scene Representation via Contrastive
Language-CAD Models Pre-training [105.3421541518582]
現在成功している3次元シーン認識法は、大規模アノテートされた点雲に依存している。
CAD(Computer-Aided Design)モデルと言語から自由な3Dシーン表現を学習する新しいパラダイムであるModel2Sceneを提案する。
Model2Sceneは、平均mAPが46.08%、ScanNetとS3DISのデータセットが55.49%という、ラベルなしの優れた3Dオブジェクトのサリエント検出をもたらす。
論文 参考訳(メタデータ) (2023-09-29T03:51:26Z) - Hierarchical Neural Coding for Controllable CAD Model Generation [34.14256897199849]
本稿では,CAD(Computer Aided Design)の新しい生成モデルを提案する。
これはCADモデルの高レベルな設計概念を、ニューラルネットワークの3レベル階層木として表現している。
コードツリーを使用してターゲット設計を指定することでCADモデルの生成や完成を制御する。
論文 参考訳(メタデータ) (2023-06-30T21:49:41Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z) - Masked Autoencoding for Scalable and Generalizable Decision Making [93.84855114717062]
MaskDPは、強化学習と行動クローンのためのシンプルでスケーラブルな自己教師付き事前学習手法である。
我々は,MaskDPモデルにより,単一ゴールや複数ゴール到達といった新しいBCタスクへのゼロショット転送能力が得られることを発見した。
論文 参考訳(メタデータ) (2022-11-23T07:04:41Z) - SkexGen: Autoregressive Generation of CAD Construction Sequences with
Disentangled Codebooks [37.33746656109331]
我々はコンピュータ支援設計(CAD)構築シーケンスのための新しい自己回帰生成モデルであるSkexGenを提案する。
自動回帰トランスフォーマーデコーダは、コードブックベクトルによって指定された特定の特性を共有するCAD構成シーケンスを生成する。
論文 参考訳(メタデータ) (2022-07-11T05:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。