論文の概要: CAD-Editor: A Locate-then-Infill Framework with Automated Training Data Synthesis for Text-Based CAD Editing
- arxiv url: http://arxiv.org/abs/2502.03997v1
- Date: Thu, 06 Feb 2025 11:57:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:32:36.156335
- Title: CAD-Editor: A Locate-then-Infill Framework with Automated Training Data Synthesis for Text-Based CAD Editing
- Title(参考訳): CAD-Editor:テキストベースCAD編集のための自動学習データ合成機能を備えたローカテ-then-Infillフレームワーク
- Authors: Yu Yuan, Shizhao Sun, Qi Liu, Jiang Bian,
- Abstract要約: テキストベースのCAD編集のための最初のフレームワークであるemphCAD-Editorを紹介する。
そこで本研究では,テキストベースのCAD編集の複合的な性質に対処するため,位置-then-infillフレームワークを提案する。
CAD-Editorは定量的にも質的にも優れた性能を発揮することを示す実験を行った。
- 参考スコア(独自算出の注目度): 12.277838798842689
- License:
- Abstract: Computer Aided Design (CAD) is indispensable across various industries. \emph{Text-based CAD editing}, which automates the modification of CAD models based on textual instructions, holds great potential but remains underexplored. Existing methods primarily focus on design variation generation or text-based CAD generation, either lacking support for text-based control or neglecting existing CAD models as constraints. We introduce \emph{CAD-Editor}, the first framework for text-based CAD editing. To address the challenge of demanding triplet data with accurate correspondence for training, we propose an automated data synthesis pipeline. This pipeline utilizes design variation models to generate pairs of original and edited CAD models and employs Large Vision-Language Models (LVLMs) to summarize their differences into editing instructions. To tackle the composite nature of text-based CAD editing, we propose a locate-then-infill framework that decomposes the task into two focused sub-tasks: locating regions requiring modification and infilling these regions with appropriate edits. Large Language Models (LLMs) serve as the backbone for both sub-tasks, leveraging their capabilities in natural language understanding and CAD knowledge. Experiments show that CAD-Editor achieves superior performance both quantitatively and qualitatively.
- Abstract(参考訳): CAD(Computer Aided Design)は、様々な産業において不可欠である。
テキスト命令に基づくCADモデルの修正を自動化した \emph{Text-based CADEdit} は、大きな可能性を秘めているが、未探索のままである。
既存の方法は、テキストベースの制御をサポートしていないか、既存のCADモデルを制約として無視するか、デザインのバリエーション生成やテキストベースのCAD生成に重点を置いている。
テキストベースのCAD編集のための最初のフレームワークである \emph{CAD-Editor} を紹介する。
そこで本研究では,3重項データに正確な対応を持たせることの難しさに対処するため,自動データ合成パイプラインを提案する。
このパイプラインは、設計のバリエーションモデルを用いて、オリジナルと編集されたCADモデルのペアを生成し、その違いを編集命令にまとめるためにLVLM(Large Vision-Language Models)を使用する。
そこで本研究では,テキストベースCAD編集の複合的な性質に対処するため,タスクを2つのサブタスクに分割し,修正が必要な領域を配置し,適切な編集でその領域を埋め込む手法を提案する。
大規模言語モデル(LLM)はサブタスクの両方のバックボーンとして機能し、自然言語理解とCAD知識の能力を活用している。
CAD-Editorは定量的にも質的にも優れた性能を発揮することを示す実験を行った。
関連論文リスト
- K-Edit: Language Model Editing with Contextual Knowledge Awareness [71.73747181407323]
知識に基づくモデル編集は、大きな言語モデルの重みを正確に修正することを可能にする。
我々は、文脈的に一貫した知識編集を生成するための効果的なアプローチであるK-Editを提案する。
論文 参考訳(メタデータ) (2025-02-15T01:35:13Z) - Text2CAD: Text to 3D CAD Generation via Technical Drawings [45.3611544056261]
Text2CADは、生成プロセスを自動化するために調整された安定した拡散モデルを利用する新しいフレームワークである。
テキスト2CADは,高品質な3次元CADモデルに正確に変換された技術図面を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-11-09T15:12:06Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - FlexCAD: Unified and Versatile Controllable CAD Generation with Fine-tuned Large Language Models [22.010338370150738]
大規模言語モデル(LLM)を微調整した統合モデルFlexCADを提案する。
我々はCADモデルを構造化テキストとして表現し、各階層をテキストトークンのシーケンスとして抽象化する。
推論中、ユーザの意図をCADテキストに変換し、ユーザが変更したい部分をマスクトークンで置き換える。
論文 参考訳(メタデータ) (2024-11-05T05:45:26Z) - Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts [12.63158811936688]
テキストからパラメトリックCADモデルを生成するための最初のAIフレームワークであるText2CADを提案する。
提案するフレームワークは,AI支援設計アプリケーションにおいて大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-25T17:19:33Z) - GenCAD: Image-Conditioned Computer-Aided Design Generation with
Transformer-Based Contrastive Representation and Diffusion Priors [4.485378844492069]
GenCADは画像入力をパラメトリックCADコマンドシーケンスに変換する生成モデルである。
生成した3次元形状の精度と変調性の観点から、既存の最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-09-08T23:49:11Z) - PS-CAD: Local Geometry Guidance via Prompting and Selection for CAD Reconstruction [86.726941702182]
再構成ネットワークPS-CADに幾何学的ガイダンスを導入する。
我々は、現在の再構成が点雲としての完備モデルと異なる曲面の幾何学を提供する。
第二に、幾何学的解析を用いて、候補面に対応する平面的プロンプトの集合を抽出する。
論文 参考訳(メタデータ) (2024-05-24T03:43:55Z) - Geometric Deep Learning for Computer-Aided Design: A Survey [85.79012726689511]
本調査では,コンピュータ支援設計における学習手法の概要について概観する。
類似性解析と検索、2Dおよび3DCADモデル合成、点雲からのCAD生成を含む。
ベンチマークデータセットとその特性の完全なリストと、この領域の研究を推進しているオープンソースコードを提供する。
論文 参考訳(メタデータ) (2024-02-27T17:11:35Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z) - Patch2CAD: Patchwise Embedding Learning for In-the-Wild Shape Retrieval
from a Single Image [58.953160501596805]
本稿では,2次元画像と3次元CADモデルの結合埋め込み空間をパッチワイズで構築する手法を提案する。
我々のアプローチは、CADが正確に一致しない実世界のシナリオにおける最先端技術よりも堅牢である。
論文 参考訳(メタデータ) (2021-08-20T20:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。