論文の概要: NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling
- arxiv url: http://arxiv.org/abs/2511.06194v1
- Date: Sun, 09 Nov 2025 02:45:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.805219
- Title: NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling
- Title(参考訳): NURBGen: LLM駆動NURBSモデリングによる高忠実テキスト-CAD生成
- Authors: Muhammad Usama, Mohammad Sadil Khan, Didier Stricker, Muhammad Zeshan Afzal,
- Abstract要約: 非統一論理的B-スプライン(NURBS)を用いてテキストから直接高忠実度3DCADモデルを生成する最初のフレームワークであるNURBGenを提案する。
これを実現するために、大言語モデル(LLM)を微調整し、自由形式のテキストをNURBS曲面パラメータを含むキュレートされた表現に変換する。
また,非トリミングなNURBSと解析的プリミティブを組み合わせたハイブリッド表現を提案する。
- 参考スコア(独自算出の注目度): 22.960026011165706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating editable 3D CAD models from natural language remains challenging, as existing text-to-CAD systems either produce meshes or rely on scarce design-history data. We present NURBGen, the first framework to generate high-fidelity 3D CAD models directly from text using Non-Uniform Rational B-Splines (NURBS). To achieve this, we fine-tune a large language model (LLM) to translate free-form texts into JSON representations containing NURBS surface parameters (\textit{i.e}, control points, knot vectors, degrees, and rational weights) which can be directly converted into BRep format using Python. We further propose a hybrid representation that combines untrimmed NURBS with analytic primitives to handle trimmed surfaces and degenerate regions more robustly, while reducing token complexity. Additionally, we introduce partABC, a curated subset of the ABC dataset consisting of individual CAD components, annotated with detailed captions using an automated annotation pipeline. NURBGen demonstrates strong performance on diverse prompts, surpassing prior methods in geometric fidelity and dimensional accuracy, as confirmed by expert evaluations. Code and dataset will be released publicly.
- Abstract(参考訳): 既存のテキスト-CADシステムはメッシュを生成するか、設計履歴データに頼っているため、自然言語から編集可能な3DCADモデルを生成することは依然として困難である。
我々は,Non-Uniform Rational B-Splines (NURBS)を用いて,テキストから直接高忠実度3DCADモデルを生成する最初のフレームワークであるNURBGenを提案する。
これを実現するために、自由形式のテキストをNURBS曲面パラメータ(\textit{i.e}, 制御点、結び目ベクトル、次数、有理重み)を含むJSON表現に変換するための大きな言語モデル(LLM)を、Pythonを使って直接BRepフォーマットに変換する。
さらに,未トリミングなNURBSと解析的プリミティブを組み合わせることで,トリミングされた表面を処理し,トークンの複雑さを低減しつつ,より堅牢に退化させるハイブリッド表現を提案する。
さらに,個別CADコンポーネントからなるABCデータセットのキュレートされたサブセットであるpartABCを紹介し,自動アノテーションパイプラインを用いて詳細なキャプションを付加した。
NURBGenは様々なプロンプトに対して高い性能を示し、幾何的忠実度と次元精度で先行手法を上回り、専門家評価によって確認されている。
コードとデータセットは公開される。
関連論文リスト
- CAD-Editor: A Locate-then-Infill Framework with Automated Training Data Synthesis for Text-Based CAD Editing [12.277838798842689]
テキストベースのCAD編集のための最初のフレームワークであるemphCAD-Editorを紹介する。
そこで本研究では,テキストベースのCAD編集の複合的な性質に対処するため,位置-then-infillフレームワークを提案する。
CAD-Editorは定量的にも質的にも優れた性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2025-02-06T11:57:14Z) - Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts [12.63158811936688]
テキストからパラメトリックCADモデルを生成するための最初のAIフレームワークであるText2CADを提案する。
提案するフレームワークは,AI支援設計アプリケーションにおいて大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-25T17:19:33Z) - Towards Robustness of Text-to-Visualization Translation against Lexical and Phrasal Variability [27.16741353384065]
テキスト・トゥ・バイ・モデルはしばしば、質問における単語間の語彙マッチングとデータスキーマにおけるトークンに依存している。
本研究では,これまで検討されていない領域である現行のテキスト・ツー・ヴィジュア・モデルのロバスト性について検討する。
本稿では,2つの変種における入力摂動に対処するために特別に設計されたGRED(Retrieval-Augmented Generation, RAG)技術に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-10T16:12:50Z) - DreamStone: Image as Stepping Stone for Text-Guided 3D Shape Generation [105.97545053660619]
テキスト誘導型3次元形状生成手法DreamStoneを提案する。
画像を使ってテキストと形状のギャップを埋め、ペアのテキストと3Dデータを必要とせずに3Dの形状を生成する。
我々のアプローチは汎用的で柔軟でスケーラブルであり、様々なSVRモデルと容易に統合でき、生成空間を拡大し、生成忠実性を向上させることができる。
論文 参考訳(メタデータ) (2023-03-24T03:56:23Z) - Diffusion-SDF: Text-to-Shape via Voxelized Diffusion [90.85011923436593]
本研究では,テキスト・ツー・シェイプ合成の課題に対して,Diffusion-SDFと呼ばれる新しい3次元モデリングフレームワークを提案する。
本研究では,Diffusion-SDFが与えられたテキスト記述によく適合する高品質な3次元形状と,より多様化した3次元形状の両方を生成することを示す。
論文 参考訳(メタデータ) (2022-12-06T19:46:47Z) - Learning Contextual Representations for Semantic Parsing with
Generation-Augmented Pre-Training [86.91380874390778]
本稿では,生成モデルを活用して事前学習データを生成することで,自然言語発話と表スキーマの表現を共同で学習するGAPを提案する。
実験結果に基づいて、GAP MODELを利用するニューラルセマンティクスは、SPIDERとCRITERIA-to-generationベンチマークの両方で最新の結果を得る。
論文 参考訳(メタデータ) (2020-12-18T15:53:50Z) - Shape My Face: Registering 3D Face Scans by Surface-to-Surface
Translation [75.59415852802958]
Shape-My-Face (SMF) は、改良されたポイントクラウドエンコーダ、新しい視覚的注意機構、スキップ接続付きグラフ畳み込みデコーダ、特殊口モデルに基づく強力なエンコーダデコーダアーキテクチャである。
私たちのモデルは、トポロジカルにサウンドメッシュを最小限の監視で提供し、より高速なトレーニング時間を提供し、訓練可能なパラメータを桁違いに減らし、ノイズに強く、以前は見られないデータセットに一般化することができます。
論文 参考訳(メタデータ) (2020-12-16T20:02:36Z) - POINTER: Constrained Progressive Text Generation via Insertion-based
Generative Pre-training [93.79766670391618]
ハードコントラストテキスト生成のための新しい挿入ベースアプローチであるPOINTERを提案する。
提案手法は,既存のトークン間で段階的に新しいトークンを並列に挿入することによって動作する。
結果として生じる粗大な階層構造は、生成プロセスを直感的で解釈可能である。
論文 参考訳(メタデータ) (2020-05-01T18:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。