Fugu-MT 論文翻訳(概要): MUSE: Benchmarking Manufacturable, Functional, and Assemblable Text-to-CAD Generation

論文の概要: MUSE: Benchmarking Manufacturable, Functional, and Assemblable Text-to-CAD Generation

arxiv url: http://arxiv.org/abs/2605.28579v2
Date: Thu, 04 Jun 2026 01:52:56 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-06 06:55:34.582756
Title: MUSE: Benchmarking Manufacturable, Functional, and Assemblable Text-to-CAD Generation
Title（参考訳）: MUSE: 作成可能、機能可能、組み立て可能なテキスト・ツー・CAD生成のベンチマーク
Authors: Xiaoyu Dong, Zhi Li, Xiao-Ming Wu,
Abstract要約: MUSEは、複雑な編集可能な境界表現アセンブリに焦点を当てたText-to-CADベンチマークである。 MUSEは、コードチェック、幾何チェック、デザインインテントアライメントという3段階のプロトコルを通じて生成されたモデルを評価する。クローズドソースおよびオープンソース LLM の実験では、実行可能コードから有効な幾何への明確な障害カスケードが明らかになった。
参考スコア（独自算出の注目度）: 17.467056775887944
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) have recently advanced text-driven 3D generation, yet Text-to-CAD remains far from supporting industrial product design. Existing benchmarks focus primarily on generating single-part CAD models and evaluate them using geometric similarity metrics that fail to capture functionality, manufacturability, and assemblability. To address this gap, we introduce MUSE, a Text-to-CAD benchmark focused on complex, editable boundary representation (B-Rep) assemblies. MUSE pairs practical design instances with structured Design Specifications and evaluates generated models through a three-stage protocol: code check, geometric check, and design-intent alignment. The final stage uses design-specific rubrics to assess functionality, manufacturability, and assemblability, moving beyond shape matching toward practical design quality. To enable scalable evaluation, we use a rubric-based visual language model (VLM) judge and validate its reliability through human annotation. Experiments on closed-source and open-source LLMs reveal a clear failure cascade from executable code to valid geometry and finally to engineering-ready design, with even the strongest models achieving limited success on fine-grained engineering criteria. Together, MUSE provides a realistic benchmark and evaluation framework for advancing Text-to-CAD from geometric generation toward true engineering design. Our project website, including the leaderboard, dataset, and code, is available at https://dong7313.github.io/muse-benchmark/.
Abstract（参考訳）: 大規模言語モデル(LLM)は最近、テキスト駆動の3D生成が進んでいるが、Text-to-CADは産業製品設計のサポートには程遠い。既存のベンチマークは、主に単一部分CADモデルの生成と、機能、製造可能性、組み立て可能性の獲得に失敗する幾何学的類似度メトリクスを用いた評価に重点を置いている。このギャップに対処するために、複雑な編集可能な境界表現(B-Rep)に焦点をあてたText-to-CADベンチマークであるMUSEを紹介する。 MUSEは構造化されたデザイン仕様と実用的なデザインインスタンスを組み合わせ、コードチェック、幾何チェック、デザイン意図のアライメントという3段階のプロトコルを通じて生成されたモデルを評価する。最終段階では、デザイン固有のルーリックを使用して、機能、製造性、組み立て性を評価し、実際の設計品質に向かって形状整合を超えて移動する。スケーラブルな評価を実現するために,ルーブリックに基づく視覚言語モデル(VLM)の判定と,人間のアノテーションによる信頼性の検証を行った。クローズドソースおよびオープンソース LLM の実験では、実行可能なコードから有効な幾何、そして最後にエンジニアリング対応の設計に至るまで、明確な失敗ケースが明らかになっている。 MUSEは、幾何学的生成から真のエンジニアリング設計へと進むための、現実的なベンチマークと評価フレームワークを提供する。リーダボードやデータセット,コードなどを含むプロジェクトのWebサイトは,https://dong7313.github.io/muse-benchmark/で公開されています。

関連論文リスト

BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD [14.284307846349774]
本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。 BenchCADには,106の産業部門を対象とした17,900のCadQueryプログラムが含まれている。視覚的質問応答、コード質問応答、画像からコードへの生成、命令誘導コード編集を通じてモデルを評価する。
論文参考訳（メタデータ） (2026-05-11T17:13:36Z)
Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data [8.896486786253766]
実行可能CAD構築シーケンスのためのスケーラブルなフレームワークであるZero-to-CADを紹介する。我々は,大規模言語モデルをフィードバック駆動CAD環境に組み込むことで,コードを反復的に生成し,実行し,検証する。このエージェント的アプローチは、約100万の実行可能な可読性、編集可能なCADシーケンスの合成を可能にする。
論文参考訳（メタデータ） (2026-04-27T13:46:41Z)
ArtiCAD: Articulated CAD Assembly Design via Multi-Agent Code Generation [24.959136090642758]
製品開発には, 集合体のパラメトリックコンピュータ支援設計(CAD)が不可欠である。本研究では,テキストや画像から直接編集可能なCADアセンブリを生成することができる,最初のトレーニングフリーマルチエージェントシステムであるArtiCADを提案する。
論文参考訳（メタデータ） (2026-04-13T04:49:30Z)
VoxelCodeBench: Benchmarking 3D World Modeling Through Code Generation [15.578526245420859]
本稿では,3次元理解と環境生成のためのコード生成機能の解析を行うプラットフォームであるVoxelCodeを紹介する。我々のプラットフォームは、自然言語タスク仕様、Unreal EngineでのAPI駆動コード実行、自動メトリクスと人的評価の両方をサポートする統合評価パイプラインを統合しています。
論文参考訳（メタデータ） (2026-04-02T23:33:58Z)
DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。 DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。 DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文参考訳（メタデータ） (2026-03-05T19:04:07Z)
DisCo-Layout: Disentangling and Coordinating Semantic and Physical Refinement in a Multi-Agent Framework for 3D Indoor Layout Synthesis [76.7196710324494]
3次元屋内レイアウト合成は仮想環境構築に不可欠である。 DisCoは、物理的および意味的な洗練を歪め、調整する新しいフレームワークである。
論文参考訳（メタデータ） (2025-10-02T16:30:37Z)
From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.67703214044401]
CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。 CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文参考訳（メタデータ） (2025-08-13T18:30:49Z)
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning [31.342222156939403]
本稿では,2段階の微調整パラダイムであるCReFT-CADを紹介する。われわれはTriView2CADをリリースした。
論文参考訳（メタデータ） (2025-05-31T13:52:56Z)
CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文参考訳（メタデータ） (2025-04-07T06:01:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。