論文の概要: UniCAD: A Unified Benchmark and Universal Model for Multi-Modal Multi-Task CAD
- arxiv url: http://arxiv.org/abs/2606.05058v1
- Date: Wed, 03 Jun 2026 16:20:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.887785
- Title: UniCAD: A Unified Benchmark and Universal Model for Multi-Modal Multi-Task CAD
- Title(参考訳): UniCAD:マルチモードマルチタスクCADのための統一ベンチマークとユニバーサルモデル
- Authors: Jingyuan Chen, Sheng Jin, Haopeng Sun, Wentao Liu, Chen Qian,
- Abstract要約: マルチモーダルCAD学習のための総合ベンチマークUniCADを紹介する。
テキスト,画像,スケッチ,点群を取り込み,汎用的な大規模言語モデルUniCAD-MLLMを提案する。
将来の研究を加速するために、データセット、コード、事前訓練されたモデルをリリースします。
- 参考スコア(独自算出の注目度): 31.34982007288203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer-Aided Design (CAD) underpins modern engineering and manufacturing by enabling the creation of precise, editable 3D models. However, CAD research typically studies tasks in isolation, and multi-modal, multi-task learning for CAD is hindered by the absence of a unified benchmark. To address this gap, we introduce UniCAD, a comprehensive benchmark for multi-modal CAD learning that covers point-to-CAD reconstruction, text/image-to-CAD generation, and CAD question answering across diverse input modalities. Alongside the benchmark, we present UniCAD-MLLM, a universal multi-modal large language model that ingests text, images, sketches, and point clouds and performs these heterogeneous tasks in an end-to-end fashion within a single framework. Extensive experiments on the UniCAD and Fusion360 benchmarks demonstrate that UniCAD-MLLM achieves state-of-the-art performance across all tasks, outperforming existing task-specific and multi-task baselines. We will release the dataset, code, and pretrained models to accelerate future research.
- Abstract(参考訳): CAD(Computer-Aided Design)は、精密で編集可能な3Dモデルの作成を可能にすることで、現代のエンジニアリングと製造を支えている。
しかし、CAD研究は通常、タスクを個別に研究し、CADのためのマルチモーダルなマルチタスク学習は、統一されたベンチマークが欠如していることによって妨げられる。
このギャップに対処するため,マルチモーダルCAD学習のための総合的なベンチマークであるUniCADを導入し,多様な入力モダリティにまたがるポイント・ツー・CAD再構成,テキスト・イメージ・ツー・CAD生成,CAD質問応答について紹介する。
ベンチマークの他に,テキスト,画像,スケッチ,ポイントクラウドを取り込み,これら不均一なタスクを1つのフレームワーク内でエンドツーエンドに実行する汎用多モード大言語モデルUniCAD-MLLMを提案する。
UniCADとFusion360ベンチマークの大規模な実験は、UniCAD-MLLMがすべてのタスクで最先端のパフォーマンスを達成し、既存のタスク固有のベースラインやマルチタスクベースラインよりも優れていることを示した。
将来の研究を加速するために、データセット、コード、事前訓練されたモデルをリリースします。
関連論文リスト
- DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.45867367326105]
ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文 参考訳(メタデータ) (2026-03-05T19:04:07Z) - UniCAD: Efficient and Extendable Architecture for Multi-Task Computer-Aided Diagnosis System [48.83716673786449]
2次元画像と3次元画像の両方をシームレスに扱う統一アーキテクチャUniCADを提案する。
低ランク適応戦略を用いて、トレーニング済みの視覚モデルを医用画像領域に適応させ、完全に調整された視覚モデルと同等の性能を達成する。
この統合CADアーキテクチャに基づいて、研究者が軽量CAD専門家を共有・アクセスできるオープンソースのプラットフォームを構築します。
論文 参考訳(メタデータ) (2025-05-14T06:21:27Z) - CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers [20.440350517523314]
CAD-AssistantはFreeCADソフトウェアを備えたPythonインタプリタ上で反復的に実行されるアクションを生成することでユーザクエリに対処する。
我々は,スケッチ画像パラメーター,レンダリングモジュール,2次元断面生成器,その他の特殊なルーチンなど,CAD固有のツールを幅広く検討する。
論文 参考訳(メタデータ) (2024-12-18T12:57:56Z) - CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.113795259823476]
マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文 参考訳(メタデータ) (2024-11-07T18:31:08Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。