論文の概要: UniCAD: Efficient and Extendable Architecture for Multi-Task Computer-Aided Diagnosis System
- arxiv url: http://arxiv.org/abs/2505.09178v2
- Date: Thu, 15 May 2025 12:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 12:00:18.780457
- Title: UniCAD: Efficient and Extendable Architecture for Multi-Task Computer-Aided Diagnosis System
- Title(参考訳): UniCAD:マルチタスクコンピュータ支援診断システムのための効率的で拡張可能なアーキテクチャ
- Authors: Yitao Zhu, Yuan Yin, Zhenrong Shen, Zihao Zhao, Haiyu Song, Sheng Wang, Dinggang Shen, Qian Wang,
- Abstract要約: 2次元画像と3次元画像の両方をシームレスに扱う統一アーキテクチャUniCADを提案する。
低ランク適応戦略を用いて、トレーニング済みの視覚モデルを医用画像領域に適応させ、完全に調整された視覚モデルと同等の性能を達成する。
この統合CADアーキテクチャに基づいて、研究者が軽量CAD専門家を共有・アクセスできるオープンソースのプラットフォームを構築します。
- 参考スコア(独自算出の注目度): 48.83716673786449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing complexity and scale of visual model pre-training have made developing and deploying multi-task computer-aided diagnosis (CAD) systems increasingly challenging and resource-intensive. Furthermore, the medical imaging community lacks an open-source CAD platform to enable the rapid creation of efficient and extendable diagnostic models. To address these issues, we propose UniCAD, a unified architecture that leverages the robust capabilities of pre-trained vision foundation models to seamlessly handle both 2D and 3D medical images while requiring only minimal task-specific parameters. UniCAD introduces two key innovations: (1) Efficiency: A low-rank adaptation strategy is employed to adapt a pre-trained visual model to the medical image domain, achieving performance on par with fully fine-tuned counterparts while introducing only 0.17% trainable parameters. (2) Plug-and-Play: A modular architecture that combines a frozen foundation model with multiple plug-and-play experts, enabling diverse tasks and seamless functionality expansion. Building on this unified CAD architecture, we establish an open-source platform where researchers can share and access lightweight CAD experts, fostering a more equitable and efficient research ecosystem. Comprehensive experiments across 12 diverse medical datasets demonstrate that UniCAD consistently outperforms existing methods in both accuracy and deployment efficiency. The source code and project page are available at https://mii-laboratory.github.io/UniCAD/.
- Abstract(参考訳): 視覚モデル事前トレーニングの複雑さとスケールの増大により、マルチタスクコンピュータ支援診断(CAD)システムの開発と展開がますます困難になり、資源集約化が進んでいる。
さらに、医療画像コミュニティは、効率的で拡張可能な診断モデルの迅速な作成を可能にするオープンソースCADプラットフォームを欠いている。
これらの課題に対処するために,UniCADを提案する。UniCADは,2次元および3次元の医療画像の両方をシームレスに扱えるように,学習済みの視覚基盤モデルの堅牢性を活用し,最小限のタスク固有パラメータのみを必要とする統一アーキテクチャである。
効率性: トレーニング済みの視覚モデルを医用画像領域に適応させるために低ランク適応戦略を採用し、完全に微調整されたものと同等のパフォーマンスを達成し、トレーニング可能なパラメータは0.17%に過ぎなかった。
(2) Plug-and-Play: 凍結した基盤モデルと複数のプラグイン・アンド・プレイの専門家を組み合わせて、多様なタスクとシームレスな機能拡張を可能にするモジュールアーキテクチャ。
この統合CADアーキテクチャに基づいて、研究者が軽量CAD専門家を共有・アクセスできるオープンソースのプラットフォームを構築し、より公平で効率的な研究エコシステムを育む。
12の多様な医療データセットにわたる総合的な実験により、UniCADは精度とデプロイメント効率の両方で既存の手法を一貫して上回っていることが示された。
ソースコードとプロジェクトページはhttps://mii-laboratory.github.io/UniCAD/で公開されている。
関連論文リスト
- CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。
多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。
提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文 参考訳(メタデータ) (2025-04-07T06:01:35Z) - PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning [52.681829043446044]
ParaCADは1000万点以上のアノテートドローイングと、複雑なトポロジカルな構造とテストのための物理的な制約を備えた3,000の現実世界の産業図で構成されている。
PHT-CADは視覚言語モデルのモダリティアライメントと推論機能を利用する新しい2次元PPAフレームワークである。
論文 参考訳(メタデータ) (2025-03-23T17:24:32Z) - From Idea to CAD: A Language Model-Driven Multi-Agent System for Collaborative Design [0.06749750044497731]
本稿では,このチーム構造を視覚言語モデル(VLM)に基づくマルチエージェントシステムで再現する手法を提案する。
モデルはスケッチやテキスト記述から自動的に生成される。
得られたモデルは、ユーザとの反復的検証ループで協調的に洗練することができる。
論文 参考訳(メタデータ) (2025-03-06T13:21:27Z) - ChatCAD+: Towards a Universal and Reliable Interactive CAD using LLMs [48.11532667875847]
ChatCAD+は高品質な医療レポートを生成し、信頼できる医療アドバイスを提供するツールである。
信頼性レポート生成モジュールは、医療画像を解釈し、高品質な医療レポートを生成することができる。
Reliable Interactionモジュールは、信頼できる医療アドバイスを提供するために、信頼できる医療ウェブサイトからの最新の情報を活用する。
論文 参考訳(メタデータ) (2023-05-25T12:03:31Z) - AutoCAD: Automatically Generating Counterfactuals for Mitigating
Shortcut Learning [70.70393006697383]
完全自動かつタスクに依存しないCAD生成フレームワークであるAutoCADについて述べる。
本稿では,完全に自動化されたタスクに依存しないCAD生成フレームワークであるAutoCADを提案する。
論文 参考訳(メタデータ) (2022-11-29T13:39:53Z) - SB-GCN: Structured BREP Graph Convolutional Network for Automatic Mating
of CAD Assemblies [3.732457298487595]
アセンブリモデリングは、現代のCADにおける支配的なデータ構造であるパラメトリック境界表現(BREP)を反映しているため、現代のCADシステムには直接適用されない。
本稿では,部品のトポロジ的構造を保持するBREPの表現学習手法であるSB-GCNを提案する。
論文 参考訳(メタデータ) (2021-05-25T22:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。