論文の概要: DINO-MVR: Multi-View Readout of Frozen DINOv3 for Annotation-Efficient Medical Segmentation
- arxiv url: http://arxiv.org/abs/2605.07221v1
- Date: Fri, 08 May 2026 04:13:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.795542
- Title: DINO-MVR: Multi-View Readout of Frozen DINOv3 for Annotation-Efficient Medical Segmentation
- Title(参考訳): DINO-MVR:表記効率の良い医用セグメンテーションのための冷凍DINOv3のマルチビュー読み出し
- Authors: Wei Jiang, Feng Liu, Nan Ye, Hongfu Sun,
- Abstract要約: 凍結したDINOv3の特徴は,すでに医用セグメンテーションに有用な構造的および境界的手がかりを含んでいる。
アノテーション効率のよい医療セグメンテーションのための多視点読み出しフレームワークであるDINO-MVRを提案する。
- 参考スコア(独自算出の注目度): 10.929173865297933
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting foundation models to medical segmentation typically requires either backbone fine-tuning or high-capacity task-specific decoders, both of which are difficult to fit reliably when annotations are scarce. We show that frozen DINOv3 features already contain useful structural and boundary cues for medical segmentation, and that the main bottleneck lies in how these features are read out. We propose DINO-MVR, a Multi-View Readout framework for annotation-efficient medical segmentation. DINO-MVR trains only lightweight MLP probes on features from the final three transformer blocks of a frozen DINOv3 backbone, without updating the backbone itself. At inference, each input is interpreted through complementary resolutions and test-time augmentations, whose probability maps are combined by entropy-weighted fusion and refined with simple spatial regularization. For volumetric inputs, Gaussian z-axis smoothing further improves inter-slice consistency. Under fixed evaluation protocols on endoscopy, dermoscopy, and MRI benchmarks, DINO-MVR achieves strong readout-only performance, including 0.895 Dice on Kvasir-SEG, 0.897 Dice on ISIC 2018, and 0.908 Dice on BraTS FLAIR whole-tumor segmentation. With only five annotated BraTS patients, it recovers 98.4% of the performance obtained by the 40-patient BraTS reference run. These results suggest that frozen self-supervised vision backbones can support accurate medical segmentation when paired with an effective multi-view readout.
- Abstract(参考訳): 基礎モデルを医療セグメンテーションに適用するには、一般的にバックボーンの微調整か、高容量のタスク固有のデコーダが必要となる。
凍結したDINOv3の特徴は,すでに医学的セグメンテーションに有用な構造的および境界的手がかりを含んでおり,その主なボトルネックは,これらの特徴の読み出し方法にある。
アノテーション効率のよい医療セグメンテーションのための多視点読み出しフレームワークであるDINO-MVRを提案する。
DINO-MVRは、バックボーン自体を更新することなく、冷凍したDINOv3バックボーンの最後の3つのトランスフォーマーブロックの機能を軽量のMLPプローブにのみ搭載した。
推測では、各入力は相補分解とテスト時間拡張によって解釈され、確率写像はエントロピー重み付き融合によって結合され、単純な空間正則化によって洗練される。
体積入力に対して、ガウスz軸平滑化はスライス間の一貫性をさらに改善する。
DINO-MVRは、内視鏡、皮膚内視鏡、MRIベンチマークの固定評価プロトコルの下で、Kvasir-SEGの0.895Dice、ISIC 2018の0.897Dice、BraTS FLAIRの0.908Diceなど、強い読み出しのみのパフォーマンスを実現している。
注釈付きBraTS患者は5例のみで、40例のBraTSリファレンスランで得られたパフォーマンスの98.4%を回復する。
これらの結果から,凍結型自己監督型視覚バックボーンは,効果的なマルチビュー・リードアウトと組み合わせることで,正確な医用セグメンテーションをサポートできることが示唆された。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel [68.24765319399286]
本稿では,2次元血管セグメンテーションに適した,強力で効率的なフレームワークであるVesSAMを提案する。
VesSAMは、(1)局所的なテクスチャ機能を強化する畳み込みアダプタ、(2)解剖学的プロンプトを融合するマルチプロンプトエンコーダ、(3)ジャグアーティファクトを減らす軽量マスクデコーダを統合する。
VesSAMは、最先端のPEFTベースのSAMを10%以上のDiceと13%のIoUで一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T15:47:05Z) - DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights [54.87947751720332]
脳腫瘍の正確なセグメンテーションは、臨床診断と治療に重要である。
マンバを拠点とするState Space Modelsは、有望なパフォーマンスを示している。
本稿では,計算オーバーヘッドを最小限に抑えながら,マルチスケールの長距離依存関係をキャプチャするマルチ解像度双方向マンバを提案する。
論文 参考訳(メタデータ) (2025-10-16T07:31:21Z) - Hypergraph Tversky-Aware Domain Incremental Learning for Brain Tumor Segmentation with Missing Modalities [9.429176881328274]
臨床実践では、MRI 取得の逐次的な性質のため、MRI のモダリティが欠落している場合もある。
Replay-based Hypergraph Domain Incremental Learning (ReHyDIL) を提案する。
論文 参考訳(メタデータ) (2025-05-22T15:49:25Z) - A Comprehensive Framework for Automated Segmentation of Perivascular Spaces in Brain MRI with the nnU-Net [37.179674347248266]
神経変性疾患では、PVS(perivascular space)の増大が一般的である。
現在不足している信頼性の高いPVS検出方法が必要である。
論文 参考訳(メタデータ) (2024-11-29T09:19:57Z) - Novel adaptation of video segmentation to 3D MRI: efficient zero-shot knee segmentation with SAM2 [1.6237741047782823]
Segment Anything Model 2 を応用した3次元膝関節MRIのゼロショット単発セグメンテーション法を提案する。
3次元医用ボリュームのスライスを個々のビデオフレームとして扱うことで、SAM2の高度な能力を利用して、モーションおよび空間認識の予測を生成する。
SAM2は、訓練や微調整を伴わずに、ゼロショット方式でセグメント化タスクを効率的に実行できることを実証する。
論文 参考訳(メタデータ) (2024-08-08T21:39:15Z) - Stitching, Fine-tuning, Re-training: A SAM-enabled Framework for Semi-supervised 3D Medical Image Segmentation [40.79197318484472]
SAMファインチューニングは, 医用画像のセグメンテーションにおいて, 完全に教師された方法で顕著な性能を示した。
SFR(Stitching, Fine-tuning, Re-training)という3段階のフレームワークを提案する。
我々のSFRフレームワークはプラグイン・アンド・プレイであり、様々な人気のある半教師付き手法と容易に互換性がある。
論文 参考訳(メタデータ) (2024-03-17T14:30:56Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [47.700298779672366]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。