論文の概要: DINO-Mix: Distilling Foundational Knowledge with Cross-Domain CutMix for Semi-supervised Class-imbalanced Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2602.07819v1
- Date: Sun, 08 Feb 2026 04:57:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.814007
- Title: DINO-Mix: Distilling Foundational Knowledge with Cross-Domain CutMix for Semi-supervised Class-imbalanced Medical Image Segmentation
- Title(参考訳): DINO-Mix:半教師型クラス不均衡画像分割のためのクロスドメインカットミクスによる基礎知識の蒸留
- Authors: Xinyu Liu, Guolei Sun,
- Abstract要約: 半教師付き学習(SSL)は医用画像セグメンテーションにとって重要なパラダイムである。
SSLフレームワークは基本的に"内向き"である
マルチレベルの「外見」フレームワークへのパラダイムシフトを提案する。
- 参考スコア(独自算出の注目度): 14.732550189753697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning (SSL) has emerged as a critical paradigm for medical image segmentation, mitigating the immense cost of dense annotations. However, prevailing SSL frameworks are fundamentally "inward-looking", recycling information and biases solely from within the target dataset. This design triggers a vicious cycle of confirmation bias under class imbalance, leading to the catastrophic failure to recognize minority classes. To dismantle this systemic issue, we propose a paradigm shift to a multi-level "outward-looking" framework. Our primary innovation is Foundational Knowledge Distillation (FKD), which looks outward beyond the confines of medical imaging by introducing a pre-trained visual foundation model, DINOv3, as an unbiased external semantic teacher. Instead of trusting the student's biased high confidence, our method distills knowledge from DINOv3's robust understanding of high semantic uniqueness, providing a stable, cross-domain supervisory signal that anchors the learning of minority classes. To complement this core strategy, we further look outward within the data by proposing Progressive Imbalance-aware CutMix (PIC), which creates a dynamic curriculum that adaptively forces the model to focus on minority classes in both labeled and unlabeled subsets. This layered strategy forms our framework, DINO-Mix, which breaks the vicious cycle of bias and achieves remarkable performance on challenging semi-supervised class-imbalanced medical image segmentation benchmarks Synapse and AMOS.
- Abstract(参考訳): 半教師付き学習(SSL)は、医用画像セグメンテーションの重要なパラダイムとして現れ、高密度アノテーションの膨大なコストを軽減している。
しかし、一般的なSSLフレームワークは基本的には、ターゲットデータセット内からの情報とバイアスをリサイクルする「内向き」である。
この設計は、クラス不均衡の下での確認バイアスの悪循環を引き起こし、破滅的な失敗を招き、少数派を認識できなかった。
このシステム的問題を解消するために、我々はマルチレベルの「外見」フレームワークへのパラダイムシフトを提案する。
我々の主要な革新は、基礎知識蒸留(FKD)であり、これは、訓練済みの視覚基礎モデルであるDINOv3を、偏見のない外部意味教師として導入することで、医学的イメージングの限界をはるかに超えている。
我々の手法は、学生のバイアスの高い自信を信頼する代わりに、DINOv3の高い意味的特異性に対する堅牢な理解から知識を抽出し、マイノリティクラスの学習を固定する安定したクロスドメイン監視信号を提供する。
このコア戦略を補完するために、我々は、ラベル付きサブセットとラベルなしサブセットの両方でマイノリティクラスに集中するようモデルを適応的に強制する動的カリキュラムを作成するプログレッシブ・インバランス・アウェア・カットミクス(PIC)を提案することで、データ内のさらに外側に目を向ける。
この階層化された戦略は我々のフレームワークであるDINO-Mixを形成し、偏見の悪循環を破り、半教師付きクラス不均衡な医用画像セグメンテーションベンチマークであるSynapseとAMOSで顕著なパフォーマンスを達成する。
関連論文リスト
- HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - Boosting Semi-Supervised Medical Image Segmentation via Masked Image Consistency and Discrepancy Learning [2.5355185243767986]
3つの重要なモジュールを持つMasked Image Consistency and Discrepancy Learning(MICD)フレームワークを提案する。
Cross Feature Consistency (CFC)モジュールは、情報交換とモデルロバスト性を確立する。
Cross Model Discrepancy (CMD)モジュールは、EMAの教師ネットワークを利用して出力を監督し、分岐の多様性を維持する。
論文 参考訳(メタデータ) (2025-03-18T08:20:35Z) - You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data [54.56492110703343]
局所的な非IIDデータとグローバルな長期分布から生ずるデータ不均一性は、連邦学習(FL)における大きな課題である
弱い局所サンプルと強い局所サンプルの知識を蒸留し,表現学習を改善するためにFedYoYoを提案する。
我々は、FedYoYoが最先端の結果を達成し、グローバルな長期的設定の下で集中ロジット調整手法を5.4%超えたことを示します。
論文 参考訳(メタデータ) (2025-03-10T04:57:20Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - DHC: Dual-debiased Heterogeneous Co-training Framework for
Class-imbalanced Semi-supervised Medical Image Segmentation [19.033066343869862]
半教師付き3次元医用画像セグメンテーションのためのDHC(Dual-debiased Heterogeneous Co-training)フレームワークを提案する。
具体的には,DistDW(Dis Distribution-aware Debiased Weighting)とDiffDW(DiffDW)の2つの損失重み付け戦略を提案する。
提案フレームワークは,クラス不均衡問題を緩和するために擬似ラベルを用いることで,大幅な改善を実現する。
論文 参考訳(メタデータ) (2023-07-22T02:16:05Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - GraVIS: Grouping Augmented Views from Independent Sources for
Dermatology Analysis [52.04899592688968]
皮膚科画像から自己教師付き特徴を学習するために特に最適化されたGraVISを提案する。
GraVISは、病変のセグメンテーションと疾患分類のタスクにおいて、転送学習と自己教師型学習を著しく上回っている。
論文 参考訳(メタデータ) (2023-01-11T11:38:37Z) - Calibrating Label Distribution for Class-Imbalanced Barely-Supervised
Knee Segmentation [11.21648118505577]
半教師付き学習(SSL)は、ラベル付きデータの不十分なトレーニングに非常に望ましい。
うるさいラベルとバランスの取れないラベルを伴い, 膝のセグメンテーションをほとんど指導しない新しい枠組みを提案する。
我々の手法は最先端のSSLメソッドよりも優れています。
論文 参考訳(メタデータ) (2022-05-07T12:53:06Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - One-shot Weakly-Supervised Segmentation in Medical Images [12.184590794655517]
ワンショットおよび弱教師付き設定による3次元医用画像セグメンテーションの革新的枠組みを提案する。
注釈付きボリュームからラベルなしの3D画像へスクリブルを投影するために,伝搬再構成ネットワークを提案する。
デュアルレベルの特徴記述モジュールは、解剖学的およびピクセルレベルの特徴に基づいて、スクリブルを洗練させるように設計されている。
論文 参考訳(メタデータ) (2021-11-21T09:14:13Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。