論文の概要: Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification in MIDOG 2025
- arxiv url: http://arxiv.org/abs/2508.21041v2
- Date: Thu, 18 Sep 2025 11:53:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 15:20:15.418152
- Title: Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification in MIDOG 2025
- Title(参考訳): MIDOG 2025における非定型的な体型分類のための自然画像に基づくDINOv3の効率的な微調整
- Authors: Guillaume Balezo, Hana Feki, Raphaël Bourgade, Lily Monnier, Alice Blondel, Albert Pla Planas, Thomas Walter,
- Abstract要約: 非定型有糸分裂図(AMF)は予後不良に伴う細胞分裂を表わす。
MIDOG 2025チャレンジでは、複数のドメインにわたるAMF分類のベンチマークが導入されている。
我々は、低ランク適応(LoRA)を用いて、自然画像に事前訓練された最近発表されたDINOv3-H+視覚変換器を微調整した。
我々の微調整したDINOv3は病理組織学に効果的に移行し、予備試験セットで2位に達した。
- 参考スコア(独自算出の注目度): 1.3234442019653903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Atypical mitotic figures (AMFs) represent abnormal cell division associated with poor prognosis. Yet their detection remains difficult due to low prevalence, subtle morphology, and inter-observer variability. The MIDOG 2025 challenge introduces a benchmark for AMF classification across multiple domains. In this work, we fine-tuned the recently published DINOv3-H+ vision transformer, pretrained on natural images, using low-rank adaptation (LoRA), training only ~1.3M parameters in combination with extensive augmentation and a domain-weighted Focal Loss to handle domain heterogeneity. Despite the domain gap, our fine-tuned DINOv3 transfers effectively to histopathology, reaching second place on the preliminary test set. These results highlight the advantages of DINOv3 pretraining and underline the efficiency and robustness of our fine-tuning strategy, yielding state-of-the-art results for the atypical mitosis classification challenge in MIDOG 2025.
- Abstract(参考訳): 非定型有糸分裂図(AMF)は予後不良に伴う細胞分裂を表わす。
しかし、その検出は、頻度の低さ、微妙な形態、およびサーバ間のばらつきのため、依然として困難である。
MIDOG 2025チャレンジでは、複数のドメインにわたるAMF分類のベンチマークが導入されている。
本研究では,最近発表されたDINOv3-H+ビジョントランスフォーマを,ローランク適応(LoRA)を用いて事前訓練し,拡張された拡張とドメイン重み付きFocal Lossを併用した1.3Mパラメータのトレーニングを行った。
DINOv3は, 領域差にもかかわらず病理組織学に効果的に移行し, 予備試験では第2位となった。
これらの結果は,MIDOG 2025における非定型有糸分裂分類の課題に対して,DINOv3プレトレーニングの利点を強調し,我々の微調整戦略の効率性と堅牢性を強調した。
関連論文リスト
- Mix, Align, Distil: Reliable Cross-Domain Atypical Mitosis Classification [5.484561603970499]
MIDOG 2025 Task 2におけるドメイン・ロバストAMF分類のための簡単なトレーニング・タイム・レシピを提案する。
提案手法の精度は0.8762、感度は0.8873、特異性は0.8651、ROC AUCは0.9499である。
論文 参考訳(メタデータ) (2025-08-28T13:04:55Z) - A bag of tricks for real-time Mitotic Figure detection [0.0]
我々は,RTMDet単段物体検出装置の効率的な構築を行い,臨床展開に適した高推論速度を実現する。
偽陽性を減少させるために, ターゲット型, 硬い負のマイニングを壊死組織, 破片組織に適用した。
Mitosis DOmain Generalization (MIDOG) 2025の予備試験セットでは, RTMDet-Sをベースとした一段法が0.81に到達した。
論文 参考訳(メタデータ) (2025-08-27T11:45:44Z) - Multi-Attention Stacked Ensemble for Lung Cancer Detection in CT Scans [3.8121150313479655]
3つの事前訓練されたバックボーンは96 x 96ピクセルの入力に合わせたカスタム分類ヘッドで適合する。
2段階の注意機構は、ロジットからモデルワイドとクラスワイドの両方の重要点を学習する。
LIDC-IDRIデータセットの実験では、98.09の精度と0.9961 AUCを達成した。
論文 参考訳(メタデータ) (2025-07-27T11:03:07Z) - Is an Ultra Large Natural Image-Based Foundation Model Superior to a Retina-Specific Model for Detecting Ocular and Systemic Diseases? [15.146396276161937]
RETFoundおよびDINOv2モデルは眼疾患検出および全身性疾患予知タスクのために評価された。
RETFoundは、心不全、梗塞、虚血性脳梗塞の予測において、すべてのDINOv2モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2025-02-10T09:31:39Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Breast Ultrasound Tumor Classification Using a Hybrid Multitask
CNN-Transformer Network [63.845552349914186]
胸部超音波(BUS)画像分類において,グローバルな文脈情報の収集が重要な役割を担っている。
ビジョントランスフォーマーは、グローバルなコンテキスト情報をキャプチャする能力が改善されているが、トークン化操作によって局所的なイメージパターンを歪めてしまう可能性がある。
本研究では,BUS腫瘍分類とセグメンテーションを行うハイブリッドマルチタスクディープニューラルネットワークであるHybrid-MT-ESTANを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:19:32Z) - Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic
Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。
本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。
Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-09-27T14:19:00Z) - Multi-Scale Input Strategies for Medulloblastoma Tumor Classification
using Deep Transfer Learning [59.30734371401316]
乳腺芽腫は小児で最も多い悪性脳腫瘍である。
CNNはMBサブタイプ分類に有望な結果を示した。
タイルサイズと入力戦略の影響について検討した。
論文 参考訳(メタデータ) (2021-09-14T09:42:37Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Bilateral Asymmetry Guided Counterfactual Generating Network for
Mammogram Classification [48.4619620405991]
画像レベルのラベルのみによるマンモグラムの良性や悪性の分類は,病変アノテーションが欠如しているため困難である。
画像に病変がなければ, 特徴がどのように振る舞うかという, 反現実的な問題を探ることができる。
我々は、対称的先行性に基づく反事実生成のための新しい理論的結果を得る。
論文 参考訳(メタデータ) (2020-09-30T03:15:30Z) - StyPath: Style-Transfer Data Augmentation For Robust Histology Image
Classification [6.690876060631452]
我々は,StyPathに基づくAMR分類のための,堅牢なディープニューラルネットワークを構築するための新しいパイプラインを提案する。
それぞれの画像は、1GTX V TITANとpytorchを使って1.84 + 0.03秒で生成された。
以上の結果から,本手法は組織学的分類性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2020-07-09T18:02:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。