論文の概要: Challenging DINOv3 Foundation Model under Low Inter-Class Variability: A Case Study on Fetal Brain Ultrasound
- arxiv url: http://arxiv.org/abs/2511.01915v1
- Date: Sat, 01 Nov 2025 13:37:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.589035
- Title: Challenging DINOv3 Foundation Model under Low Inter-Class Variability: A Case Study on Fetal Brain Ultrasound
- Title(参考訳): 低クラス間変動下におけるDINOv3ファンデーションモデルの作成:胎児脳超音波の1例
- Authors: Edoardo Conti, Riccardo Rosati, Lorenzo Federici, Adriano Mancini, Maria Chiara Fiorentin,
- Abstract要約: 本研究は, 胎児超音波(US)画像の基礎モデルについて, クラス間変動の少ない条件下での総合評価を行った。
われわれは胎児脳標準平面(TT)、経室(TV)、経脳小脳(TC))に焦点をあて、高い重なり合いの解剖学的特徴を示した。
胎児超音波データで事前訓練されたモデルは、F1スコアの最大20%の重み付けにより、自然画像よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 4.07447364754644
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Purpose: This study provides the first comprehensive evaluation of foundation models in fetal ultrasound (US) imaging under low inter-class variability conditions. While recent vision foundation models such as DINOv3 have shown remarkable transferability across medical domains, their ability to discriminate anatomically similar structures has not been systematically investigated. We address this gap by focusing on fetal brain standard planes--transthalamic (TT), transventricular (TV), and transcerebellar (TC)--which exhibit highly overlapping anatomical features and pose a critical challenge for reliable biometric assessment. Methods: To ensure a fair and reproducible evaluation, all publicly available fetal ultrasound datasets were curated and aggregated into a unified multicenter benchmark, FetalUS-188K, comprising more than 188,000 annotated images from heterogeneous acquisition settings. DINOv3 was pretrained in a self-supervised manner to learn ultrasound-aware representations. The learned features were then evaluated through standardized adaptation protocols, including linear probing with frozen backbone and full fine-tuning, under two initialization schemes: (i) pretraining on FetalUS-188K and (ii) initialization from natural-image DINOv3 weights. Results: Models pretrained on fetal ultrasound data consistently outperformed those initialized on natural images, with weighted F1-score improvements of up to 20 percent. Domain-adaptive pretraining enabled the network to preserve subtle echogenic and structural cues crucial for distinguishing intermediate planes such as TV. Conclusion: Results demonstrate that generic foundation models fail to generalize under low inter-class variability, whereas domain-specific pretraining is essential to achieve robust and clinically reliable representations in fetal brain ultrasound imaging.
- Abstract(参考訳): 目的: 本研究は, 胎児超音波(US)画像の基礎モデルについて, クラス間変動の少ない条件下での総合評価を行った。
最近のDINOv3のような視覚基盤モデルは、医学領域間で顕著な伝達性を示しているが、解剖学的に類似した構造を識別する能力は体系的に研究されていない。
このギャップを解消するために、胎児の脳の標準平面である経視床運動(TT)、経室運動(TV)、経小脳運動(TC)に焦点をあてる。
方法: 公正かつ再現可能な評価を確保するため, 利用可能な胎児超音波データセットはすべて, 均一なマルチセンターベンチマークFetalUS-188Kに集約され, 異種取得設定から188,000以上の注釈付き画像で構成された。
DINOv3は、超音波認識表現を学習するために、自己教師型で事前訓練された。
学習した特徴は、凍結したバックボーンを持つ線形プローブやフル微調整を含む標準化された適応プロトコルによって評価され、2つの初期化スキームで評価された。
i) FetalUS-188K および
(ii)自然像DINOv3重みからの初期化。
結果:胎児超音波データで事前訓練したモデルでは,F1スコアが最大20%向上した。
ドメイン適応型事前訓練により、テレビなどの中間平面の識別に欠かせない微妙なエコーや構造的手がかりをネットワークが保持できるようになった。
結論: 結果は, 遺伝子基盤モデルが低クラス間変動下での一般化に失敗することを示し, 一方, ドメイン特異的プレトレーニングは胎児脳超音波画像において, 堅牢かつ臨床的に信頼性の高い表現を実現するために不可欠であることを示した。
関連論文リスト
- Epistemic-aware Vision-Language Foundation Model for Fetal Ultrasound Interpretation [83.02147613524032]
医療用AIシステムFetalMindについて報告する。
本稿では、専門家による2部グラフをモデルに注入し、ビュー・ディスリーズ関連を分離するSED(Salient Epistemic Disentanglement)を提案する。
FetalMindはすべての妊娠期のオープンソースおよびクローズドソースベースラインを上回り、平均利得は+14%、臨界条件では+61.2%高い。
論文 参考訳(メタデータ) (2025-10-14T19:57:03Z) - FoundDiff: Foundational Diffusion Model for Generalizable Low-Dose CT Denoising [55.04342933312839]
本稿では,CT(低線量CT)デノナイズのための基礎拡散モデルFoundDiffを提案する。
FoundDiffは、(i)線量解剖学的知覚と(ii)適応的認知という2段階の戦略を採用している。
まず, 線量および解剖学的知覚を実現するために, 線量および解剖学的対応型コントラスト言語画像事前訓練モデル(DA-CLIP)を開発した。
第2に,適応的および一般化可能な復調を行うために,線量および解剖学的拡散モデル(DA-Diff)を設計する。
論文 参考訳(メタデータ) (2025-08-24T11:03:56Z) - The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.80780313225093]
本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。
画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文 参考訳(メタデータ) (2025-04-10T16:26:47Z) - Reliable Multi-View Learning with Conformal Prediction for Aortic Stenosis Classification in Echocardiography [6.540741143328299]
得られた画像は、しばしば3次元解剖学の2次元断面であり、重要な解剖学的詳細を欠いている可能性がある。
トレーニングセット内の弱い情報入力に不確実性を導入するデータ中心の手法であるRe-Training for Uncertainty (RT4U)を提案する。
共形予測技術と組み合わせると、RT4Uは、基底真理クラスを含むことが保証される適応的な大きさの予測セットを高精度に得ることができる。
論文 参考訳(メタデータ) (2024-09-15T10:06:06Z) - Fusion of Diffusion Weighted MRI and Clinical Data for Predicting
Functional Outcome after Acute Ischemic Stroke with Deep Contrastive Learning [1.4149937986822438]
ストロークは、25歳以上の成人の約4分の1に影響する一般的な神経疾患である。
AUCでは0.87,0.80,80.45%,F1スコアでは80.45%,精度では0。
論文 参考訳(メタデータ) (2024-02-16T18:51:42Z) - Evaluating General Purpose Vision Foundation Models for Medical Image Analysis: An Experimental Study of DINOv2 on Radiology Benchmarks [5.8941124219471055]
DINOv2はオープンソースのファンデーションモデルで、1億4200万のキュレートされた自然画像に対する自己教師付き学習を事前訓練している。
本研究は放射線学におけるDINOv2の性能を総合的に評価する。
論文 参考訳(メタデータ) (2023-12-04T21:47:10Z) - Towards A Device-Independent Deep Learning Approach for the Automated
Segmentation of Sonographic Fetal Brain Structures: A Multi-Center and
Multi-Device Validation [0.0]
胎児脳USG画像(2D)から得られた2軸平面から10個の重要な胎児脳構造の自動分割のためのDLベースセグメンテーションフレームワークを提案する。
提案するDLシステムは,有望かつ汎用的な性能(マルチセンタ,マルチデバイス)を提供し,画像品質のデバイスによる変動を支持する証拠を提示する。
論文 参考訳(メタデータ) (2022-02-28T05:42:03Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Hybrid Attention for Automatic Segmentation of Whole Fetal Head in
Prenatal Ultrasound Volumes [52.53375964591765]
胎児の頭部全体を米国全巻に分割する,最初の完全自動化ソリューションを提案する。
セグメント化タスクは、まずエンコーダ-デコーダディープアーキテクチャの下で、エンドツーエンドのボリュームマッピングとして定式化される。
次に,セグメンタとハイブリットアテンションスキーム(HAS)を組み合わせることで,識別的特徴を選択し,非情報量的特徴を抑える。
論文 参考訳(メタデータ) (2020-04-28T14:43:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。