論文の概要: Adapting Foundation Models for Annotation-Efficient Adnexal Mass Segmentation in Cine Images
- arxiv url: http://arxiv.org/abs/2604.08045v1
- Date: Thu, 09 Apr 2026 09:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.851171
- Title: Adapting Foundation Models for Annotation-Efficient Adnexal Mass Segmentation in Cine Images
- Title(参考訳): 犬の画像における注釈効率の良い副次マスセグメンテーションのための基礎モデルの適用
- Authors: Francesca Fati, Alberto Rota, Adriana V. Gregory, Anna Catozzo, Maria C. Giuliano, Mrinal Dhar, Luigi De Vitis, Annie T. Packard, Francesco Multinu, Elena De Momi, Carrie L. Langstraat, Timothy L. Kline,
- Abstract要約: 超音波による近接性質量評価は、主観的解釈と重要なサーバ間変動によって妨げられることが多い、困難な臨床課題である。
本稿では,事前訓練されたDINOv3基盤視変換器バックボーンのロバストなセマンティクスを活かしたラベル効率のセグメンテーションフレームワークを提案する。
提案手法は,U-Net,U-Net++,DeepLabV3,MAnetなどの完全教師付きベースラインと比較して,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 4.42778347374376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adnexal mass evaluation via ultrasound is a challenging clinical task, often hindered by subjective interpretation and significant inter-observer variability. While automated segmentation is a foundational step for quantitative risk assessment, traditional fully supervised convolutional architectures frequently require large amounts of pixel-level annotations and struggle with domain shifts common in medical imaging. In this work, we propose a label-efficient segmentation framework that leverages the robust semantic priors of a pretrained DINOv3 foundational vision transformer backbone. By integrating this backbone with a Dense Prediction Transformer (DPT)-style decoder, our model hierarchically reassembles multi-scale features to combine global semantic representations with fine-grained spatial details. Evaluated on a clinical dataset of 7,777 annotated frames from 112 patients, our method achieves state-of-the-art performance compared to established fully supervised baselines, including U-Net, U-Net++, DeepLabV3, and MAnet. Specifically, we obtain a Dice score of 0.945 and improved boundary adherence, reducing the 95th-percentile Hausdorff Distance by 11.4% relative to the strongest convolutional baseline. Furthermore, we conduct an extensive efficiency analysis demonstrating that our DINOv3-based approach retains significantly higher performance under data starvation regimes, maintaining strong results even when trained on only 25% of the data. These results suggest that leveraging large-scale self-supervised foundations provides a promising and data-efficient solution for medical image segmentation in data-constrained clinical environments. Project Repository: https://github.com/FrancescaFati/MESA
- Abstract(参考訳): 超音波による近接性質量評価は、主観的解釈と重要なサーバ間変動によって妨げられることが多い、困難な臨床課題である。
自動セグメンテーションは定量的リスク評価の基本的なステップであるが、従来の完全教師付き畳み込みアーキテクチャでは大量のピクセルレベルのアノテーションを必要とし、医用画像に共通するドメインシフトに苦慮することが多い。
本研究では,事前訓練されたDINOv3基礎視覚トランスフォーマバックボーンのロバストなセマンティックなセグメンテーションを生かしたラベル効率のセグメンテーションフレームワークを提案する。
このバックボーンをDense Prediction Transformer (DPT)スタイルのデコーダと組み合わせることで、大域的な意味表現と細かな空間的詳細を結合するために、階層的にマルチスケールの機能を再構築する。
U-Net, U-Net++, DeepLabV3, MAnet などの完全教師付きベースラインと比較し, 112例のアノテートフレーム7,777点の評価を行った。
具体的には, Dice スコア 0.945 を取得し, 境界付着性の向上を図り, 95 % のハウスドルフ距離を最強の畳み込みベースラインに対して 11.4% 削減した。
さらに、DINOv3ベースのアプローチは、データ飢餓体制下では著しく高い性能を維持し、データの25%しか訓練していない場合でも、強い結果を維持することを実証する広範な効率解析を行う。
これらの結果から, 大規模自己監督基盤の活用は, データ制約のある臨床環境において, 医用画像のセグメンテーションに有望かつデータ効率のよい解決策をもたらすことが示唆された。
Project Repository: https://github.com/FrancescaFati/MESA
関連論文リスト
- Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models [0.0]
最先端の船体セグメンテーション手法は、通常、大規模な注釈付きデータセットを必要とし、ドメインシフト時に深刻なパフォーマンス劣化に悩まされる。
本稿では,ボリューム容器分割に適応した事前学習型ビジョンファウンデーションモデル(DINOv3)を活用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-27T08:24:44Z) - HypCBC: Domain-Invariant Hyperbolic Cross-Branch Consistency for Generalizable Medical Image Analysis [1.8747639074211104]
医用画像解析における双曲表現学習の総合的検証について述べる。
我々は11の分布内データセットと3つのViTモデルに対して統計的に有意な利得を示した。
提案手法は,ドメイン不変性を促進し,平均2.1%のAUCで最先端のユークリッド法より優れる。
論文 参考訳(メタデータ) (2026-02-03T08:50:24Z) - Longitudinal Vestibular Schwannoma Dataset with Consensus-based Human-in-the-loop Annotations [3.1898695141875772]
このデータセットには,184例のT1強調検査(T1CE)534例と6例の非アノテーションT2強調検査(T2強調検査)190例が含まれている。
提案手法は,自動セグメンテーションモデルの目的とするデータ分布への効率的かつ資源効率の高い一般化を可能にする。
従来の手作業による注釈処理と比較して、効率を約37.4%向上させると見積もられている。
論文 参考訳(メタデータ) (2025-11-01T09:53:28Z) - Towards the Automatic Segmentation, Modeling and Meshing of the Aortic Vessel Tree from Multicenter Acquisitions: An Overview of the SEG.A. 2023 Segmentation of the Aorta Challenge [44.01488489205175]
この分野での進歩を触媒するSEG.A.チャレンジを紹介します。
この課題は、隠れたテストセットで自動アルゴリズムをベンチマークした。
主要な結果は、上位のアルゴリズムのアンサンブルが個々のモデルよりも大幅に優れていたことである。
論文 参考訳(メタデータ) (2025-10-28T02:33:45Z) - Hybrid Deep Learning-Based for Enhanced Occlusion Segmentation in PICU Patient Monitoring [0.0]
本稿では,PICU内の遠隔監視アプリケーションで発生する共通閉塞を分割するハイブリッド手法を提案する。
私たちのアプローチは、限られたトレーニングデータシナリオのためのディープラーニングパイプラインの作成に重点を置いています。
提案したフレームワークは、92.5%の精度、93.8%のリコール、90.3%の精度、92.0%のF1スコアで全体的な分類性能が得られる。
論文 参考訳(メタデータ) (2024-07-18T09:37:55Z) - Self-supervised Semantic Segmentation: Consistency over Transformation [3.485615723221064]
Inception Large Kernel Attention (I-LKA) モジュールをベースとしたロバストなフレームワークを統合した新しい自己教師型アルゴリズム textbfS$3$-Net を提案する。
我々は、変形可能な畳み込みを積分成分として利用し、優れた物体境界定義のための歪み変形を効果的に捕捉し、デライン化する。
皮膚病変および肺臓器の分節タスクに関する実験結果から,SOTA法と比較して,本手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-31T21:28:46Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。