論文の概要: Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models
- arxiv url: http://arxiv.org/abs/2602.23782v1
- Date: Fri, 27 Feb 2026 08:24:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.312758
- Title: Breaking the Data Barrier: Robust Few-Shot 3D Vessel Segmentation using Foundation Models
- Title(参考訳): データバリアを破る - 基礎モデルを用いたロバストFew-Shot 3D容器セグメンテーション
- Authors: Kirato Yoshihara, Yohei Sugawara, Yuta Tokuoka, Lihang Hong,
- Abstract要約: 最先端の船体セグメンテーション手法は、通常、大規模な注釈付きデータセットを必要とし、ドメインシフト時に深刻なパフォーマンス劣化に悩まされる。
本稿では,ボリューム容器分割に適応した事前学習型ビジョンファウンデーションモデル(DINOv3)を活用する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art vessel segmentation methods typically require large-scale annotated datasets and suffer from severe performance degradation under domain shifts. In clinical practice, however, acquiring extensive annotations for every new scanner or protocol is unfeasible. To address this, we propose a novel framework leveraging a pre-trained Vision Foundation Model (DINOv3) adapted for volumetric vessel segmentation. We introduce a lightweight 3D Adapter for volumetric consistency, a multi-scale 3D Aggregator for hierarchical feature fusion, and Z-channel embedding to effectively bridge the gap between 2D pre-training and 3D medical modalities, enabling the model to capture continuous vascular structures from limited data. We validated our method on the TopCoW (in-domain) and Lausanne (out-of-distribution) datasets. In the extreme few-shot regime with 5 training samples, our method achieved a Dice score of 43.42%, marking a 30% relative improvement over the state-of-the-art nnU-Net (33.41%) and outperforming other Transformer-based baselines, such as SwinUNETR and UNETR, by up to 45%. Furthermore, in the out-of-distribution setting, our model demonstrated superior robustness, achieving a 50% relative improvement over nnU-Net (21.37% vs. 14.22%), which suffered from severe domain overfitting. Ablation studies confirmed that our 3D adaptation mechanism and multi-scale aggregation strategy are critical for vascular continuity and robustness. Our results suggest foundation models offer a viable cold-start solution, improving clinical reliability under data scarcity or domain shifts.
- Abstract(参考訳): 最先端の船体セグメンテーション手法は、通常、大規模な注釈付きデータセットを必要とし、ドメインシフト時に深刻なパフォーマンス劣化に悩まされる。
しかし、臨床実践では、新しいスキャナーやプロトコルの広範なアノテーションを取得することは不可能である。
そこで,本研究では,体積容器セグメンテーションに適応した事前学習型ビジョンファウンデーションモデル(DINOv3)を活用した新しいフレームワークを提案する。
本稿では, ボリューム整合性のための軽量な3次元アダプタ, 階層的特徴融合のためのマルチスケール3次元アグリゲータ, および2次元前訓練と3次元医用モダリティのギャップを効果的に橋渡しし, 限られたデータから連続的な血管構造を捕捉することを可能にするZチャネル埋め込みを提案する。
提案手法をTopCoW(ドメイン内)およびLaurasanne(配布外)データセットで検証した。
5つのトレーニングサンプルを持つ極端に少数の状況下では、Diceスコアが43.42%に達し、最先端のnnU-Net(33.41%)よりも30%向上し、SwinUNETRやUNETRといったトランスフォーマーベースのベースラインを最大45%上回った。
さらに, 分布外環境では, ドメインオーバーフィッティングに苦しむnnU-Net (21.37% vs. 14.22%) に対して50%の相対的な改善を達成し, 優れたロバスト性を示した。
アブレーション研究により,血管の連続性と堅牢性には,我々の3次元適応機構とマルチスケールアグリゲーション戦略が重要であることが確認された。
以上の結果から,基礎モデルが有効なコールドスタートソリューションを提供し,データ不足やドメインシフトによる臨床信頼性を向上させることが示唆された。
関連論文リスト
- T3: Test-Time Model Merging in VLMs for Zero-Shot Medical Imaging Analysis [15.624549727053475]
既存のモデルマージ技術は、様々な医学的手段で一貫した利益をもたらすことができません。
サンプル単位の係数を計算するバックプロパゲーションフリーフレームワークであるTest-Time Task Adaptive merging (T3)を導入する。
ドメイン内、ベース・ツー・ノーベル、および4つのモダリティにまたがる汚職にまたがる厳密な相互評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-31T08:05:40Z) - ST-DAI: Single-shot 2.5D Spatial Transcriptomics with Intra-Sample Domain Adaptive Imputation for Cost-efficient 3D Reconstruction [1.7603474309877931]
コスト効率のよい2.5Dサンプリングスキームをサンプル内ドメイン適応型計算フレームワークと組み合わせた,3D transcriptomics用単ショットフレームワークST-DAIを紹介する。
まず、コスト効率2.5Dサンプリング段階において、1つの基準部(中央部)を完全にサンプリングし、他の部(隣接部)を疎サンプリングする。
第2に、このコスト効率のよい2.5D STスキームから完全な3D STを生成できる単発3D計算学習法を提案する。
論文 参考訳(メタデータ) (2025-07-29T05:46:37Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - MM-Mixing: Multi-Modal Mixing Alignment for 3D Understanding [64.65145700121442]
MM-Mixingは3次元理解のためのマルチモーダルミキシングアライメントフレームワークである。
提案する2段階学習パイプラインは,特徴レベルと入力レベルを混合して3Dエンコーダを最適化する。
MM-Mixingは,様々な学習シナリオにおけるベースライン性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-05-28T18:44:15Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Unsupervised 3D out-of-distribution detection with latent diffusion
models [1.7587591581995812]
本稿では,DDPMの高分解能な3次元医療データへのスケーリングを実現するためにLDM(Latent Diffusion Models)を提案する。
提案したLCMベースのアプローチは統計的に有意な性能を達成するだけでなく、下層の潜在表現に対する感度も低下している。
論文 参考訳(メタデータ) (2023-07-07T18:00:38Z) - An Efficient End-to-End Deep Neural Network for Interstitial Lung
Disease Recognition and Classification [0.5424799109837065]
本稿では、IDDパターンを分類するためのエンドツーエンドのディープ畳み込みニューラルネットワーク(CNN)を提案する。
提案モデルでは,カーネルサイズが異なる4つの畳み込み層と,Rectified Linear Unit (ReLU) アクティベーション機能を備える。
128のCTスキャンと5つのクラスからなる21328の画像パッチからなるデータセットを用いて、提案モデルのトレーニングと評価を行う。
論文 参考訳(メタデータ) (2022-04-21T06:36:10Z) - Deep Implicit Statistical Shape Models for 3D Medical Image Delineation [47.78425002879612]
解剖学的構造の3次元デライン化は、医用画像解析の基本的な目標である。
ディープラーニング以前は、解剖学的制約を課し高品質の表面を作り出す統計的形状モデルはコア技術だった。
我々は,CNNの表現力とSSMの頑健さを合体させるデライン化の新しい手法であるディープ暗黙的統計的形状モデル(DISSMs)を提案する。
論文 参考訳(メタデータ) (2021-04-07T01:15:06Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。