論文の概要: TAPE: A two-stage parameter-efficient adaptation framework for foundation models in OCT-OCTA analysis
- arxiv url: http://arxiv.org/abs/2604.04571v1
- Date: Mon, 06 Apr 2026 10:08:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.166534
- Title: TAPE: A two-stage parameter-efficient adaptation framework for foundation models in OCT-OCTA analysis
- Title(参考訳): TAPE:OCT-OCTA解析における基礎モデルのための2段階パラメータ効率適応フレームワーク
- Authors: Xiaofei Su, Zengshuo Wang, Minghe Sun, Xin Zhao, Mingzhu Sun,
- Abstract要約: TAPE: 効率的なファインチューニングによる2段階適応フレームワークを提案する。
このフレームワークは、下流セグメンテーションのための適応をドメインアライメントとタスクフィッティングに戦略的に分離する。
様々な病理にまたがる最先端の一般化性能を実現する。
- 参考スコア(独自算出の注目度): 7.475072200925591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated analysis of optical coherence tomography (OCT) and OCT angiography (OCTA) images is critical for robust ophthalmic diagnosis. Existing mainstream methods trained from scratch rely heavily on massive data and model scale, thereby hindering their practical deployment in resource-constrained clinical settings. Although transfer learning based on foundation models (FMs) is promising, it still faces significant challenges: domain shift and task misalignment. To address these, we propose TAPE: A Two-stage Adaptation Framework via Parameter-Efficient Fine-tuning, which strategically decouples adaptation into domain alignment and task fitting for downstream segmentation. The domain adaptation stage notably applies parameter-efficient fine-tuning (PEFT) in the context of masked image modeling for medical image domain adaptation, a novel approach to the best of our knowledge. Applying TAPE to retinal layer segmentation on both universal (masked auto-encoder, MAE) and specialized (RETFound) FMs, it demonstrates superior parameter efficiency and achieves state-of-the-art generalization performance across diverse pathologies.
- Abstract(参考訳): 光コヒーレンス断層撮影(OCT)とOCTアンギオグラフィー(OCTA)画像の自動解析は、堅牢な眼科診断に重要である。
スクラッチからトレーニングされた既存の主流の方法は、大量のデータとモデルスケールに大きく依存しているため、リソース制約のある臨床環境への実践的な展開を妨げている。
基礎モデル(FM)に基づくトランスファーラーニングは有望だが、ドメインシフトやタスクのミスアライメントといった大きな課題に直面している。
パラメータ効率の良いファインチューニングによる2段階適応フレームワークを,ドメインアライメントと下流セグメンテーションのためのタスクフィッティングに戦略的に分離する。
領域適応の段階は、医用画像領域適応のためのマスク画像モデリングの文脈において、パラメータ効率のよい微調整(PEFT)を特に適用している。
TAPEを網膜層セグメンテーション(masked auto-encoder, MAE)と特殊(RETFound)FMの両方に適用することにより、パラメータ効率が優れ、様々な病態における最先端の一般化性能を実現する。
関連論文リスト
- Layout-Guided Controllable Pathology Image Generation with In-Context Diffusion Transformers [57.54843029965778]
制御可能な病理画像合成には、空間配置、組織形態、意味的詳細の信頼できる規制が必要である。
In-Context Diffusion Transformer (IC-DiT) は,空間レイアウト,テキスト記述,視覚的埋め込みを統合拡散変換器に組み込んだレイアウト認識生成モデルである。
IC-DiTは既存の方法よりも忠実度が高く、空間制御性が強く、診断の整合性が良くなる。
論文 参考訳(メタデータ) (2026-03-11T06:14:11Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Ensemble of Pathology Foundation Models for MIDOG 2025 Track 2: Atypical Mitosis Classification [0.0]
病理基盤モデル(PFM)を大規模病理組織学データセットで事前訓練した。
我々はPFMを補完するために、最先端の畳み込みニューラルネットワークアーキテクチャであるConvNeXt V2を組み込んだ。
我々は,相補的な形態的洞察を統合するために複数のPFMをアンサンブルし,予備評価フェーズデータセット上でバランスの取れた精度を実現した。
論文 参考訳(メタデータ) (2025-08-29T03:24:57Z) - Single GPU Task Adaptation of Pathology Foundation Models for Whole Slide Image Analysis [8.076987502347327]
病理基盤モデル(PFM)は、スライド画像全体(WSI)を解析するための強力なツールとして登場した。
TAPFMは、特徴表現と注目重みの両方を最適化しながら、MILアグリゲーションに視覚変換器(ヴィット)アテンションを使用する。
膀胱癌および肺腺癌に対する突然変異予測タスクの評価。
論文 参考訳(メタデータ) (2025-06-05T15:56:45Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Towards Foundation Models and Few-Shot Parameter-Efficient Fine-Tuning for Volumetric Organ Segmentation [20.94974284175104]
FSEFT(Few-Shot Efficient Fine-Tuning)は、医用画像セグメンテーション基礎モデルに適用するための、新規かつ現実的なシナリオである。
総合的な転写学習実験により, 医用画像分割における基礎モデルの適合性を確認し, 数ショットのシナリオにおいて, 一般的な微調整戦略の限界を明らかにする。
論文 参考訳(メタデータ) (2023-03-29T22:50:05Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal
Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。
異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-23T15:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。