論文の概要: Exploring the Transferability of a Foundation Model for Fundus Images:
Application to Hypertensive Retinopathy
- arxiv url: http://arxiv.org/abs/2401.15526v1
- Date: Sat, 27 Jan 2024 23:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 17:50:22.073318
- Title: Exploring the Transferability of a Foundation Model for Fundus Images:
Application to Hypertensive Retinopathy
- Title(参考訳): 基底画像基礎モデルの伝達可能性を探る:高血圧網膜症への応用
- Authors: Julio Silva-Rodriguez, Jihed Chelbi, Waziha Kabir, Hadi Chakor, Jose
Dolz, Ismail Ben Ayed and Riadh Kobbi
- Abstract要約: Imagenetで事前トレーニングされたディープラーニングモデルを使用することは、データの不足に対処する医療画像分類の従来のソリューションである。
眼底画像上における高血圧性網膜症診断のためのCGI-HRDCチャレンジは、最近リリースされた網膜の視覚言語基盤モデルFLAIRの転写可能性を評価する魅力的な機会をもたらす。
- 参考スコア(独自算出の注目度): 15.643435527710817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using deep learning models pre-trained on Imagenet is the traditional
solution for medical image classification to deal with data scarcity.
Nevertheless, relevant literature supports that this strategy may offer limited
gains due to the high dissimilarity between domains. Currently, the paradigm of
adapting domain-specialized foundation models is proving to be a promising
alternative. However, how to perform such knowledge transfer, and the benefits
and limitations it presents, are under study. The CGI-HRDC challenge for
Hypertensive Retinopathy diagnosis on fundus images introduces an appealing
opportunity to evaluate the transferability of a recently released
vision-language foundation model of the retina, FLAIR. In this work, we explore
the potential of using FLAIR features as starting point for fundus image
classification, and we compare its performance with regard to Imagenet
initialization on two popular transfer learning methods: Linear Probing (LP)
and Fine-Tuning (FP). Our empirical observations suggest that, in any case, the
use of the traditional strategy provides performance gains. In contrast, direct
transferability from FLAIR model allows gains of 2.5%. When fine-tuning the
whole network, the performance gap increases up to 4%. In this case, we show
that avoiding feature deterioration via LP initialization of the classifier
allows the best re-use of the rich pre-trained features. Although direct
transferability using LP still offers limited performance, we believe that
foundation models such as FLAIR will drive the evolution of deep-learning-based
fundus image analysis.
- Abstract(参考訳): Imagenetで事前トレーニングされたディープラーニングモデルを使用することは、データの不足に対処する医療画像分類の従来のソリューションである。
しかしながら、関連する文献では、この戦略はドメイン間の相違が大きいため、限られた利益をもたらす可能性があるとしている。
現在、ドメイン特化基礎モデルを適用するパラダイムは、有望な代替物であることが証明されています。
しかし,このような知識伝達の方法や,それが提示するメリットや制限は検討中である。
cgi-hrdc challenge for hypertensive retinopathy diagnosis on fundus images では、網膜の視覚言語基盤モデル flair の移植性を評価する絶好の機会が紹介されている。
本研究は,FLAIR特徴を基礎画像分類の出発点として活用する可能性について検討し,その性能を2つの一般的な変換学習手法であるLinear Probing(LP)とFine-Tuning(FP)と比較する。
私たちの経験的観察は、いずれにせよ、従来の戦略がパフォーマンスの向上をもたらすことを示唆しています。
対照的にFLAIRモデルからの直接転送性は2.5%である。
ネットワーク全体を微調整する場合、パフォーマンスギャップは4%まで増加する。
本稿では,分類器のLP初期化による特徴劣化の回避が,事前学習したリッチな特徴の再使用を可能にすることを示す。
LPを用いた直接転送は依然として性能に限界があるが,FLAIRのような基礎モデルは,ディープラーニングに基づく基礎画像解析の進化を促進するだろうと考えている。
関連論文リスト
- Pick the Best Pre-trained Model: Towards Transferability Estimation for
Medical Image Segmentation [20.03177073703528]
転送学習は、難しい医用画像分割タスクのために、ディープニューラルネットワークをトレーニングする上で重要なテクニックである。
医用画像セグメンテーションのための新しい転送可能性推定法を提案する。
医用画像のセグメンテーションにおける転送可能性推定のアルゴリズムを網羅した手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T01:58:18Z) - Forward-Forward Contrastive Learning [4.465144120325802]
医用画像分類のための新しい事前学習手法として,前向きコントラスト学習(FFCL)を提案する。
FFCLは、肺炎分類タスクにおける既存の事前訓練モデルよりも、ImageNet Pretrained ResNet-18よりも3.69%の精度で性能が向上している。
論文 参考訳(メタデータ) (2023-05-04T15:29:06Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - Bridging Synthetic and Real Images: a Transferable and Multiple
Consistency aided Fundus Image Enhancement Framework [61.74188977009786]
画像強調とドメイン適応を同時に行うために,エンドツーエンドの教師支援フレームワークを提案する。
また,教師ネットワークと学生ネットワークのバックボーンとして,マルチステージ型マルチアテンション・ガイド・エンハンスメント・ネットワーク(MAGE-Net)を提案する。
論文 参考訳(メタデータ) (2023-02-23T06:16:15Z) - Pre-text Representation Transfer for Deep Learning with Limited
Imbalanced Data : Application to CT-based COVID-19 Detection [18.72489078928417]
我々は、PRT(Pre-text Representation Transfer)という新しい概念を提案する。
PRTは元の分類層を保持し、教師なしのプレテキストタスクを通じて表現層を更新する。
提案手法により,従来の移動学習よりも一貫した効果が得られた。
論文 参考訳(メタデータ) (2023-01-21T04:47:35Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Differentially private federated deep learning for multi-site medical
image segmentation [56.30543374146002]
フェデレートラーニング(FL)のような協調機械学習技術は、データ転送なしで効果的に大規模なデータセット上でモデルのトレーニングを可能にする。
近年のイニシアチブでは、FLで訓練されたセグメンテーションモデルが、局所的に訓練されたモデルと同様のパフォーマンスを達成できることが示されている。
しかし、FLは完全なプライバシ保護技術ではなく、プライバシ中心の攻撃は秘密の患者データを開示することができる。
論文 参考訳(メタデータ) (2021-07-06T12:57:32Z) - Leveraging Regular Fundus Images for Training UWF Fundus Diagnosis
Models via Adversarial Learning and Pseudo-Labeling [29.009663623719064]
オプトスカメラによる超広視野(UWF)200度の基礎イメージングが徐々に導入されている。
正規の眼底画像は、大量の高品質な注釈付きデータを含んでいる。
ドメインギャップのため、UWFファウンス画像を認識するために、通常のファウンス画像によって訓練されたモデルは、性能が良くない。
本稿では,通常のUWFファウンダスとUWFファウンダスとのギャップを埋めるために,修正サイクル生成対逆ネットワーク(CycleGAN)モデルを提案する。
論文 参考訳(メタデータ) (2020-11-27T16:25:30Z) - Blind Image Restoration with Flow Based Priors [19.190289348734215]
未知の劣化を伴う盲点において、優れた先行性は依然として不可欠である。
本稿では, 正規化フローを用いて対象コンテンツの分布をモデル化し, 最大アフターリ(MAP)の定式化に先立ってこれを前もって用いることを提案する。
我々の知る限りでは、これは画像強調問題に先行する正規化フローを探求する最初の研究である。
論文 参考訳(メタデータ) (2020-09-09T21:40:11Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。