Fugu-MT 論文翻訳(概要): Exploring the Transferability of a Foundation Model for Fundus Images: Application to Hypertensive Retinopathy

論文の概要: Exploring the Transferability of a Foundation Model for Fundus Images: Application to Hypertensive Retinopathy

arxiv url: http://arxiv.org/abs/2401.15526v1
Date: Sat, 27 Jan 2024 23:40:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-30 17:50:22.073318
Title: Exploring the Transferability of a Foundation Model for Fundus Images: Application to Hypertensive Retinopathy
Title（参考訳）: 基底画像基礎モデルの伝達可能性を探る:高血圧網膜症への応用
Authors: Julio Silva-Rodriguez, Jihed Chelbi, Waziha Kabir, Hadi Chakor, Jose Dolz, Ismail Ben Ayed and Riadh Kobbi
Abstract要約: Imagenetで事前トレーニングされたディープラーニングモデルを使用することは、データの不足に対処する医療画像分類の従来のソリューションである。眼底画像上における高血圧性網膜症診断のためのCGI-HRDCチャレンジは、最近リリースされた網膜の視覚言語基盤モデルFLAIRの転写可能性を評価する魅力的な機会をもたらす。
参考スコア（独自算出の注目度）: 15.643435527710817
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Using deep learning models pre-trained on Imagenet is the traditional solution for medical image classification to deal with data scarcity. Nevertheless, relevant literature supports that this strategy may offer limited gains due to the high dissimilarity between domains. Currently, the paradigm of adapting domain-specialized foundation models is proving to be a promising alternative. However, how to perform such knowledge transfer, and the benefits and limitations it presents, are under study. The CGI-HRDC challenge for Hypertensive Retinopathy diagnosis on fundus images introduces an appealing opportunity to evaluate the transferability of a recently released vision-language foundation model of the retina, FLAIR. In this work, we explore the potential of using FLAIR features as starting point for fundus image classification, and we compare its performance with regard to Imagenet initialization on two popular transfer learning methods: Linear Probing (LP) and Fine-Tuning (FP). Our empirical observations suggest that, in any case, the use of the traditional strategy provides performance gains. In contrast, direct transferability from FLAIR model allows gains of 2.5%. When fine-tuning the whole network, the performance gap increases up to 4%. In this case, we show that avoiding feature deterioration via LP initialization of the classifier allows the best re-use of the rich pre-trained features. Although direct transferability using LP still offers limited performance, we believe that foundation models such as FLAIR will drive the evolution of deep-learning-based fundus image analysis.
Abstract（参考訳）: Imagenetで事前トレーニングされたディープラーニングモデルを使用することは、データの不足に対処する医療画像分類の従来のソリューションである。しかしながら、関連する文献では、この戦略はドメイン間の相違が大きいため、限られた利益をもたらす可能性があるとしている。現在、ドメイン特化基礎モデルを適用するパラダイムは、有望な代替物であることが証明されています。しかし,このような知識伝達の方法や,それが提示するメリットや制限は検討中である。 cgi-hrdc challenge for hypertensive retinopathy diagnosis on fundus images では、網膜の視覚言語基盤モデル flair の移植性を評価する絶好の機会が紹介されている。本研究は,FLAIR特徴を基礎画像分類の出発点として活用する可能性について検討し,その性能を2つの一般的な変換学習手法であるLinear Probing(LP)とFine-Tuning(FP)と比較する。私たちの経験的観察は、いずれにせよ、従来の戦略がパフォーマンスの向上をもたらすことを示唆しています。対照的にFLAIRモデルからの直接転送性は2.5%である。ネットワーク全体を微調整する場合、パフォーマンスギャップは4%まで増加する。本稿では,分類器のLP初期化による特徴劣化の回避が,事前学習したリッチな特徴の再使用を可能にすることを示す。 LPを用いた直接転送は依然として性能に限界があるが,FLAIRのような基礎モデルは,ディープラーニングに基づく基礎画像解析の進化を促進するだろうと考えている。

関連論文リスト

Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2025-06-03T09:29:47Z)
JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文参考訳（メタデータ） (2023-12-20T08:05:57Z)
Forward-Forward Contrastive Learning [4.465144120325802]
医用画像分類のための新しい事前学習手法として,前向きコントラスト学習(FFCL)を提案する。 FFCLは、肺炎分類タスクにおける既存の事前訓練モデルよりも、ImageNet Pretrained ResNet-18よりも3.69%の精度で性能が向上している。
論文参考訳（メタデータ） (2023-05-04T15:29:06Z)
Performance of GAN-based augmentation for deep learning COVID-19 image classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文参考訳（メタデータ） (2023-04-18T15:39:58Z)
Towards Foundation Models and Few-Shot Parameter-Efficient Fine-Tuning for Volumetric Organ Segmentation [20.94974284175104]
FSEFT(Few-Shot Efficient Fine-Tuning)は、医用画像セグメンテーション基礎モデルに適用するための、新規かつ現実的なシナリオである。総合的な転写学習実験により, 医用画像分割における基礎モデルの適合性を確認し, 数ショットのシナリオにおいて, 一般的な微調整戦略の限界を明らかにする。
論文参考訳（メタデータ） (2023-03-29T22:50:05Z)
Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文参考訳（メタデータ） (2023-03-17T18:00:27Z)
Bridging Synthetic and Real Images: a Transferable and Multiple Consistency aided Fundus Image Enhancement Framework [61.74188977009786]
画像強調とドメイン適応を同時に行うために,エンドツーエンドの教師支援フレームワークを提案する。また,教師ネットワークと学生ネットワークのバックボーンとして,マルチステージ型マルチアテンション・ガイド・エンハンスメント・ネットワーク(MAGE-Net)を提案する。
論文参考訳（メタデータ） (2023-02-23T06:16:15Z)
Pre-text Representation Transfer for Deep Learning with Limited Imbalanced Data : Application to CT-based COVID-19 Detection [18.72489078928417]
我々は、PRT(Pre-text Representation Transfer)という新しい概念を提案する。 PRTは元の分類層を保持し、教師なしのプレテキストタスクを通じて表現層を更新する。提案手法により,従来の移動学習よりも一貫した効果が得られた。
論文参考訳（メタデータ） (2023-01-21T04:47:35Z)
Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文参考訳（メタデータ） (2021-11-27T12:12:57Z)
Differentially private federated deep learning for multi-site medical image segmentation [56.30543374146002]
フェデレートラーニング(FL)のような協調機械学習技術は、データ転送なしで効果的に大規模なデータセット上でモデルのトレーニングを可能にする。近年のイニシアチブでは、FLで訓練されたセグメンテーションモデルが、局所的に訓練されたモデルと同様のパフォーマンスを達成できることが示されている。しかし、FLは完全なプライバシ保護技術ではなく、プライバシ中心の攻撃は秘密の患者データを開示することができる。
論文参考訳（メタデータ） (2021-07-06T12:57:32Z)
Leveraging Regular Fundus Images for Training UWF Fundus Diagnosis Models via Adversarial Learning and Pseudo-Labeling [29.009663623719064]
オプトスカメラによる超広視野(UWF)200度の基礎イメージングが徐々に導入されている。正規の眼底画像は、大量の高品質な注釈付きデータを含んでいる。ドメインギャップのため、UWFファウンス画像を認識するために、通常のファウンス画像によって訓練されたモデルは、性能が良くない。本稿では,通常のUWFファウンダスとUWFファウンダスとのギャップを埋めるために,修正サイクル生成対逆ネットワーク(CycleGAN)モデルを提案する。
論文参考訳（メタデータ） (2020-11-27T16:25:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。