論文の概要: Less Could Be Better: Parameter-efficient Fine-tuning Advances Medical
Vision Foundation Models
- arxiv url: http://arxiv.org/abs/2401.12215v1
- Date: Mon, 22 Jan 2024 18:59:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 12:50:50.765143
- Title: Less Could Be Better: Parameter-efficient Fine-tuning Advances Medical
Vision Foundation Models
- Title(参考訳): パラメーター効率の良い微調整で医療ビジョンの基礎モデルが改善される
- Authors: Chenyu Lian, Hong-Yu Zhou, Yizhou Yu, Liansheng Wang
- Abstract要約: 医療視基盤モデルにおけるPEFTの有効性はまだ不明である。
NIH ChestX-ray14のラベル付きデータを用いたAUROCスコアの80.6%など,さまざまなデータ効率の学習タスクに対して,新たな最先端技術を構築した。
本研究は, PEFTを用いた医用画像の伝達学習において, コミュニティの注目を集めることが期待できる。
- 参考スコア(独自算出の注目度): 71.18275399694689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter-efficient fine-tuning (PEFT) that was initially developed for
exploiting pre-trained large language models has recently emerged as an
effective approach to perform transfer learning on computer vision tasks.
However, the effectiveness of PEFT on medical vision foundation models is still
unclear and remains to be explored. As a proof of concept, we conducted a
detailed empirical study on applying PEFT to chest radiography foundation
models. Specifically, we delved into LoRA, a representative PEFT method, and
compared it against full-parameter fine-tuning (FFT) on two self-supervised
radiography foundation models across three well-established chest radiograph
datasets. Our results showed that LoRA outperformed FFT in 13 out of 18
transfer learning tasks by at most 2.9% using fewer than 1% tunable parameters.
Combining LoRA with foundation models, we set up new state-of-the-art on a
range of data-efficient learning tasks, such as an AUROC score of 80.6% using
1% labeled data on NIH ChestX-ray14. We hope this study can evoke more
attention from the community in the use of PEFT for transfer learning on
medical imaging tasks. Code and models are available at
https://github.com/RL4M/MED-PEFT.
- Abstract(参考訳): 近年,コンピュータビジョンタスクの伝達学習に有効な手法として,事前学習済みの大規模言語モデルを利用するために開発されたパラメータ効率のよい微調整(PEFT)が登場している。
しかし, PEFTの医療ビジョン基礎モデルに対する効果はいまだ不明であり, 検討が続けられている。
概念実証として,胸部x線基礎モデルに対するpeftの適用に関する詳細な実験を行った。
具体的には、代表的PEFT法であるLoRAを探索し、3つの確立された胸部X線写真データセットの2つの自監督ラジオグラフィ基礎モデル上で、FFT(Full-parameter fine-tuning)と比較した。
その結果、LoRAは学習課題18件中13件でFFTを2.9%以上改善し、調整可能なパラメータは1%以下であった。
基礎モデルとLoRAを組み合わせることで、NIH ChestX-ray14の1%ラベル付きデータを使用して、AUROCスコアの80.6%など、さまざまなデータ効率の学習タスクに新たな最先端技術を導入しました。
本研究は, PEFTを用いた医療画像の伝達学習において, コミュニティの注目を集めることが期待できる。
コードとモデルはhttps://github.com/RL4M/MED-PEFTで公開されている。
関連論文リスト
- Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware
Prostate Cancer Classification [60.20736568336466]
臨床的に有意なPCa分類のための前立腺mp-MRIの非対位画像変換のための新しいアプローチを提案する。
我々は、明らかなディープラーニングアプローチにより、モデルの不確実性を見積もる。
提案手法は, ROC曲線(AUC)を20%以上改善することを示した。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - Strong Baselines for Parameter Efficient Few-Shot Fine-tuning [50.83426196335385]
FSC (Few-shot Classification) は、事前訓練(メタトレーニング)フェーズの後にクラス毎にいくつかの例を与えられた新しいクラスを学習する。
近年の研究では、新しいテストクラスで事前訓練された視覚変換器(ViT)を微調整することが、FSCにとって強力なアプローチであることが示されている。
しかし、微調整のViTは、時間、計算、ストレージに費用がかかる。
これにより、Transformerのパラメータのごく一部だけを微調整するPEFT法が考案された。
論文 参考訳(メタデータ) (2023-04-04T16:14:39Z) - BERTHop: An Effective Vision-and-Language Model for Chest X-ray Disease
Diagnosis [42.917164607812886]
ヴィジュアル・アンド・ランゲージ(V&L)モデルは、画像とテキストを入力として取り、それら間の関連を捉えることを学ぶ。
BERTHopは、PixelHop++とVisualBERTをベースとしたトランスフォーマーベースのモデルで、2つのモダリティ間の関連をよりよく捉える。
論文 参考訳(メタデータ) (2021-08-10T21:51:25Z) - A Data Augmented Approach to Transfer Learning for Covid-19 Detection [0.0]
早期のコビッドウイルス検出は、その拡散を防ぐための効果的な治療と隔離計画に役立つ。
近年、X線、超音波、CTスキャンを用いたコビッド19の検出にトランスファーラーニングが用いられている。
これらの提案手法に固有の大きな制限の1つは、ラベル付きデータセットのサイズ制限である。
論文 参考訳(メタデータ) (2021-08-05T22:23:23Z) - DPN-SENet:A self-attention mechanism neural network for detection and
diagnosis of COVID-19 from chest x-ray images [16.010171071102416]
新型コロナウイルス(COVID-19)とも呼ばれる新型ウイルスは、2019年末に流行し、今では世界中に広まっている。
本稿では,放射線科医や臨床医が胸部X線を用いて新型コロナウイルスの診断に役立てる深層学習モデルを提案する。
論文 参考訳(メタデータ) (2021-05-20T11:50:52Z) - Transfer Learning Enhanced Generative Adversarial Networks for
Multi-Channel MRI Reconstruction [3.5765797841178597]
深層学習に基づく生成敵ネットワーク(GAN)は、アンダーサンプルMRデータを用いて画像再構成を効果的に行うことができる。
k空間データの保存は臨床フローにはないため、モデルトレーニングのために何万もの生患者データを取得することは困難である。
本研究では,GANモデル(PI-GAN)と移動学習を組み合わせた並列イメージングに基づく3つの新しい応用について検討した。
論文 参考訳(メタデータ) (2021-05-17T21:28:00Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Predicting COVID-19 Pneumonia Severity on Chest X-ray with Deep Learning [57.00601760750389]
前頭部胸部X線画像の重症度予測モデルを提案する。
このようなツールは、エスカレーションやケアの非エスカレーションに使用できる新型コロナウイルスの肺感染症の重症度を測定することができる。
論文 参考訳(メタデータ) (2020-05-24T23:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。