論文の概要: Confounder-Aware Medical Data Selection for Fine-Tuning Pretrained Vision Models
- arxiv url: http://arxiv.org/abs/2503.00744v1
- Date: Sun, 02 Mar 2025 05:50:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:24:20.786855
- Title: Confounder-Aware Medical Data Selection for Fine-Tuning Pretrained Vision Models
- Title(参考訳): ファインチューニング事前訓練ビジョンモデルのための共同設立者対応医療データ選択
- Authors: Anyang Ji, Qingbo Kang, Wei Xu, Changfan Wang, Kang Li, Qicheng Lao,
- Abstract要約: 医用データセットキュレーションのための共同設立者対応医療データ選択手法を提案する。
提案手法は,まずデータ内の変数を識別し,距離に基づくデータ選択戦略を開発する。
多様な医用画像モダリティの広範な実験を通じて,アプローチの優位性を検証した。
- 参考スコア(独自算出の注目度): 11.10271979935354
- License:
- Abstract: The emergence of large-scale pre-trained vision foundation models has greatly advanced the medical imaging field through the pre-training and fine-tuning paradigm. However, selecting appropriate medical data for downstream fine-tuning remains a significant challenge considering its annotation cost, privacy concerns, and the detrimental effects of confounding variables. In this work, we present a confounder-aware medical data selection approach for medical dataset curation aiming to select minimal representative data by strategically mitigating the undesirable impact of confounding variables while preserving the natural distribution of the dataset. Our approach first identifies confounding variables within data and then develops a distance-based data selection strategy for confounder-aware sampling with a constrained budget in the data size. We validate the superiority of our approach through extensive experiments across diverse medical imaging modalities, highlighting its effectiveness in addressing the substantial impact of confounding variables and enhancing the fine-tuning efficiency in the medical imaging domain, compared to other data selection approaches.
- Abstract(参考訳): 大規模で訓練済みの視覚基盤モデルの出現は、事前訓練と微調整のパラダイムを通じて、医療画像分野を大きく進歩させてきた。
しかしながら、下流の微調整のために適切な医療データを選択することは、そのアノテーションコスト、プライバシー上の懸念、および、共起変数の有害な影響を考えると、大きな課題である。
本研究では,データセットの自然分布を保ちつつ,共役変数の望ましくない影響を戦略的に軽減し,最小限の代表データを選択することを目的とした,医療データセットキュレーションのための共同設立型医療データ選択手法を提案する。
提案手法では,まずデータ内の変数を識別し,データサイズに制約のある予算を伴って,データサンプリングのための距離ベースのデータ選択戦略を開発する。
我々は,様々な画像モダリティの広範な実験を通じてアプローチの優位性を検証し,背景変数の実質的な影響に対処し,医用画像領域における微調整効率を他のデータ選択手法と比較して向上させる効果を強調した。
関連論文リスト
- Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。
これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。
既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。
第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文 参考訳(メタデータ) (2025-01-30T06:49:57Z) - Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5091334993691206]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。
より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。
さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文 参考訳(メタデータ) (2024-09-17T17:22:35Z) - STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical Question-Answering [58.79671189792399]
STLLaVA-Medは、医療ビジュアルインストラクションデータを自動生成できるポリシーモデルを訓練するために設計されている。
STLLaVA-Medの有効性とデータ効率を3つの主要な医用視覚質問応答(VQA)ベンチマークで検証した。
論文 参考訳(メタデータ) (2024-06-28T15:01:23Z) - Enhancing Performance for Highly Imbalanced Medical Data via Data Regularization in a Federated Learning Setting [6.22153888560487]
本手法の目的は,心血管疾患予測のためのモデル性能を向上させることである。
本手法は, 心臓血管疾患予測のための4つのデータセットにまたがって評価され, 異なるクライアントに分散している。
論文 参考訳(メタデータ) (2024-05-30T19:15:38Z) - Domain-invariant Clinical Representation Learning by Bridging Data Distribution Shift across EMR Datasets [28.59271580918754]
効果的な予後モデルは、医師が正確な診断を行い、パーソナライズされた治療計画を設計するのを助けることができる。
限られたデータ収集、不十分な臨床経験、プライバシと倫理上の懸念は、データの可用性を制限します。
本稿では,ソースとターゲットデータセット間の遷移モデルを構築するドメイン不変表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T18:32:21Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Data Augmentation-Based Unsupervised Domain Adaptation In Medical
Imaging [0.709016563801433]
脳MRI領域分割における堅牢な領域適応のための教師なし手法を提案する。
その結果,提案手法は高い精度を実現し,幅広い適用性を示し,各種タスクにおけるドメインシフトに対する顕著な堅牢性を示した。
論文 参考訳(メタデータ) (2023-08-08T17:00:11Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。