論文の概要: Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare
- arxiv url: http://arxiv.org/abs/2505.20020v1
- Date: Mon, 26 May 2025 14:09:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.494373
- Title: Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare
- Title(参考訳): 医療におけるフェデレーションラーニングのためのオントロジーとLCMに基づくデータ調和
- Authors: Natallia Kokash, Lei Wang, Thomas H. Gillespie, Adam Belloum, Paola Grosso, Sara Quinney, Lang Li, Bernard de Bono,
- Abstract要約: フェデレートラーニング(FL)は、データを共有せずに協調的なモデリングを可能にするが、さまざまな臨床データセットで生データを調和させるという課題に直面している。
本稿では,医療におけるセキュアでプライバシ保護のFLを支援するために,大規模モデル(LLM)を統合した2段階のデータアライメント戦略を提案する。
- 参考スコア(独自算出の注目度): 1.791002543005888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of electronic health records (EHRs) has unlocked new opportunities for medical research, but privacy regulations and data heterogeneity remain key barriers to large-scale machine learning. Federated learning (FL) enables collaborative modeling without sharing raw data, yet faces challenges in harmonizing diverse clinical datasets. This paper presents a two-step data alignment strategy integrating ontologies and large language models (LLMs) to support secure, privacy-preserving FL in healthcare, demonstrating its effectiveness in a real-world project involving semantic mapping of EHR data.
- Abstract(参考訳): 電子健康記録(EHR)の台頭は、医学研究の新しい機会を解き放ったが、プライバシー規制とデータの異質性は、大規模な機械学習にとって重要な障壁である。
フェデレートラーニング(FL)は、生データを共有せずに協調的なモデリングを可能にするが、多様な臨床データセットを調和させることの課題に直面している。
本稿では,医療におけるセキュアかつプライバシ保護的なFLを支援するために,オントロジーと大規模言語モデル(LLM)を統合した2段階のデータアライメント戦略を提案する。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Open Challenges and Opportunities in Federated Foundation Models Towards Biomedical Healthcare [14.399086205317358]
ファンデーションモデル(FM)は、教師なし事前訓練、自己教師付き学習、微調整の指導、人間のフィードバックからの強化学習など、膨大なデータセットで訓練される。
これらのモデルは、臨床報告、診断画像、マルチモーダル患者間相互作用などの多様なデータフォームの処理を必要とする生体医学的応用に不可欠である。
FLをこれらの洗練されたモデルに組み込むことは、機密性の高い医療データのプライバシーを守りながら、分析能力を活用するという有望な戦略を示す。
論文 参考訳(メタデータ) (2024-05-10T19:22:24Z) - A Distributed Privacy Preserving Model for the Detection of Alzheimer's Disease [0.0]
本稿では,分散データからトレーニングできるHIPAA準拠のフレームワークを提案する。
次に,アルツハイマー病(AD)検出のための多モード垂直フェデレーションモデルを提案する。
ここで提案されたVFLアーキテクチャは、多様な医療データソースをまたいだ協調学習を可能にする、新しい分散アーキテクチャを提供する。
論文 参考訳(メタデータ) (2023-12-15T22:09:04Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Patchwork Learning: A Paradigm Towards Integrative Analysis across
Diverse Biomedical Data Sources [40.32772510980854]
パッチワーク学習(PL)とは、異なるデータモダリティからなる異なるデータセットからの情報を統合するパラダイムである。
PLはデータのプライバシを保持しながら、補完的なデータソースの同時利用を可能にする。
本稿では、パッチワーク学習の概念とその医療における実装について紹介し、潜在的な機会と適用可能なデータソースを探求する。
論文 参考訳(メタデータ) (2023-05-10T14:50:33Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Differentially private federated deep learning for multi-site medical
image segmentation [56.30543374146002]
フェデレートラーニング(FL)のような協調機械学習技術は、データ転送なしで効果的に大規模なデータセット上でモデルのトレーニングを可能にする。
近年のイニシアチブでは、FLで訓練されたセグメンテーションモデルが、局所的に訓練されたモデルと同様のパフォーマンスを達成できることが示されている。
しかし、FLは完全なプライバシ保護技術ではなく、プライバシ中心の攻撃は秘密の患者データを開示することができる。
論文 参考訳(メタデータ) (2021-07-06T12:57:32Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Anonymizing Data for Privacy-Preserving Federated Learning [3.3673553810697827]
我々は,フェデレートラーニングの文脈において,プライバシを提供するための最初の構文的アプローチを提案する。
当社のアプローチは,プライバシの保護レベルをサポートしながら,実用性やモデルの性能を最大化することを目的としている。
医療領域における2つの重要な課題について,100万人の患者の実世界電子健康データを用いて包括的実証評価を行った。
論文 参考訳(メタデータ) (2020-02-21T02:30:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。