Fugu-MT 論文翻訳(概要): Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare

論文の概要: Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare

arxiv url: http://arxiv.org/abs/2505.20020v1
Date: Mon, 26 May 2025 14:09:17 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:43.494373
Title: Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare
Title（参考訳）: 医療におけるフェデレーションラーニングのためのオントロジーとLCMに基づくデータ調和
Authors: Natallia Kokash, Lei Wang, Thomas H. Gillespie, Adam Belloum, Paola Grosso, Sara Quinney, Lang Li, Bernard de Bono,
Abstract要約: フェデレートラーニング(FL)は、データを共有せずに協調的なモデリングを可能にするが、さまざまな臨床データセットで生データを調和させるという課題に直面している。本稿では,医療におけるセキュアでプライバシ保護のFLを支援するために,大規模モデル(LLM)を統合した2段階のデータアライメント戦略を提案する。
参考スコア（独自算出の注目度）: 1.791002543005888
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rise of electronic health records (EHRs) has unlocked new opportunities for medical research, but privacy regulations and data heterogeneity remain key barriers to large-scale machine learning. Federated learning (FL) enables collaborative modeling without sharing raw data, yet faces challenges in harmonizing diverse clinical datasets. This paper presents a two-step data alignment strategy integrating ontologies and large language models (LLMs) to support secure, privacy-preserving FL in healthcare, demonstrating its effectiveness in a real-world project involving semantic mapping of EHR data.
Abstract（参考訳）: 電子健康記録(EHR)の台頭は、医学研究の新しい機会を解き放ったが、プライバシー規制とデータの異質性は、大規模な機械学習にとって重要な障壁である。フェデレートラーニング(FL)は、生データを共有せずに協調的なモデリングを可能にするが、多様な臨床データセットを調和させることの課題に直面している。本稿では,医療におけるセキュアかつプライバシ保護的なFLを支援するために,オントロジーと大規模言語モデル(LLM)を統合した2段階のデータアライメント戦略を提案する。

関連論文リスト

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文参考訳（メタデータ） (2025-10-24T15:56:40Z)
A Case Study Exploring the Current Landscape of Synthetic Medical Record Generation with Commercial LLMs [1.1645633237702129]
合成データを生成する商用大規模言語モデルの現状を評価する。我々の主な発見は、LLMが小さな特徴のサブセットに対して確実に合成された健康記録を生成できる一方で、データの次元が増加するにつれて、現実的な分布と相関を維持するのに苦労していることである。
論文参考訳（メタデータ） (2025-04-20T15:37:05Z)
FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文参考訳（メタデータ） (2024-10-28T02:24:01Z)
Open Challenges and Opportunities in Federated Foundation Models Towards Biomedical Healthcare [14.399086205317358]
ファンデーションモデル(FM)は、教師なし事前訓練、自己教師付き学習、微調整の指導、人間のフィードバックからの強化学習など、膨大なデータセットで訓練される。これらのモデルは、臨床報告、診断画像、マルチモーダル患者間相互作用などの多様なデータフォームの処理を必要とする生体医学的応用に不可欠である。 FLをこれらの洗練されたモデルに組み込むことは、機密性の高い医療データのプライバシーを守りながら、分析能力を活用するという有望な戦略を示す。
論文参考訳（メタデータ） (2024-05-10T19:22:24Z)
A Distributed Privacy Preserving Model for the Detection of Alzheimer's Disease [0.0]
本稿では,分散データからトレーニングできるHIPAA準拠のフレームワークを提案する。次に,アルツハイマー病(AD)検出のための多モード垂直フェデレーションモデルを提案する。ここで提案されたVFLアーキテクチャは、多様な医療データソースをまたいだ協調学習を可能にする、新しい分散アーキテクチャを提供する。
論文参考訳（メタデータ） (2023-12-15T22:09:04Z)
Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites: A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文参考訳（メタデータ） (2023-08-31T00:36:10Z)
Multi-Site Clinical Federated Learning using Recursive and Attentive Models and NVFlare [13.176351544342735]
本稿では、データプライバシと規制コンプライアンスの課題に対処する統合フレームワークを開発する。これには、データのプライバシと規制コンプライアンスの課題に対処し、高い精度を維持し、提案されたアプローチの有効性を実証する統合フレームワークの開発が含まれている。
論文参考訳（メタデータ） (2023-06-28T17:00:32Z)
Patchwork Learning: A Paradigm Towards Integrative Analysis across Diverse Biomedical Data Sources [40.32772510980854]
パッチワーク学習(PL)とは、異なるデータモダリティからなる異なるデータセットからの情報を統合するパラダイムである。 PLはデータのプライバシを保持しながら、補完的なデータソースの同時利用を可能にする。本稿では、パッチワーク学習の概念とその医療における実装について紹介し、潜在的な機会と適用可能なデータソースを探求する。
論文参考訳（メタデータ） (2023-05-10T14:50:33Z)
Large Language Models for Healthcare Data Augmentation: An Example on Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文参考訳（メタデータ） (2023-03-24T03:14:00Z)
When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning Framework in Classification of Medical Images on Limited Data: A COVID-19 Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。 CNNは医療画像の解析に広く利用され、検証されている。
論文参考訳（メタデータ） (2022-03-24T02:09:41Z)
Differentially private federated deep learning for multi-site medical image segmentation [56.30543374146002]
フェデレートラーニング(FL)のような協調機械学習技術は、データ転送なしで効果的に大規模なデータセット上でモデルのトレーニングを可能にする。近年のイニシアチブでは、FLで訓練されたセグメンテーションモデルが、局所的に訓練されたモデルと同様のパフォーマンスを達成できることが示されている。しかし、FLは完全なプライバシ保護技術ではなく、プライバシ中心の攻撃は秘密の患者データを開示することができる。
論文参考訳（メタデータ） (2021-07-06T12:57:32Z)
FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。患者のプライバシー上の懸念から、データそのものはまだ乏しい。我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文参考訳（メタデータ） (2021-02-10T01:56:58Z)
Anonymizing Data for Privacy-Preserving Federated Learning [3.3673553810697827]
我々は,フェデレートラーニングの文脈において,プライバシを提供するための最初の構文的アプローチを提案する。当社のアプローチは,プライバシの保護レベルをサポートしながら,実用性やモデルの性能を最大化することを目的としている。医療領域における2つの重要な課題について,100万人の患者の実世界電子健康データを用いて包括的実証評価を行った。
論文参考訳（メタデータ） (2020-02-21T02:30:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。