論文の概要: LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction
- arxiv url: http://arxiv.org/abs/2603.07249v1
- Date: Sat, 07 Mar 2026 15:01:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.119876
- Title: LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction
- Title(参考訳): LF2L:外部データセットを用いた不均質特徴空間間のロスフュージョン水平フェデレーション学習を効果的に行う:第2次がん予知における事例研究
- Authors: Chia-Fu Lin, Yi-Ju Tseng,
- Abstract要約: 第2原発性癌(SPC)は、がん生存率の改善が懸念されている。
本研究は台湾の病院で治療を受けた肺癌患者を対象としている。
我々は,米国におけるSurveillance, Epidemiology, End Results (SEER)プログラムの外部データを組み込んだ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Second primary cancer (SPC), a new cancer in patients different from previously diagnosed, is a growing concern due to improved cancer survival rates. Early prediction of SPC is essential to enable timely clinical interventions. This study focuses on lung cancer survivors treated in Taiwanese hospitals, where the limited size and geographic scope of local datasets restrict the effectiveness and generalizability of traditional machine learning approaches. To address this, we incorporate external data from the publicly available US-based Surveillance, Epidemiology, and End Results (SEER) program, significantly increasing data diversity and scale. However, the integration of multi-source datasets presents challenges such as feature inconsistency and privacy constraints. Rather than naively merging data, we proposed a loss fusion horizontal federated learning (LF2L) framework that can enable effective cross-institutional collaboration while preserving institutional privacy by avoiding data sharing. Using both common and unique features and balancing their contributions through a shared loss mechanism, our method demonstrates substantial improvements in the prediction performance of SPC. Experiment results show statistically significant improvements in AUROC and AUPRC when compared to localized, horizontal federated, and centralized learning baselines. This highlights the importance of not only acquiring external data but also leveraging it effectively to enhance model performance in real-world clinical model development.
- Abstract(参考訳): 第2原発性癌(SPC)は、以前に診断された癌とは異なる新しいがんであり、がん生存率の改善が懸念されている。
SPCの早期予測は、タイムリーな臨床介入を可能にするために不可欠である。
本研究は, 台湾の病院で治療された肺癌患者を対象として, 局所データセットのサイズと地理的範囲が, 従来の機械学習手法の有効性と一般化性を制限している。
これを解決するために、米国におけるSurveillance, Epidemiology, and End Results (SEER)プログラムの外部データを組み込んだ。
しかし、マルチソースデータセットの統合は、機能不整合やプライバシ制約といった課題を提示している。
そこで我々は,データ共有を回避し,機関のプライバシを保ちつつ,効果的な組織間協調を可能にする,損失融合水平連合学習(LF2L)フレームワークを提案した。
共通の特徴とユニークな特徴の両方を用いて,共有損失機構によるコントリビューションのバランスをとることで,SPCの予測性能が大幅に向上したことを示す。
AUROCとAUPRCは, 局所的, 水平的, 集中的な学習ベースラインと比較して, 統計的に有意な改善が認められた。
このことは、外部データを取得することだけでなく、実際の臨床モデル開発におけるモデルパフォーマンスを高めるために効果的に活用することの重要性を強調している。
関連論文リスト
- Federated Proximal Optimization for Privacy-Preserving Heart Disease Prediction: A Controlled Simulation Study on Non-IID Clinical Data [1.620240963217448]
本稿では,UCI心疾患データセットに基づく心疾患予測のためのフェデレーション・プロキシ・オプティマイズ(FedProx)の総合シミュレーション研究について述べる。
我々はクリーブランドクリニックの4つの異種病院クライアントをシミュレートすることにより,現実的な非IIDデータ分割を生成する。
我々の結果は病院IT管理者に直接転送可能であり、プライバシー保護協調学習を実装しています。
論文 参考訳(メタデータ) (2026-01-23T21:18:08Z) - Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Targeted Data Fusion for Causal Survival Analysis Under Distribution Shift [46.84912148188679]
複数のデータソースにまたがる因果推論は、科学的発見の一般化性と複製性を高めるための有望な道を提供する。
既存のアプローチでは、検閲や離散的かつ連続的な時間の統合など、生存分析のユニークな課題に対処できない。
マルチソース設定におけるターゲットサイト固有の因果効果を推定する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-30T23:21:25Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Leveraging Federated Learning for Automatic Detection of Clopidogrel
Treatment Failures [0.8132630541462695]
本研究では,クロピドッグレル処理障害検出のためのフェデレーション学習戦略を活用する。
地理的中心に基づいてデータを分割し,フェデレート学習の性能を評価した。
クロピドッグレル治療障害検出におけるフェデレート学習の可能性について検討した。
論文 参考訳(メタデータ) (2024-03-05T23:31:07Z) - Decentralized Distributed Learning with Privacy-Preserving Data
Synthesis [9.276097219140073]
医療分野では、患者と臨床データの均一性を生かして、多施設共同研究がより一般化可能な発見をもたらすことがしばしばある。
最近のプライバシー規制は、データの共有を妨げ、その結果、診断と予後をサポートする機械学習ベースのソリューションを考案する。
ローカルノードの機能を統合する分散分散手法を提案し、プライバシを維持しながら複数のデータセットをまたいで一般化可能なモデルを提供する。
論文 参考訳(メタデータ) (2022-06-20T23:49:38Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。