論文の概要: Federated Learning for ICD Classification with Lightweight Models and Pretrained Embeddings
- arxiv url: http://arxiv.org/abs/2507.03122v1
- Date: Thu, 03 Jul 2025 18:58:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.586522
- Title: Federated Learning for ICD Classification with Lightweight Models and Pretrained Embeddings
- Title(参考訳): 軽量モデルと事前学習によるICD分類のためのフェデレートラーニング
- Authors: Binbin Xu, Gérard Dray,
- Abstract要約: 本研究では,多ラベルICD符号分類におけるフェデレート学習の有効性と性能について検討した。
本稿では, シンプルな多層パーセプトロン(MLP)分類器と凍結したテキスト埋め込みを組み合わせたスケーラブルなパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.9668407688201359
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates the feasibility and performance of federated learning (FL) for multi-label ICD code classification using clinical notes from the MIMIC-IV dataset. Unlike previous approaches that rely on centralized training or fine-tuned large language models, we propose a lightweight and scalable pipeline combining frozen text embeddings with simple multilayer perceptron (MLP) classifiers. This design offers a privacy-preserving and deployment-efficient alternative for clinical NLP applications, particularly suited to distributed healthcare settings. Extensive experiments across both centralized and federated configurations were conducted, testing six publicly available embedding models from Massive Text Embedding Benchmark leaderboard and three MLP classifier architectures under two medical coding (ICD-9 and ICD-10). Additionally, ablation studies over ten random stratified splits assess performance stability. Results show that embedding quality substantially outweighs classifier complexity in determining predictive performance, and that federated learning can closely match centralized results in idealized conditions. While the models are orders of magnitude smaller than state-of-the-art architectures and achieved competitive micro and macro F1 scores, limitations remain including the lack of end-to-end training and the simplified FL assumptions. Nevertheless, this work demonstrates a viable way toward scalable, privacy-conscious medical coding systems and offers a step toward for future research into federated, domain-adaptive clinical AI.
- Abstract(参考訳): 本研究は,MIMIC-IVデータセットを用いた多ラベルICD符号分類におけるフェデレートラーニング(FL)の有効性と性能について検討した。
集中型学習や微調整型大規模言語モデルに頼っていた従来のアプローチとは違って, 簡単な多層パーセプトロン(MLP)分類器と凍結したテキスト埋め込みを組み合わせた軽量でスケーラブルなパイプラインを提案する。
この設計は、特に分散型ヘルスケア設定に適した臨床NLPアプリケーションに対して、プライバシ保護とデプロイメント効率の代替を提供する。
集中型とフェデレーション型の両方にわたる大規模な実験を行い、ICD-9とICD-10の2つの医療コーディングの下で、Massive Text Embedding Benchmarkのリーダーボードと3つのMLP分類器アーキテクチャから利用可能な6つの埋め込みモデルを試験した。
さらに、10以上のランダムな成層分割に関するアブレーション研究は、性能安定性を評価する。
その結果、組込み品質は予測性能を決定する際の分類器の複雑さを大幅に上回り、フェデレーション学習は理想化された条件下で集中的な結果と密に一致できることが示唆された。
モデルは最先端のアーキテクチャよりも桁違いに小さく、競合するマイクロおよびマクロF1スコアを達成したが、エンドツーエンドのトレーニングの欠如や単純化されたFL仮定を含む制限は残されている。
それでもこの研究は、スケーラブルでプライバシを重視した医療コーディングシステムへの実行可能な方法を示し、フェデレートされたドメイン適応型臨床AIの研究に向けたステップを提供する。
関連論文リスト
- Clinical NLP with Attention-Based Deep Learning for Multi-Disease Prediction [44.0876796031468]
本稿では,電子健康記録テキストの非構造的性質と高次元意味論的複雑さがもたらす課題について論じる。
情報抽出と多ラベル病予測のための統合モデリングを実現するために,注意機構に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-02T07:45:22Z) - In-Context Learning for Label-Efficient Cancer Image Classification in Oncology [1.741659712094955]
In-context Learning (ICL) は、ドメイン固有の診断タスクに対するモデル再トレーニングの実用的な代替手段である。
視覚言語モデル(VLM)-Paligemma, CLIP, ALIGN, GPT-4o の評価を行った。
ICLは、サイズが小さいにもかかわらず競争力の向上を示し、計算に制約のある臨床環境への展開の可能性を示した。
論文 参考訳(メタデータ) (2025-05-08T20:49:01Z) - A Unified Benchmark of Federated Learning with Kolmogorov-Arnold Networks for Medical Imaging [3.536605202672355]
Kolmogorov-Arnold Networks (KAN) はFederated Learning (FL) を効果的に置き換えることができる
Kanは、分散医療におけるプライバシー保護医療画像アプリケーションのための、有望な代替手段だ。
論文 参考訳(メタデータ) (2025-04-28T09:53:05Z) - Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文 参考訳(メタデータ) (2025-03-28T07:23:07Z) - ClusMFL: A Cluster-Enhanced Framework for Modality-Incomplete Multimodal Federated Learning in Brain Imaging Analysis [28.767460351377462]
脳画像解析の文脈では、モダリティの不完全性は重要な課題である。
本稿では,機能クラスタリングを利用した新しいMFLフレームワークであるClusMFLを提案する。
ClusMFLは、様々なモダリティの不完全性のレベルにまたがる様々なベースライン手法と比較して、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-02-14T09:33:59Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - FedMM: Federated Multi-Modal Learning with Modality Heterogeneity in
Computational Pathology [3.802258033231335]
Federated Multi-Modal (FedMM) は、複数の単一モード特徴抽出器を訓練し、その後の分類性能を向上させる学習フレームワークである。
FedMMは、精度とAUCメトリクスの2つのベースラインを特に上回っている。
論文 参考訳(メタデータ) (2024-02-24T16:58:42Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。