Fugu-MT 論文翻訳(概要): REMEDI: A Benchmark for Retention and Unlearning Evaluation in Multi-label Clinical Disease Inference

論文の概要: REMEDI: A Benchmark for Retention and Unlearning Evaluation in Multi-label Clinical Disease Inference

arxiv url: http://arxiv.org/abs/2606.07141v1
Date: Fri, 05 Jun 2026 10:51:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-08 14:33:29.699653
Title: REMEDI: A Benchmark for Retention and Unlearning Evaluation in Multi-label Clinical Disease Inference
Title（参考訳）: REMEDI : 多ラベル臨床疾患推論における保持・未学習評価のベンチマーク
Authors: Anurag Sharma, Sai Teja Chunchu, Prasenjit Mitra, Sandipan Sikdar, Koustav Rudra,
Abstract要約: マルチラベルおよびマルチクラス臨床疾患推論に適した機械学習のための広範囲なベンチマークであるREMEDIを紹介する。 ReMEDIは、(1)関連するアプリケーションドメイン(医療)、(2)多様な忘れ物インスタンスを含む総合的な未学習セットアップ、(3)マルチラベルとマルチクラス分類タスクを含む難解な未学習シナリオ、(4)実用性と未学習の程度の両方のパフォーマンスに関する評価指標を考察する。
参考スコア（独自算出の注目度）: 15.89997509050996
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Language models trained for clinical disease inference are trained on patient data, which may include sensitive and private information, and data owners may request the removal of their data from a trained model due to privacy or copyright concerns. However, exactly unlearning patient-specific data is intractable, and retraining with minor data removal is resource-intensive. While there exists several machine unlearning methods that can be used, their utility is generally restricted to non-medical domains. Moreover, the existing benchmarks for evaluating such unlearning methods primarily utilize synthetically curated datasets, which are not truly representative of real-world systems. Hence, the effectiveness of these unlearning methods in the medical domain is largely unclear. To this end, we introduce REMEDI, an extensive benchmark for machine unlearning tailored to multi-label and multiclass clinical disease inference, where label correlations, longitudinal structure, and safety constraints make unlearning particularly challenging. Unlike the existing benchmarks, REMEDI considers: (1) a relevant application domain (medical), (2) comprehensive unlearning setups involving diverse sets of forget instances, (3) challenging unlearning scenarios including multi-label and multi-class classification tasks, and (4) evaluation metrics involving performance both in terms of utility and extent of unlearning achieved. REMEDI is developed using the MIMIC-III clinical database that contains comprehensive clinical data of patients. Experiments with existing unlearning methods indicate that there exists a trade-off between utility and unlearning performance. They are also largely unsuited to multi-label classification tasks. To facilitate reproducibility, we make our benchmark publicly available.
Abstract（参考訳）: 臨床疾患推論のために訓練された言語モデルは、機密情報や個人情報を含む患者データに基づいて訓練され、データ所有者はプライバシや著作権上の懸念からトレーニングされたモデルからデータを削除するよう要求することができる。しかし、正確には未学習の患者固有のデータは難読であり、マイナーデータ削除による再トレーニングはリソース集約である。使用可能な機械学習メソッドはいくつか存在するが、そのユーティリティは一般に医療以外の領域に限定されている。さらに,このような未学習の手法を評価するための既存のベンチマークでは,実世界のシステムを真に代表していない,合成キュレートされたデータセットを主に利用している。したがって、医学領域におけるこれらの未学習手法の有効性はほとんど不明である。この目的のために、ラベル相関、長手構造、安全性の制約が非学習を特に困難にするマルチラベルおよびマルチクラス臨床疾患推論に適した機械学習のための広範囲なベンチマークであるREMEDIを紹介する。既存のベンチマークとは異なり、REMEDIは、(1)関連するアプリケーションドメイン(医療)、(2)多様な忘れられたインスタンスの集合を含む包括的な未学習のセットアップ、(3)マルチラベルとマルチクラス分類タスクを含む未学習のシナリオへの挑戦、(4)実用性と未学習の程度の両方のパフォーマンスに関する評価指標について検討している。 REMEDIは、患者の総合的な臨床データを含むMIMIC-III臨床データベースを用いて開発された。既存のアンラーニング手法による実験は、ユーティリティとアンラーニングのパフォーマンスの間にトレードオフが存在することを示している。それらはまた、多ラベル分類タスクにはあまり適していない。再現性を高めるため,我々のベンチマークを一般公開する。

関連論文リスト

AMNESIA: A Large Scale Medical Unlearning Benchmark Suite with Disease-Informed Analysis [10.933595109116768]
医用アンラーニングのための,最初の大規模オープンソースベンチマークであるAMNESIAを紹介する。ランダムな患者と疾患レベルの両方で広く使われている4つの未学習手法を評価する。未学習の患者は、同じ症状の他人の知識を侵食し、患者と共有臨床知識をよりよく分離できる方法を求める。
論文参考訳（メタデータ） (2026-05-28T21:46:46Z)
MedForget: Hierarchy-Aware Multimodal Unlearning Testbed for Medical AI [66.0701326117134]
MedForgetは、階層型を意識したマルチモーダルなアンラーニングテストベッドで、準拠する医療AIシステムを構築する。既存の手法は,診断性能を低下させることなく,完全かつ階層性に配慮した忘れの解決に苦慮していることを示す。階層レベルのコンテキストをプロンプトに徐々に追加する再構成攻撃を導入する。
論文参考訳（メタデータ） (2025-12-10T17:55:06Z)
Handling missing values in clinical machine learning: Insights from an expert study [10.637366819633302]
Inherently Interpretable Machine Learning (IML)モデルは、臨床的意思決定に有用なサポートを提供する。計算不能や不完全なレコードの破棄といった従来のアプローチは、テスト時にデータが欠落しているシナリオでは現実的ではないことが多い。フランスの29の外傷センターから55名の臨床医を調査し、3つのIMLモデルとの相互作用について検討した。
論文参考訳（メタデータ） (2024-11-14T17:02:41Z)
An Efficient Contrastive Unimodal Pretraining Method for EHR Time Series Data [35.943089444017666]
本稿では,長期臨床経過データに適した比較事前学習法を提案する。本モデルでは, 臨床医が患者の症状についてより深い知見を得られるように, 欠損測定をインプットする能力を示す。
論文参考訳（メタデータ） (2024-10-11T19:05:25Z)
Active Foundational Models for Fault Diagnosis of Electrical Motors [0.5999777817331317]
電気モーターの故障検出と診断は、産業システムの安全かつ信頼性の高い運転を保証する上で最も重要である。マシン故障診断のための既存のデータ駆動ディープラーニングアプローチは、大量のラベル付きサンプルに大きく依存している。ラベル付きサンプルを少ない量で活用する基礎モデルに基づくアクティブラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2023-11-27T03:25:12Z)
Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites: A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文参考訳（メタデータ） (2023-08-31T00:36:10Z)
LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文参考訳（メタデータ） (2022-04-12T12:25:05Z)
Federated Cycling (FedCy): Semi-supervised Federated Learning of Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文参考訳（メタデータ） (2022-03-14T17:44:53Z)
Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。 MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文参考訳（メタデータ） (2021-04-12T18:11:17Z)
Uncovering the structure of clinical EEG signals with self-supervised learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。この現象は脳波(EEG)などの臨床関連データに特に問題となる。ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文参考訳（メタデータ） (2020-07-31T14:34:47Z)
Real-World Multi-Domain Data Applications for Generalizations to Clinical Settings [1.508558791031741]
ディープラーニングモデルは、臨床試験のような人工的な設定から標準化されたデータセットでトレーニングされた場合、うまく機能する。マルチドメイン実世界のデータセットに転送学習を用いた自己教師型アプローチを用いることで、標準化されたデータセットに対して16%の相対的改善が達成できることを示す。
論文参考訳（メタデータ） (2020-07-24T17:41:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。