Fugu-MT 論文翻訳(概要): L2D-Clinical: Learning to Defer for Adaptive Model Selection in Clinical Text Classification

論文の概要: L2D-Clinical: Learning to Defer for Adaptive Model Selection in Clinical Text Classification

arxiv url: http://arxiv.org/abs/2604.13285v1
Date: Tue, 14 Apr 2026 20:23:45 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-16 20:38:32.28914
Title: L2D-Clinical: Learning to Defer for Adaptive Model Selection in Clinical Text Classification
Title（参考訳）: L2D-Clinical: 臨床テキスト分類における適応型モデル選択のためのディフェンダーの学習
Authors: Rishik Kondadadi, John E. Ortega,
Abstract要約: 本稿では, BERT 分類器が LLM に優先すべき時期を学習するフレームワークであるL2D-Clinical について紹介する。従来のL2Dの手法では、人間の専門家にとってより優れていると思われていたのに対し、我々の手法は適応的な遅延改善の精度を実現している。
参考スコア（独自算出の注目度）: 2.8947246722205695
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Clinical text classification requires choosing between specialized fine-tuned models (BERT variants) and general-purpose large language models (LLMs), yet neither dominates across all instances. We introduce Learning to Defer for clinical text (L2D-Clinical), a framework that learns when a BERT classifier should defer to an LLM based on uncertainty signals and text characteristics. Unlike prior L2D work that defers to human experts assumed universally superior, our approach enables adaptive deferral-improving accuracy when the LLM complements BERT. We evaluate on two English clinical tasks: (1) ADE detection (ADE Corpus V2), where BioBERT (F1=0.911) outperforms the LLM (F1=0.765), and (2) treatment outcome classification (MIMIC-IV with multi-LLM consensus ground truth), where GPT-5-nano (F1=0.967) outperforms ClinicalBERT (F1=0.887). On ADE, L2D-Clinical achieves F1=0.928 (+1.7 points over BERT) by selectively deferring 7% of instances where the LLM's high recall compensates for BERT's misses. On MIMIC, L2D-Clinical achieves F1=0.980 (+9.3 points over BERT) by deferring only 16.8\% of cases to the LLM. The key insight is that L2D-Clinical learns to selectively leverage LLM strengths while minimizing API costs.
Abstract（参考訳）: 臨床テキスト分類では、特定微調整モデル(BERT変種)と汎用大規模言語モデル(LLM)のどちらを選択する必要があるが、いずれのインスタンスも支配的ではない。本稿では,臨床テキストのためのLearning to Defer(L2D-Clinical)を紹介し,不確実性信号とテキスト特性に基づいてBERT分類器がLLMに遅延すべき時期を学習するフレームワークについて紹介する。 LLMがBERTを補完する際の適応的な遅延改善の精度を実現する。我々は,(1)ADE検出(ADE Corpus V2),BioBERT(F1=0.911)がLLM(F1=0.765)より優れ,(2)治療結果分類(MIMIC-IVとマルチLLMコンセンサス基底真理)がGPT-5-nano(F1=0.967)がCeriorBERT(F1=0.887)より優れていたことを評価する。 ADEでは、L2D-ClinicalがF1=0.928(+1.7点)を達成し、LLMの高リコールがBERTのミスを補うインスタンスの7%を選択的に遅延させる。 MIMICでは、L2D-Clinical は F1=0.980 (+9.3 点) を達成する。重要な洞察は、L2D-ClinicalがAPIコストを最小化しながらLLMの強度を選択的に活用することを学ぶことである。

関連論文リスト

Evaluating Large Language Models for Gait Classification Using Text-Encoded Kinematic Waveforms [1.1635287453977645]
LLM(Large Language Models)は、構造化キネマティックデータに適用した場合、説明機能と信頼性に配慮した出力を提供する。本研究は,テキスト数値列で表される連続歩行運動学を汎用LLMで分類できるかどうかを検証した。
論文参考訳（メタデータ） (2026-03-04T10:23:35Z)
PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation [51.96735866702332]
PreBAはPCA重み付き検索とベイズ平均アグリゲーションを統合した検索拡張フレームワークである。例えば、PreBAはパフォーマンスを大幅に改善し、MAEを最大40%削減し、ゼロショット推論でR2を-0.13から0.62に引き上げる。
論文参考訳（メタデータ） (2026-02-27T07:19:23Z)
A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文参考訳（メタデータ） (2025-05-23T14:06:42Z)
LLM2: Let Large Language Models Harness System 2 Reasoning [65.89293674479907]
大規模言語モデル(LLM)は、無数のタスクにまたがって印象的な機能を示してきたが、時には望ましくない出力が得られる。本稿では LLM とプロセスベースの検証器を組み合わせた新しいフレームワーク LLM2 を紹介する。 LLMs2は妥当な候補を生成するのに責任を持ち、検証者は望ましい出力と望ましくない出力を区別するためにタイムリーなプロセスベースのフィードバックを提供する。
論文参考訳（メタデータ） (2024-12-29T06:32:36Z)
LEME: Open Large Language Models for Ophthalmology with Advanced Reasoning and Clinical Validation [29.913581347375256]
大規模言語モデル(LLM)は、ドキュメントの作業量を削減し、臨床的な意思決定をサポートする、有望なパスを提供する。本稿では,2段階プロセスで開発したオープンウェイトLLMのスイートであるLEMEについて述べる。 LEMEは、患者QA、相談、治療計画などのタスクにまたがる5つのゼロショットベンチマークで評価された。
論文参考訳（メタデータ） (2024-10-01T02:43:54Z)
Exploring the Value of Pre-trained Language Models for Clinical Named Entity Recognition [6.917786124918387]
我々は、スクラッチからトレーニングされたTransformerモデルと、細調整されたBERTベースのLLMを比較した。文脈学習を促進するために,追加のCRF層がそのようなモデルに与える影響を検討する。
論文参考訳（メタデータ） (2022-10-23T16:27:31Z)
Performance of Dual-Augmented Lagrangian Method and Common Spatial Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文参考訳（メタデータ） (2020-10-13T20:50:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。