論文の概要: Learning Diagnostic Reasoning for Decision Support in Toxicology
- arxiv url: http://arxiv.org/abs/2603.29608v1
- Date: Tue, 31 Mar 2026 11:26:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.574859
- Title: Learning Diagnostic Reasoning for Decision Support in Toxicology
- Title(参考訳): 毒性学における決定支援のための診断推論の学習
- Authors: Nico Oberländer, David Bani-Harouni, Tobias Zellner, Nassir Navab, Florian Eyer, Matthias Keicher,
- Abstract要約: 緊急毒性学への最初の強化学習(Reinforcement Learning, RL)であるDeToxRを提案する。
14種類の物質クラスにまたがる多ラベル予測のためのロバストなデータ融合エンジンを設計する。
臨床成績報酬を直接利用してモデルの推論を最適化する。
- 参考スコア(独自算出の注目度): 34.623049546258294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acute poly-substance intoxication requires rapid, life-saving decisions under substantial uncertainty, as clinicians must rely on incomplete ingestion details and nonspecific symptoms. Effective diagnostic reasoning in this chaotic environment requires fusing unstructured, non-medical narratives (e.g. paramedic scene descriptions and unreliable patient self-reports or known histories), with structured medical data like vital signs. While Large Language Models (LLMs) show potential for processing such heterogeneous inputs, they struggle in this setting, often underperforming simple baselines that rely solely on patient histories. To address this, we present DeToxR (Decision-support for Toxicology with Reasoning), the first adaptation of Reinforcement Learning (RL) to emergency toxicology. We design a robust data-fusion engine for multi-label prediction across 14 substance classes based on an LLM finetuned with Group Relative Policy Optimization (GRPO). We optimize the model's reasoning directly using a clinical performance reward. By formulating a multi-label agreement metric as the reward signal, the model is explicitly penalized for missing co-ingested substances and hallucinating absent poisons. Our model significantly outperforms its unadapted base LLM counterpart and supervised baselines. Furthermore, in a clinical validation study, the model indicates a clinical advantage by outperforming an expert toxicologist in identifying the correct poisons (Micro-F1: 0.644 vs. 0.473). These results demonstrate the potential of RL-aligned LLMs to synthesize unstructured pre-clinical narratives and structured medical data for decision support in high-stakes environments.
- Abstract(参考訳): 急性多物質性中毒は、臨床医が不完全な摂取の詳細と非特異的な症状に頼らなければならないため、かなりの不確実性の下で、迅速な、救命の判断を必要とする。
このカオス環境での効果的な診断的推論には、非構造的、非医療的物語(例えば、救急現場の記述や信頼性の低い患者自己報告、既知の歴史など)を、バイタルサインのような構造化された医療データと融合させる必要がある。
LLM(Large Language Models)は、そのような異種入力を処理する可能性を示しているが、この設定に苦慮し、多くの場合、患者の履歴にのみ依存する単純なベースラインを過小評価する。
これを解決するために, 緊急毒性学への第1次強化学習(RL)であるDeToxR(毒素による毒性学決定支援)を提示する。
我々は,グループ相対ポリシー最適化 (GRPO) で微調整されたLLMに基づいて,14種類の物質クラスにまたがるマルチラベル予測のためのロバストなデータ融合エンジンを設計する。
臨床成績報酬を直接利用してモデルの推論を最適化する。
報酬信号として多ラベル合意基準を定式化することにより、モデルは、欠落した共役物質に対して明示的に罰せられ、不在毒を幻覚させる。
我々のモデルは、適応されていないLLMのベースラインと教師付きベースラインを大きく上回っている。
さらに、臨床検証研究において、このモデルは、正しい毒物(マイクロF1: 0.644 vs. 0.473)を識別する専門家毒物学者よりも優れた臨床効果を示す。
これらの結果から,RL 対応 LLM が非構造的前臨床物語や構造化医療データを合成し,意思決定支援に役立てる可能性が示唆された。
関連論文リスト
- Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection [20.599682298329213]
我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
論文 参考訳(メタデータ) (2026-02-08T14:10:05Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - From Generative Modeling to Clinical Classification: A GPT-Based Architecture for EHR Notes [0.0]
本研究は臨床テキスト分類のためのGPTアーキテクチャを提案する。
すべてのモデルパラメータを更新する代わりに、GPT-2のバックボーンの大部分は凍結されている。
提案手法はMIMIC-IV-Noteデータセットからの放射線学報告に基づいて評価する。
論文 参考訳(メタデータ) (2026-01-29T16:33:47Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - LLM-Augmented Symptom Analysis for Cardiovascular Disease Risk Prediction: A Clinical NLP [2.2615384250361004]
本研究は, 症状抽出, 文脈推論, 自由テキストレポートからの相関に, ドメイン適応型大言語モデルを用いた, 新規なLLM拡張臨床NLPパイプラインを提案する。
MIMIC-IIIおよびCARDIO-NLPデータセットの評価は、精度、リコール、F1スコア、AUROCにおいて高い臨床関連性を示した。
論文 参考訳(メタデータ) (2025-07-15T07:32:16Z) - Refine Medical Diagnosis Using Generation Augmented Retrieval and Clinical Practice Guidelines [16.56254046507092]
GARMLE-Gは、医療用言語モデルの出力を権威的ガイドラインに根拠づけた、世代別検索フレームワークである。
従来のRetrieval-Augmented Generationベースのアプローチとは異なり、GARMLE-Gは権威的なガイドラインコンテンツを直接検索することで幻覚のない出力を可能にする。
高血圧診断のためのプロトタイプシステムを開発し, 検索精度, 意味的関連性, 臨床ガイドラインの適合性を実証した。
論文 参考訳(メタデータ) (2025-06-22T11:31:13Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。