論文の概要: CARE: Privacy-Compliant Agentic Reasoning with Evidence Discordance
- arxiv url: http://arxiv.org/abs/2604.01113v1
- Date: Wed, 01 Apr 2026 16:37:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.091777
- Title: CARE: Privacy-Compliant Agentic Reasoning with Evidence Discordance
- Title(参考訳): CARE: プライバシーに配慮したエージェント推論とエビデンス不一致
- Authors: Haochen Liu, Weien Li, Rui Song, Zeyu Li, Chun Jason Xue, Xiao-Yang Liu, Sam Nallaperuma, Xue Liu, Ye Yuan,
- Abstract要約: 集中治療室 (ICU) 設定において, 短期臓器機能低下の予測を悪化させるデータセットMIMIC-DOSを導入する。
徴候と症状が一致しない症例のみから構築する。
この設定は、既存のLLMベースのアプローチに重大な課題をもたらす。
本稿では,多段階のプライバシに準拠したエージェント推論フレームワークであるCAREを提案する。
- 参考スコア(独自算出の注目度): 32.43119949391787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) systems are increasingly used to support high-stakes decision-making, but they typically perform worse when the available evidence is internally inconsistent. Such a scenario exists in real-world healthcare settings, with patient-reported symptoms contradicting medical signs. To study this problem, we introduce MIMIC-DOS, a dataset for short-horizon organ dysfunction worsening prediction in the intensive care unit (ICU) setting. We derive this dataset from the widely recognized MIMIC-IV, a publicly available electronic health record dataset, and construct it exclusively from cases in which discordance between signs and symptoms exists. This setting poses a substantial challenge for existing LLM-based approaches, with single-pass LLMs and agentic pipelines often struggling to reconcile such conflicting signals. To address this problem, we propose CARE: a multi-stage privacy-compliant agentic reasoning framework in which a remote LLM provides guidance by generating structured categories and transitions without accessing sensitive patient data, while a local LLM uses these categories and transitions to support evidence acquisition and final decision-making. Empirically, CARE achieves stronger performance across all key metrics compared to multiple baseline settings, showing that CARE can more robustly handle conflicting clinical evidence while preserving privacy.
- Abstract(参考訳): 大規模言語モデル (LLM) システムは、高い意思決定をサポートするためにますます使われているが、利用可能な証拠が内部的に矛盾している場合、一般的にはより悪化する。
このようなシナリオは現実世界の医療現場に存在し、患者が報告した症状は医学的な兆候と矛盾する。
そこで本研究では, 集中治療室(ICU)設定において, 短期臓器機能低下の予測を悪化させるデータセットMIMIC-DOSを紹介する。
このデータセットは、広く認知されている電子健康記録データセットMIMIC-IVから派生し、サインと症状が一致しないケースからのみ構築する。
この設定は、既存のLLMベースのアプローチにおいて大きな課題となり、シングルパスのLLMとエージェントパイプラインは、しばしばこのような競合する信号の調整に苦労する。
この問題を解決するために,多段階のプライバシに適合するエージェント推論フレームワークであるCAREを提案する。リモートLSMは,機密データにアクセスせずに構造化されたカテゴリとトランジッションを生成してガイダンスを提供する一方で,ローカルLSMはこれらのカテゴリとトランジッションを使用して証拠取得と最終決定を支援する。
経験的に、CAREは複数のベースライン設定と比較して、すべての主要な指標に対してより強力なパフォーマンスを実現しており、プライバシーを維持しながら矛盾する臨床証拠をより堅牢に処理できることを示している。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - SoK: Privacy-aware LLM in Healthcare: Threat Model, Privacy Techniques, Challenges and Recommendations [0.6533091401094101]
大きな言語モデル(LLM)は、臨床的な意思決定を支援し、患者のケアを強化するために、医療においてますます採用されている。
この研究は、データ前処理、ファインチューニング、推論という3つの中核LSMフェーズにわたる進化する脅威の展望を、現実的な医療環境の中で検証する。
我々は、各フェーズにおける敵、能力、攻撃面を特徴付ける詳細な脅威モデルを提示し、既存のプライバシ保護技術(PPT)がこれらの脆弱性を緩和しようとしているかを体系化する。
論文 参考訳(メタデータ) (2026-01-15T02:28:57Z) - From EMR Data to Clinical Insight: An LLM-Driven Framework for Automated Pre-Consultation Questionnaire Generation [9.269061009613033]
複雑な電子カルテ(EMR)から事前コンサルテーションアンケートを作成するための新しい枠組みを提案する。
この枠組みは、明確な臨床知識を構築することによって直接的手法の限界を克服する。
実世界のEMRデータセットを用いて評価し,臨床専門家が検証し,情報カバレッジ,診断関連性,理解可能性,生成時間に優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-01T12:24:49Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Retrieving Evidence from EHRs with LLMs: Possibilities and Challenges [18.56314471146199]
時間的制約を伴って患者に関連付けられた大量のメモは、実質的に不可能な証拠を手作業で特定する。
患者EHRにおける非構造的証拠を効率よく回収・要約するためのメカニズムとして, LLMを用いたゼロショット戦略を提案し, 評価した。
論文 参考訳(メタデータ) (2023-09-08T18:44:47Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - SPeC: A Soft Prompt-Based Calibration on Performance Variability of
Large Language Model in Clinical Notes Summarization [50.01382938451978]
本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文 参考訳(メタデータ) (2023-03-23T04:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。