論文の概要: Joint Optimization of Reasoning and Dual-Memory for Self-Learning Diagnostic Agent
- arxiv url: http://arxiv.org/abs/2604.07269v1
- Date: Wed, 08 Apr 2026 16:32:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.637468
- Title: Joint Optimization of Reasoning and Dual-Memory for Self-Learning Diagnostic Agent
- Title(参考訳): 自己学習診断剤における推論とデュアルメモリの併用最適化
- Authors: Bingxuan Li, Simo Du, Yue Guo,
- Abstract要約: 認知にインスパイアされたデュアルメモリモジュールを用いた自己学習診断エージェントSEAを提案する。
我々は、推論とメモリ管理の協調最適化のために、設計エージェントに適した強化トレーニングフレームワークを設計する。
MedCaseReasoningデータセットによる標準的な評価では、SEAは92.46%の精度で、最強のベースラインを+19.6%上回っている。
ER-Reasonデータセットによるロングホライゾンでは、SEAは最高の最終精度(0.7214)と最大の改善(+0.35 Acc@100)を達成する。
- 参考スコア(独自算出の注目度): 9.894952678613903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical expertise improves not only by acquiring medical knowledge, but by accumulating experience that yields reusable diagnostic patterns. Recent LLMs-based diagnostic agents have shown promising progress in clinical reasoning for decision support. However, most approaches treat cases independently, limiting experience reuse and continual adaptation. We propose SEA, a self-learning diagnostic agent with cognitively inspired dual-memory module. We design a reinforcement training framework tailored to our designed agent for joint optimization of reasoning and memory management. We evaluate SEA in two complementary settings. On standard evaluation with MedCaseReasoning dataset, SEA achieves 92.46% accuracy, outperforming the strongest baseline by +19.6%, demonstrating the benefit of jointly optimizing reasoning and memory. On the long-horizon with ER-Reason dataset, SEA attains the best final accuracy (0.7214) and the largest improvement (+0.35 Acc@100), while baseline methods show limited or unstable gains. Expert evaluation further indicates that rules consolidated from SEA show strong clinical correctness, usefulness and trust, suggesting that the induced rules in dual-memory module are reliable and practically meaningful. Overall, SEA improves both diagnostic reasoning ability and continual learning by effectively transforming experience into reusable knowledge.
- Abstract(参考訳): 臨床専門知識は、医学的知識を得るだけでなく、再利用可能な診断パターンをもたらす経験を蓄積することによって改善される。
近年,LSMsをベースとした診断薬は,意思決定支援のための臨床推論の進歩が期待できる。
しかし、ほとんどのアプローチはケースを個別に扱い、経験の再利用と継続的な適応を制限する。
認知にインスパイアされたデュアルメモリモジュールを用いた自己学習診断エージェントSEAを提案する。
我々は、推論とメモリ管理の協調最適化のために、設計エージェントに適した強化トレーニングフレームワークを設計する。
2つの相補的な設定でSEAを評価する。
MedCaseReasoningデータセットによる標準的な評価では、SEAは92.46%の精度を達成し、最強のベースラインを+19.6%上回った。
ER-Reasonデータセットによるロングホライゾンでは、SEAは最高の最終精度(0.7214)と最大の改善(+0.35 Acc@100)を達成し、ベースライン法は限定的または不安定な利得を示している。
専門家による評価は、SEAから統合されたルールは、強い臨床的正当性、有用性、信頼を示し、二重メモリモジュールにおける誘導ルールは信頼性があり、実用的な意味があることを示唆している。
全体として、SEAは、経験を再利用可能な知識に効果的に変換することで、診断的推論能力と継続的な学習の両方を改善する。
関連論文リスト
- Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification [60.18369393468405]
既存の検証器は通常、ドメイン知識の欠如と限られた校正のために性能が劣る。
GLEANは専門家によって計算されたプロトコルをトラジェクトリインフォームされ、よく校正された正当性信号にコンパイルする。
我々は,MIMIC-IVデータセットから得られた3つの疾患の薬物的臨床診断でGLEANを実証的に検証した。
論文 参考訳(メタデータ) (2026-03-03T09:36:43Z) - MedAD-R1: Eliciting Consistent Reasoning in Interpretible Medical Anomaly Detection via Consistency-Reinforced Policy Optimization [46.65200216642429]
我々はMedADの最初の大規模マルチモーダル・マルチセンタベンチマークであるMedAD-38Kを紹介し、構造化された視覚質問応答(VQA)ペアとともに、CoT(Chain-of-Thought)アノテーションを特徴付ける。
提案するモデルであるMedAD-R1は、MedAD-38Kベンチマーク上での最先端(SOTA)性能を実現し、強いベースラインを10%以上上回った。
論文 参考訳(メタデータ) (2026-02-01T07:56:10Z) - Towards Reliable Medical LLMs: Benchmarking and Enhancing Confidence Estimation of Large Language Models in Medical Consultation [97.36081721024728]
本稿では,現実的な医療相談におけるマルチターンインタラクションの信頼性を評価するための最初のベンチマークを提案する。
本ベンチマークでは,3種類の医療データを統合し,診断を行う。
本稿では,エビデンスを基盤とした言語自己評価フレームワークであるMedConfを紹介する。
論文 参考訳(メタデータ) (2026-01-22T04:51:39Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - Leveraging Evidence-Guided LLMs to Enhance Trustworthy Depression Diagnosis [8.935425124628452]
透明性,信頼性,信頼性を高める2段階の診断フレームワークを提案する。
Evidence-Guided Diagnostic Reasoning (EGDR) を導入する。
第2に、生成された診断の事実的精度と論理的整合性を評価するための診断信頼度スコアリング(DCS)モジュールを提案する。
論文 参考訳(メタデータ) (2025-11-22T07:08:23Z) - KRAL: Knowledge and Reasoning Augmented Learning for LLM-assisted Clinical Antimicrobial Therapy [11.98040596000658]
KRAL(Knowledge and Reasoning Augmented Learning)は、低コストでスケーラブルで、プライバシ保護のパラダイムである。
教師モデル推論を用いて知識を自動抽出し、回答から質問への逆生成を通じて軌跡を推論する。
従来のレトリーバル拡張ジェネレーション(RAG)とスーパーバイザードファインチューニング(SFT)の手法を大きく上回っている。
論文 参考訳(メタデータ) (2025-11-20T02:04:46Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - MDD-Thinker: Towards Large Reasoning Models for Major Depressive Disorder Diagnosis [3.2986206562794234]
大うつ病 (Major depressive disorder, MDD) は、世界的障害の主要な原因である。
現在の診断アプローチは、しばしば主観的評価に依存し、臨床情報を統合する能力が欠如している。
我々はMDD-Thinkerを開発した。MDD-Thinkerは、教師付き微調整(SFT)と強化学習(RL)を統合し、推論能力と解釈可能性を高める。
論文 参考訳(メタデータ) (2025-09-29T02:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。