論文の概要: Emulating Clinician Cognition via Self-Evolving Deep Clinical Research
- arxiv url: http://arxiv.org/abs/2603.10677v1
- Date: Wed, 11 Mar 2026 11:41:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.920262
- Title: Emulating Clinician Cognition via Self-Evolving Deep Clinical Research
- Title(参考訳): 自己進化型深部臨床研究による臨床認知のエミュレーション
- Authors: Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao,
- Abstract要約: このギャップを橋渡しする自己進化型診断剤DxEvolveを,インタラクティブな深層臨床研究ワークフローを通じて開発しました。
MIMIC-CDMベンチマークでは、DxEvolveは平均オーバーボーンモデルで診断精度を11.2%改善した。
DxEvolveは、経験を管理可能な学習資産に変えることによって、臨床AIの継続的な進化のための説明可能な経路をサポートする。
- 参考スコア(独自算出の注目度): 104.66211772795747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical diagnosis is a complex cognitive process, grounded in dynamic cue acquisition and continuous expertise accumulation. Yet most current artificial intelligence (AI) systems are misaligned with this reality, treating diagnosis as single-pass retrospective prediction while lacking auditable mechanisms for governed improvement. We developed DxEvolve, a self-evolving diagnostic agent that bridges these gaps through an interactive deep clinical research workflow. The framework autonomously requisitions examinations and continually externalizes clinical experience from increasing encounter exposure as diagnostic cognition primitives. On the MIMIC-CDM benchmark, DxEvolve improved diagnostic accuracy by 11.2% on average over backbone models and reached 90.4% on a reader-study subset, comparable to the clinician reference (88.8%). DxEvolve improved accuracy on an independent external cohort by 10.2% (categories covered by the source cohort) and 17.1% (uncovered categories) compared to the competitive method. By transforming experience into a governable learning asset, DxEvolve supports an accountable pathway for the continual evolution of clinical AI.
- Abstract(参考訳): 臨床診断は複雑な認知過程であり、ダイナミックキューの取得と継続的な専門知識の蓄積に基礎を置いている。
しかし、現在の人工知能(AI)システムの多くは、この現実に反し、単一パスの振り返り予測として診断を扱い、管理された改善のための監査可能なメカニズムを欠いている。
このギャップを橋渡しする自己進化型診断剤DxEvolveを,インタラクティブな深層臨床研究ワークフローを通じて開発しました。
このフレームワークは、検査を自律的に要求し、診断認知プリミティブとしての遭遇曝露の増加から臨床経験を継続的に外部化する。
MIMIC-CDMベンチマークでは、DxEvolveは平均的なバックボーンモデルで診断精度を11.2%改善し、臨床医の基準(88.8%)に匹敵する読み書きのサブセットで90.4%に達した。
DxEvolveは、競合手法と比較して、独立した外部コホートの精度を10.2%(ソースコホートでカバーされたカテゴリ)と17.1%(未発見カテゴリ)で改善した。
DxEvolveは、経験を管理可能な学習資産に変えることによって、臨床AIの継続的な進化のための説明可能な経路をサポートする。
関連論文リスト
- LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis [14.82377002030236]
精神疾患は世界中で広く普及している。
精神科医の不足と面接に基づく診断の固有の主観性は、タイムリーで一貫した精神的健康評価に重大な障壁をもたらす。
大規模マルチエージェントベンチマークであるLingxiDiagBenchを提案する。
論文 参考訳(メタデータ) (2026-02-10T03:46:05Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - Ensemble Deep Learning and LLM-Assisted Reporting for Automated Skin Lesion Diagnosis [2.9307254086347427]
皮膚科診断のためのAI統合を再定義する統合フレームワークを導入する。
第一に、アーキテクチャ的に多様である畳み込みニューラルネットワークの目的的にヘテロジニアスなアンサンブルは、相補的な診断の視点を提供する。
第2に、診断ワークフローに直接大きな言語モデル機能を組み込んで、分類出力を臨床的に意味のある評価に変換する。
論文 参考訳(メタデータ) (2025-10-05T08:07:33Z) - MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.0716204095227]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。
本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。
LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文 参考訳(メタデータ) (2025-09-24T12:37:11Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - Leveraging AI to Accelerate Medical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods [3.2666593942117688]
Octoziは、大規模な言語モデルとドメイン固有性を組み合わせて医療データレビューを変換する人工知能支援プラットフォームである。
代表的な第3相腫瘍学試験の経済分析により、潜在的コスト削減は510万ドルであることが判明した。
論文 参考訳(メタデータ) (2025-08-07T15:49:32Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。