論文の概要: COTCAgent: Preventive Consultation via Probabilistic Chain-of-Thought Completion
- arxiv url: http://arxiv.org/abs/2605.15016v1
- Date: Thu, 14 May 2026 16:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.938588
- Title: COTCAgent: Preventive Consultation via Probabilistic Chain-of-Thought Completion
- Title(参考訳): COTCAgent:確率的連鎖完了による予防コンサルティング
- Authors: Zihan Deng, Xiaozhen Zhong, Chuanzhi Xu,
- Abstract要約: The Probabilistic Chain-of-Thought Completion Agent (COTCAgent)は、縦断的な電子健康記録のための階層的推論フレームワークである。
COTCAgentは、自作データセットで90.47%、HealthBenchで70.41%の精度を達成し、既存の医療エージェントや主流の大規模言語モデルを上回っている。
- 参考スコア(独自算出の注目度): 1.3891530345631953
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As large language models empower healthcare, intelligent clinical decision support has developed rapidly. Longitudinal electronic health records (EHR) provide essential temporal evidence for accurate clinical diagnosis and analysis. However, current large language models have critical flaws in longitudinal EHR reasoning. First, lacking fine-grained statistical reasoning, they often hallucinate clinical trends and metrics when quantitative evidence is textually implied, biasing diagnostic inference. Second, non-uniform time series and scarce labels in longitudinal EHR hinder models from capturing long-range temporal dependencies, limiting reliable clinical reasoning. To address the above limitations, this work presents the Probabilistic Chain-of-Thought Completion Agent (COTCAgent), a hierarchical reasoning framework for longitudinal electronic health records. It consists of three core modules. The Temporal-Statistics Adapter (TSA) converts analytical plans into executable code for standardized trend output. The Chain-of-Thought Completion (COTC) layer leverages a symptom-trend-disease knowledge base with weighted scoring to evaluate disease risk, while the bounded completion module acquires structured evidence through standardized inquiries and iterative scoring constraints to ensure rigorous reasoning. By decoupling statistical computation, feature matching, and language generation, the framework eliminates reliance on complex multi-modal inputs and enables efficient longitudinal record analysis with lower computational overhead. Experimental results show that COTCAgent powered by Baichuan-M2 achieves 90.47% Top-1 accuracy on the self-built dataset and 70.41% on HealthBench, outperforming existing medical agents and mainstream large language models. The code is available at https://github.com/FrankDengAI/COTCAgent/.
- Abstract(参考訳): 大きな言語モデルが医療に力を与えるにつれ、インテリジェントな臨床的決定支援が急速に発展してきた。
経時的電子健康記録(EHR)は、正確な臨床診断と分析に不可欠な時間的証拠を提供する。
しかし、現在の大規模言語モデルは、縦方向のEHR推論に重大な欠陥がある。
まず、詳細な統計的推論が欠如しているため、定量的証拠がテキスト的に示唆され、診断推論に偏っている場合、臨床トレンドやメトリクスを幻覚させることが多い。
第2に、縦型EHRモデルにおける一様でない時系列と希少なラベルは、長期の時間的依存を捉え、信頼性の高い臨床推論を制限することを妨げている。
上記の制限に対処するため、この研究は、長手電子健康記録の階層的推論フレームワークである確率的連鎖補完エージェント(COTCAgent)を提示する。
3つのコアモジュールで構成されている。
TSA(Temporal-Statistics Adapter)は、分析計画を標準化されたトレンド出力のための実行可能なコードに変換する。
Chain-of-Thought Completion (COTC) 層は症状・症状・症状の知識ベースを利用して病気のリスクを評価する一方、境界完備モジュールは標準化された問い合わせと反復的なスコアリング制約によって構造化された証拠を取得し、厳密な推論を保証する。
統計計算,特徴マッチング,言語生成を分離することにより,複雑なマルチモーダル入力への依存を排除し,計算オーバーヘッドを低減した効率的な縦記録解析を可能にする。
実験の結果、Baichuan-M2を動力とするCOTCAgentは、自作データセットで90.47%、HealthBenchで70.41%の精度で、既存の医療エージェントと主流の大規模言語モデルを上回っていることがわかった。
コードはhttps://github.com/FrankDengAI/COTCAgent/で入手できる。
関連論文リスト
- ProtoMedAgent: Multimodal Clinical Interpretability via Privacy-Aware Agentic Workflows [7.27267618572654]
ProtoMedAgentは、反復的なゼロ段階のテスト時間最適化問題としてマルチモーダルな臨床報告を定式化する。
オンライン生成は、厳密な集合論微分と反射的スクリーブ・クリティカルループによって制限される。
ProtoMedAgentは91.2%の比較集合Fithfulnessを実現し、標準RAG(46.2%)を根本的に上回る
論文 参考訳(メタデータ) (2026-05-13T20:57:37Z) - Eliciting Medical Reasoning with Knowledge-enhanced Data Synthesis: A Semi-Supervised Reinforcement Learning Approach [62.0906177191353]
既存のアプローチでは、教師付き微調整を経て、大規模プロプライエタリモデルからの連鎖推論トレースを蒸留し、強化学習(RL)を実施している。
MedSSRは,医療知識を付加したデータ合成と半教師付き強化学習フレームワークである。
本フレームワークはまず, 分布制御可能な推論質問を合成するために, 稀な疾患知識を利用する。
次に、ポリシーモデル自体を利用して高品質な擬似ラベルを生成する。これにより、擬似ラベルデータ上での自己教師型RLと、人間の注釈付き実データ上での教師型RLの2段階固有の訓練パラダイムが実現される。
論文 参考訳(メタデータ) (2026-04-13T14:37:38Z) - MedCausalX: Adaptive Causal Reasoning with Self-Reflection for Trustworthy Medical Vision-Language Models [10.466505116993451]
既存の医療連鎖モデルには因果推論を表現・強制するための明確なメカニズムが欠如している。
MedCausalXは医療用VLMの因果推論チェーンを明示的にモデル化したエンドツーエンドフレームワークである。
我々は,MedCausalXが常に最先端の手法より優れ,診断の整合性は+5.4ポイント向上し,幻覚は10ポイント以上減少し,最上位の空間接地IoUに達することを示す。
論文 参考訳(メタデータ) (2026-03-24T11:28:15Z) - MedAD-R1: Eliciting Consistent Reasoning in Interpretible Medical Anomaly Detection via Consistency-Reinforced Policy Optimization [46.65200216642429]
我々はMedADの最初の大規模マルチモーダル・マルチセンタベンチマークであるMedAD-38Kを紹介し、構造化された視覚質問応答(VQA)ペアとともに、CoT(Chain-of-Thought)アノテーションを特徴付ける。
提案するモデルであるMedAD-R1は、MedAD-38Kベンチマーク上での最先端(SOTA)性能を実現し、強いベースラインを10%以上上回った。
論文 参考訳(メタデータ) (2026-02-01T07:56:10Z) - THCM-CAL: Temporal-Hierarchical Causal Modelling with Conformal Calibration for Clinical Risk Prediction [21.094584899764133]
コンフォーマル因果モデルを用いた時間階層因果モデルTHCM-CALを提案する。
本フレームワークは,ノードが2つのモードから臨床エンティティを表現するマルチモーダル因果グラフを構築する。
階層的な因果発見を通じて、THCM-CALは、スライス内同一モダリティシークエンシング、スライス内相互モダリティトリガー、スライス間リスク伝播の3つの臨床基盤的相互作用を推測する。
論文 参考訳(メタデータ) (2025-06-21T22:43:42Z) - Foresight -- Deep Generative Modelling of Patient Timelines using
Electronic Health Records [46.024501445093755]
医学史の時間的モデリングは、将来の出来事を予測し、シミュレートしたり、リスクを見積り、代替診断を提案したり、合併症を予測するために使用することができる。
我々は、文書テキストを構造化されたコード化された概念に変換するためにNER+Lツール(MedCAT)を使用する新しいGPT3ベースのパイプラインであるForesightを提示する。
論文 参考訳(メタデータ) (2022-12-13T19:06:00Z) - Sequential Diagnosis Prediction with Transformer and Ontological
Representation [35.88195694025553]
本稿では,患者が訪問する時間スタンプと滞在時間との間に不規則な間隔を対応させるSETORと呼ばれる,エンドツーエンドの頑健なトランスフォーマーモデルを提案する。
2つの実世界の医療データセットで実施された実験により、シーケンシャルな診断予測モデルSETORは、従来の最先端のアプローチよりも優れた予測結果が得られることが示された。
論文 参考訳(メタデータ) (2021-09-07T13:09:55Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。