論文の概要: Orchestrator Multi-Agent Clinical Decision Support System for Secondary Headache Diagnosis in Primary Care
- arxiv url: http://arxiv.org/abs/2512.04207v2
- Date: Tue, 09 Dec 2025 03:45:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 14:12:22.82763
- Title: Orchestrator Multi-Agent Clinical Decision Support System for Secondary Headache Diagnosis in Primary Care
- Title(参考訳): プライマリケアにおける二次頭部診断のためのオーケストレータマルチエージェント臨床診断支援システム
- Authors: Xizhi Wu, Nelly Estefanie Garduno-Rapp, Justin F Rousseau, Mounika Thakkallapally, Hang Zhang, Yuelyu Ji, Shyam Visweswaran, Yifan Peng, Yanshan Wang,
- Abstract要約: 本稿では,オーケストレータ-スペシャリストアーキテクチャ上に構築された多言語モデル(LLM)に基づく多言語臨床意思決定支援システムを提案する。
このシステムは、診断を7つのドメイン特化エージェントに分解し、それぞれが構造化されエビデンスに基づく理論的根拠を生成する。
90例の2次頭痛患者を用いてマルチエージェントシステムの評価を行い,その成績を単一LLMベースラインと比較した。
- 参考スコア(独自算出の注目度): 13.520457515792534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike most primary headaches, secondary headaches need specialized care and can have devastating consequences if not treated promptly. Clinical guidelines highlight several 'red flag' features, such as thunderclap onset, meningismus, papilledema, focal neurologic deficits, signs of temporal arteritis, systemic illness, and the 'worst headache of their life' presentation. Despite these guidelines, determining which patients require urgent evaluation remains challenging in primary care settings. Clinicians often work with limited time, incomplete information, and diverse symptom presentations, which can lead to under-recognition and inappropriate care. We present a large language model (LLM)-based multi-agent clinical decision support system built on an orchestrator-specialist architecture, designed to perform explicit and interpretable secondary headache diagnosis from free-text clinical vignettes. The multi-agent system decomposes diagnosis into seven domain-specialized agents, each producing a structured and evidence-grounded rationale, while a central orchestrator performs task decomposition and coordinates agent routing. We evaluated the multi-agent system using 90 expert-validated secondary headache cases and compared its performance with a single-LLM baseline across two prompting strategies: question-based prompting (QPrompt) and clinical practice guideline-based prompting (GPrompt). We tested five open-source LLMs (Qwen-30B, GPT-OSS-20B, Qwen-14B, Qwen-8B, and Llama-3.1-8B), and found that the orchestrated multi-agent system with GPrompt consistently achieved the highest F1 scores, with larger gains in smaller models. These findings demonstrate that structured multi-agent reasoning improves accuracy beyond prompt engineering alone and offers a transparent, clinically aligned approach for explainable decision support in secondary headache diagnosis.
- Abstract(参考訳): ほとんどの一次頭痛とは異なり、二次頭痛は専門的な治療を必要とし、迅速に治療しなければ壊滅的な結果をもたらす可能性がある。
臨床ガイドラインでは、雷頭発症、髄膜炎、パピレデマ、局所神経障害、側頭動脈炎の兆候、全身疾患、そして「彼らの人生の最悪の頭痛」のプレゼンテーションなど、いくつかの「赤い旗」の特徴を強調している。
これらのガイドラインにもかかわらず、プライマリ・ケア・セッティングにおいて、どの患者に緊急評価を必要とするかを判断することは困難である。
臨床医はしばしば、限られた時間、不完全な情報、様々な症状のプレゼンテーションで働き、認識不足や不適切なケアにつながることがある。
本稿では,多言語モデル(LLM)に基づく多言語臨床意思決定支援システムについて述べる。
マルチエージェントシステムは、診断を7つのドメイン特化エージェントに分解し、それぞれが構造化され、エビデンスに基づく理論的根拠を生成し、中央オーケストレータがタスク分解を行い、エージェントルーティングを調整する。
以上より,90例の2次頭痛症例を用いてマルチエージェントシステムを評価し,Qprompt(Q-based prompting)とGPrompt(臨床実践ガイドラインベース・プロンプト)の2つのプロンプト戦略における単一LLMベースラインと比較した。
我々は,オープンソースLLM(Qwen-30B,GPT-OSS-20B,Qwen-14B,Qwen-8B,Llama-3.1-8B)を5種類試験し,GPromptを用いたオーケストレーションマルチエージェントシステムにおいて,より小さなモデルにおいて高いF1スコアを連続的に達成した。
以上の結果から, 構造化多剤推論は, 迅速な工学以外の精度向上を図り, 二次性頭痛診断における説明可能な意思決定支援のための透過的, 臨床的に整合したアプローチを提供することが明らかとなった。
関連論文リスト
- CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation [62.0150409256153]
我々は、CXR解釈のためのディレクター調整型多段階エージェントであるCXRAgentを提案する。
エージェントは、Evidence-driven Validatorによって正規化され検証された出力を持つ一連のCXR分析ツールを戦略的にオーケストレーションする。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
論文 参考訳(メタデータ) (2025-10-24T10:31:30Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - Automated Clinical Problem Detection from SOAP Notes using a Collaborative Multi-Agent LLM Architecture [8.072932739333309]
我々は,このギャップに対処するために,臨床相談チームをモデル化する共同マルチエージェントシステム(MAS)を導入する。
このシステムは、SOAPノートの主観的(S)および目的的(O)セクションのみを分析することによって、臨床上の問題を特定する。
マネージャエージェントは、階層的で反復的な議論に従事し、合意に達するために、動的に割り当てられた専門家エージェントのチームを編成する。
論文 参考訳(メタデータ) (2025-08-29T17:31:24Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - MedAgent-Pro: Towards Evidence-based Multi-modal Medical Diagnosis via Reasoning Agentic Workflow [14.478357882578234]
現代医学では、臨床診断は主にテキストおよび視覚データの包括的分析に依存している。
大規模視覚言語モデル(VLM)およびエージェントベース手法の最近の進歩は、医学的診断に大きな可能性を秘めている。
現代医学における診断原理に従う新しいエージェント推論パラダイムであるMedAgent-Proを提案する。
論文 参考訳(メタデータ) (2025-03-21T14:04:18Z) - MAGDA: Multi-agent guideline-driven diagnostic assistance [43.15066219293877]
救急部門、地方病院、または未開発地域の診療所では、臨床医は訓練された放射線技師による高速な画像分析を欠いていることが多い。
本研究では,ゼロショットガイドライン駆動意思決定支援のための新しいアプローチを提案する。
我々は、患者診断に到達するために協調する、対照的な視覚言語モデルで強化された複数のLLMエージェントのシステムをモデル化する。
論文 参考訳(メタデータ) (2024-09-10T09:10:30Z) - Beyond Direct Diagnosis: LLM-based Multi-Specialist Agent Consultation
for Automatic Diagnosis [30.943705201552643]
本研究では,潜在的な疾患に対するエージェントの確率分布を適応的に融合させることにより,現実世界の診断過程をモデル化する枠組みを提案する。
提案手法では,パラメータ更新とトレーニング時間を大幅に短縮し,効率と実用性を向上する。
論文 参考訳(メタデータ) (2024-01-29T12:25:30Z) - A logic-based decision support system for the diagnosis of headache
disorders according to the ICHD-3 international classification [3.9929696757949444]
HEAD-ASPは頭痛疾患の診断のための新しい意思決定支援システムである。
ICHD-3に準拠した動的アンケートを実装している。
論文 参考訳(メタデータ) (2020-08-06T16:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。