論文の概要: CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation
- arxiv url: http://arxiv.org/abs/2510.21324v1
- Date: Fri, 24 Oct 2025 10:31:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.437907
- Title: CXRAgent: Director-Orchestrated Multi-Stage Reasoning for Chest X-Ray Interpretation
- Title(参考訳): CXRAgent:胸部X線解釈のためのディレクタ型マルチステージ推論
- Authors: Jinhui Lou, Yan Yang, Zhou Yu, Zhenqi Fu, Weidong Han, Qingming Huang, Jun Yu,
- Abstract要約: 我々は、CXR解釈のためのディレクター調整型多段階エージェントであるCXRAgentを提案する。
エージェントは、Evidence-driven Validatorによって正規化され検証された出力を持つ一連のCXR分析ツールを戦略的にオーケストレーションする。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
- 参考スコア(独自算出の注目度): 62.0150409256153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chest X-ray (CXR) plays a pivotal role in clinical diagnosis, and a variety of task-specific and foundation models have been developed for automatic CXR interpretation. However, these models often struggle to adapt to new diagnostic tasks and complex reasoning scenarios. Recently, LLM-based agent models have emerged as a promising paradigm for CXR analysis, enhancing model's capability through tool coordination, multi-step reasoning, and team collaboration, etc. However, existing agents often rely on a single diagnostic pipeline and lack mechanisms for assessing tools' reliability, limiting their adaptability and credibility. To this end, we propose CXRAgent, a director-orchestrated, multi-stage agent for CXR interpretation, where a central director coordinates the following stages: (1) Tool Invocation: The agent strategically orchestrates a set of CXR-analysis tools, with outputs normalized and verified by the Evidence-driven Validator (EDV), which grounds diagnostic outputs with visual evidence to support reliable downstream diagnosis; (2) Diagnostic Planning: Guided by task requirements and intermediate findings, the agent formulates a targeted diagnostic plan. It then assembles an expert team accordingly, defining member roles and coordinating their interactions to enable adaptive and collaborative reasoning; (3) Collaborative Decision-making: The agent integrates insights from the expert team with accumulated contextual memories, synthesizing them into an evidence-backed diagnostic conclusion. Experiments on various CXR interpretation tasks show that CXRAgent delivers strong performance, providing visual evidence and generalizes well to clinical tasks of different complexity. Code and data are valuable at this \href{https://github.com/laojiahuo2003/CXRAgent/}{link}.
- Abstract(参考訳): 胸部X線(CXR)は臨床診断において重要な役割を担い、CXRの自動解釈のために様々なタスク固有および基礎モデルが開発されている。
しかし、これらのモデルは、しばしば新しい診断タスクや複雑な推論シナリオに適応するのに苦労する。
近年、LCMベースのエージェントモデルは、CXR分析のための有望なパラダイムとして現れ、ツール調整、多段階推論、チームコラボレーションなどを通じてモデルの能力を高めている。
しかし、既存のエージェントはしばしば単一の診断パイプラインに依存しており、ツールの信頼性を評価するメカニズムが欠如しており、適応性と信頼性が制限されている。
ツール実行: エージェントは, 正常化および検証を行うEvidence-driven Validator (EDV) によって, 診断出力に信頼性のある下流診断を支援するための視覚的証拠を根拠として, CXR解析ツールのセットを戦略的にオーケストレーションする。
(3)協調的意思決定: エージェントは専門家チームからの洞察を蓄積した文脈記憶と統合し、それらをエビデンスに支えられた診断結論に合成する。
様々なCXR解釈タスクの実験は、CXRAgentが強いパフォーマンスを示し、視覚的証拠を提供し、異なる複雑さの臨床的タスクにうまく一般化していることを示している。
コードとデータは、この \href{https://github.com/laojiahuo2003/CXRAgent/}{link} で価値がある。
関連論文リスト
- RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - A Knowledge-driven Adaptive Collaboration of LLMs for Enhancing Medical Decision-making [49.048767633316764]
KAMACは知識駆動のAdaptive Multi-Agent Collaborationフレームワークである。
エージェントは進化する診断コンテキストに基づいて、専門家チームを動的に形成および拡張することができる。
2つの実世界の医療ベンチマーク実験により、KAMACはシングルエージェント法と高度なマルチエージェント法の両方を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-09-18T14:33:36Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Interpreting Chest X-rays Like a Radiologist: A Benchmark with Clinical Reasoning [18.15610003617933]
胸部X線(CXR)解釈のための新しい多段階視覚質問応答(VQA)データセットであるCXRTrekを提案する。
このデータセットは、現実の臨床環境で放射線技師が使用する診断的推論プロセスを明示的にシミュレートするように設計されている。
本稿では,新たな視覚言語大モデル (VLLM) であるCXRTrekNetを提案する。
論文 参考訳(メタデータ) (2025-05-29T06:30:40Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - MEDDxAgent: A Unified Modular Agent Framework for Explainable Automatic Differential Diagnosis [17.888920170796457]
鑑別診断(DDx)は、臨床的意思決定の基本的な側面であるが複雑な側面である。
大規模言語モデル(LLM)の最近の進歩は、DDxをサポートすることを約束している。
本稿では,対話型DDx用に設計された Modular Explainable DDx Agent (MEDDxAgent) フレームワークを紹介する。
論文 参考訳(メタデータ) (2025-02-26T14:31:43Z) - MedRAX: Medical Reasoning Agent for Chest X-ray [3.453950193734893]
胸部X線(CXR)は、疾患管理や患者のケアにおいて重要な決定を下す上で重要な役割を果たしている。
我々は、最先端のCXR分析ツールとマルチモーダルな大規模言語モデルをシームレスに統合した、初めての汎用AIエージェントであるMedRAXを紹介する。
論文 参考訳(メタデータ) (2025-02-04T19:31:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。