論文の概要: Tree-of-Reasoning: Towards Complex Medical Diagnosis via Multi-Agent Reasoning with Evidence Tree
- arxiv url: http://arxiv.org/abs/2508.03038v1
- Date: Tue, 05 Aug 2025 03:31:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.755407
- Title: Tree-of-Reasoning: Towards Complex Medical Diagnosis via Multi-Agent Reasoning with Evidence Tree
- Title(参考訳): ツリー・オブ・推論:エビデンス・ツリーを用いたマルチエージェント・推論による複雑な医療診断を目指して
- Authors: Qi Peng, Jialin Cui, Jiayuan Xie, Yi Cai, Qing Li,
- Abstract要約: 複雑なシナリオを扱うために設計された新しいマルチエージェントフレームワークであるTree-of-Reasoning (ToR)を提案する。
具体的には、大規模言語モデル(LLM)の推論経路とそれに対応する臨床証拠を明確に記録できるツリー構造を導入する。
同時に,マルチエージェント意思決定の整合性を確保するためのクロスバリデーション機構を提案する。
- 参考スコア(独自算出の注目度): 14.013981070330153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have shown great potential in the medical domain. However, existing models still fall short when faced with complex medical diagnosis task in the real world. This is mainly because they lack sufficient reasoning depth, which leads to information loss or logical jumps when processing a large amount of specialized medical data, leading to diagnostic errors. To address these challenges, we propose Tree-of-Reasoning (ToR), a novel multi-agent framework designed to handle complex scenarios. Specifically, ToR introduces a tree structure that can clearly record the reasoning path of LLMs and the corresponding clinical evidence. At the same time, we propose a cross-validation mechanism to ensure the consistency of multi-agent decision-making, thereby improving the clinical reasoning ability of multi-agents in complex medical scenarios. Experimental results on real-world medical data show that our framework can achieve better performance than existing baseline methods.
- Abstract(参考訳): 大規模言語モデル(LLM)は医療領域において大きな可能性を示している。
しかし、既存のモデルは、現実世界で複雑な診断タスクに直面したときはまだ不足している。
これは主に、十分な推論深度がないため、大量の専門的な医療データを処理する際に情報損失や論理的なジャンプを引き起こし、診断ミスにつながるためである。
これらの課題に対処するために、複雑なシナリオを扱うように設計された新しいマルチエージェントフレームワーク、Tree-of-Reasoning (ToR)を提案する。
具体的には、ALMの推論経路とそれに対応する臨床証拠を明確に記録できる木構造を導入する。
同時に,多エージェント意思決定の整合性を確保するためのクロスバリデーション機構を提案し,複雑な医療シナリオにおける多エージェントの臨床推論能力を向上させる。
実世界の医療データを用いた実験結果から,我々のフレームワークは既存のベースライン法よりも優れた性能が得られることが示された。
関連論文リスト
- A Multi-Agent System for Complex Reasoning in Radiology Visual Question Answering [3.3809462259925938]
放射線画像質問応答(RVQA)は胸部X線画像に関する質問に対して正確な回答を提供する。
近年,マルチモーダル大言語モデル (MLLM) と検索拡張生成 (RAG) に基づく手法がRVQAの進歩に寄与している。
RVQAにおける複雑な推論を支援するために,マルチエージェントシステム(MAS)を導入する。
論文 参考訳(メタデータ) (2025-08-04T19:09:52Z) - MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。
我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。
このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文 参考訳(メタデータ) (2025-06-24T17:52:43Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - MedChat: A Multi-Agent Framework for Multimodal Diagnosis with Large Language Models [9.411749481805355]
緑内障検出と大言語モデル(LLM)の統合は、眼科医の不足を軽減するための自動戦略である。
一般的なLLMを医用画像に適用することは、幻覚、限定的な解釈可能性、ドメイン固有の医療知識の不足により、依然として困難である。
我々は、特殊視モデルと複数のロール固有のLLMエージェントを組み合わせたマルチエージェント診断フレームワークとプラットフォームであるMedChatを提案する。
論文 参考訳(メタデータ) (2025-06-09T03:51:18Z) - A Multimodal Multi-Agent Framework for Radiology Report Generation [2.1477122604204433]
放射線診断レポート生成(RRG)は、医療画像から診断レポートを自動生成することを目的としている。
本稿では,段階的臨床推論ワークフローに適合するRRG用マルチモーダルマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-14T20:28:04Z) - MDTeamGPT: A Self-Evolving LLM-based Multi-Agent Framework for Multi-Disciplinary Team Medical Consultation [20.622990699649694]
MDTコンサルテーションにおけるマルチロールコラボレーションは、しばしば過度に長い対話履歴をもたらす。
本稿では,これらの問題に対処する大規模言語モデル(LLM)に基づくマルチエージェントMDT医療相談フレームワークを提案する。
本フレームワークでは,コンセンサス・アグリゲーションと,マルチラウンド・コンサルテーションのための残余の議論構造を用いる。
また、CorrectKB (CorrectKB) とChain-of-Thought Knowledge Base (ChainKB) も採用している。
論文 参考訳(メタデータ) (2025-03-18T03:07:34Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support [22.40301339126307]
我々は、臨床専門知識とAI推論のギャップを埋める医療言語モデルであるCitrusを紹介する。
このモデルは、シミュレーションされた専門的疾患推論データの大規模なコーパスに基づいて訓練される。
我々は、独自の医療診断対話データセットを含む、最終段階のトレーニングデータをリリースする。
論文 参考訳(メタデータ) (2025-02-25T15:05:12Z) - Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文 参考訳(メタデータ) (2024-11-16T18:19:53Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Towards Medical Artificial General Intelligence via Knowledge-Enhanced
Multimodal Pretraining [121.89793208683625]
医療人工知能(MAGI)は、1つの基礎モデルで異なる医療課題を解くことができる。
我々は、Micical-knedge-enhanced mulTimOdal pretRaining (motoR)と呼ばれる新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-26T01:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。