論文の概要: Grounded by Experience: Generative Healthcare Prediction Augmented with Hierarchical Agentic Retrieval
- arxiv url: http://arxiv.org/abs/2511.13293v1
- Date: Mon, 17 Nov 2025 12:15:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.20224
- Title: Grounded by Experience: Generative Healthcare Prediction Augmented with Hierarchical Agentic Retrieval
- Title(参考訳): 経験をふまえて : 階層的エージェント検索による創発的ヘルスケア予測
- Authors: Chuang Zhao, Hui Tang, Hongke Zhao, Xiaofang Zhou, Xiaomeng Li,
- Abstract要約: 大規模言語モデル(LLM)は、豊富なパラメトリック知識に基づいて、医療の予測を強化するための有望な道を提供する。
LLMは、組み込み知識の信頼性とカバレッジに制限があるため、事実的不正確な傾向にある。
GHARは,医療におけるサブモジュール間の協調をいつ取得するか,どのように最適化するかを同時に解決する下線構造下線下線下線RAGフレームワークである。
- 参考スコア(独自算出の注目度): 29.377256313893934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate healthcare prediction is critical for improving patient outcomes and reducing operational costs. Bolstered by growing reasoning capabilities, large language models (LLMs) offer a promising path to enhance healthcare predictions by drawing on their rich parametric knowledge. However, LLMs are prone to factual inaccuracies due to limitations in the reliability and coverage of their embedded knowledge. While retrieval-augmented generation (RAG) frameworks, such as GraphRAG and its variants, have been proposed to mitigate these issues by incorporating external knowledge, they face two key challenges in the healthcare scenario: (1) identifying the clinical necessity to activate the retrieval mechanism, and (2) achieving synergy between the retriever and the generator to craft contextually appropriate retrievals. To address these challenges, we propose GHAR, a \underline{g}enerative \underline{h}ierarchical \underline{a}gentic \underline{R}AG framework that simultaneously resolves when to retrieve and how to optimize the collaboration between submodules in healthcare. Specifically, for the first challenge, we design a dual-agent architecture comprising Agent-Top and Agent-Low. Agent-Top acts as the primary physician, iteratively deciding whether to rely on parametric knowledge or to initiate retrieval, while Agent-Low acts as the consulting service, summarising all task-relevant knowledge once retrieval was triggered. To tackle the second challenge, we innovatively unify the optimization of both agents within a formal Markov Decision Process, designing diverse rewards to align their shared goal of accurate prediction while preserving their distinct roles. Extensive experiments on three benchmark datasets across three popular tasks demonstrate our superiority over state-of-the-art baselines, highlighting the potential of hierarchical agentic RAG in advancing healthcare systems.
- Abstract(参考訳): 正確な医療予測は、患者の成果を改善し、運用コストを削減するために重要である。
推論能力の増大に支えられて、大きな言語モデル(LLM)は、豊富なパラメトリック知識に基づいて、医療予測を強化するための有望な道を提供する。
しかし, LLMは, 組込み知識の信頼性やカバレッジに限界があるため, 事実的不正確な傾向にある。
GraphRAGなどの検索強化世代(RAG)フレームワークは、外部知識を取り入れてこれらの問題を緩和するために提案されているが、医療シナリオでは、(1)検索メカニズムを活性化する臨床上の必要性の特定、(2)検索者とジェネレータの相乗効果の達成、という2つの課題に直面している。
これらの課題に対処するために,医療におけるサブモジュール間の協調をいつ取得するか,どのように最適化するかを同時に解決する,GHAR,a \underline{g}enerative \underline{h}ierarchical \underline{a}gentic \underline{R}AGフレームワークを提案する。
具体的には,Agent-TopとAgent-Lowを組み合わせたデュアルエージェントアーキテクチャを設計する。
Agent-Topは、パラメトリック知識に頼るか、検索を開始するかを反復的に決定すると同時に、Agent-Lowはコンサルティングサービスとして機能し、検索が開始されるとタスク関連知識をすべて要約する。
第2の課題に取り組むために、我々は、正式なマルコフ決定プロセスにおいて両エージェントの最適化を革新的に統一し、異なる役割を保ちながら、正確な予測の共通の目標を一致させるために、多様な報酬を設計する。
3つの一般的なタスクにわたる3つのベンチマークデータセットに対する大規模な実験は、最先端のベースラインよりも優位性を示し、医療システムの進歩における階層的エージェントRAGの可能性を強調している。
関連論文リスト
- MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - Towards Self-Evolving Benchmarks: Synthesizing Agent Trajectories via Test-Time Exploration under Validate-by-Reproduce Paradigm [60.36837655498119]
本稿では,トラジェクトリをベースとしたエージェント・ベンチマーク・複雑度進化フレームワークを提案する。
このフレームワークは、既存のベンチマークから元のタスクを受け取り、エージェントがそれをより難しい新しいタスクに進化させるよう促す。
GAIAベンチマークの実験では、TRACEフレームワークはタスクの複雑さを継続的に向上し、正確性の信頼性を向上させる。
論文 参考訳(メタデータ) (2025-10-01T01:52:52Z) - RAR$^2$: Retrieval-Augmented Medical Reasoning via Thought-Driven Retrieval [25.425621641226815]
大きな言語モデル(LLM)は、様々な医療ベンチマークで有望なパフォーマンスを示している。
RAGは、外部医療情報を取り入れることで、知識ギャップと幻覚を緩和するための重要なアプローチとして登場した。
我々は、Reasoning-Augmented RetrievalとRetrieval-Augmented Reasoningを改善する共同学習フレームワークであるRAR$2$を提案する。
論文 参考訳(メタデータ) (2025-09-24T05:35:57Z) - Enhancing Retrieval Augmentation via Adversarial Collaboration [50.117273835877334]
我々は「検索幻覚」に対処するため、Adrial Collaboration RAG(AC-RAG)フレームワークを提案する。
AC-RAGは、知識ギャップを識別するジェネリスト検出器と、正確な解決策を提供するドメイン特化リゾルバという2つの異種エージェントを使用している。
実験により、AC-RAGは検索精度を大幅に向上し、様々な垂直領域における最先端RAG法より優れていることが示された。
論文 参考訳(メタデータ) (2025-09-18T08:54:20Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - Inference Gap in Domain Expertise and Machine Intelligence in Named Entity Recognition: Creation of and Insights from a Substance Use-related Dataset [6.343399421398501]
非医療オピオイドの使用は公衆衛生上の緊急の課題である。
ソーシャルメディアの物語から、自己報告結果の2つのカテゴリを抽出するために、名前付きエンティティ認識(NER)フレームワークを提案する。
我々は、ゼロショットと少数ショットのインコンテキスト学習設定下で、微調整エンコーダモデルと最先端の大規模言語モデル(LLM)の両方を評価する。
論文 参考訳(メタデータ) (2025-08-26T23:09:43Z) - CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support [37.20545002349272]
CardAIc-Agentsは、AIモデルを外部ツールで拡張し、多様な心臓タスクを適応的にサポートするフレームワークである。
カルディアックRAGのエージェントは、心の知識から一般的な計画を作成し、チーフエージェントはこれらの計画を自律的に実行し、決定を下すためのツールを統合した。
3つのデータセットを対象とした実験では、主流のVision-Language Models (VLM)、最先端のエージェントシステム、微調整されたVLMと比較して、CardAIc-Agentsの有効性が示された。
論文 参考訳(メタデータ) (2025-08-18T16:17:12Z) - MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph [57.54231831309079]
我々は、時間的に進化する医療知識グラフを構築するためのフレームワークであるMedKGentを紹介する。
生医学的知識の出現を, 微粒な日々の時系列でシミュレートする。
結果として得られるKGは156,275個のエンティティと2,971,384個のリレーショナルトリプルを含む。
論文 参考訳(メタデータ) (2025-08-17T15:14:03Z) - Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA [17.823588070044217]
本稿では,医療質問応答システムを強化するためのプラグアンドプレイモジュールであるDisdisuss-RAGを提案する。
本手法では,多ターンブレインストーミングをエミュレートする医療専門家のチームを編成し,検索内容の関連性を向上する要約エージェントを提案する。
4つのベンチマーク医学QAデータセットによる実験結果から、DEC-RAGはMedRAGより一貫して優れていた。
論文 参考訳(メタデータ) (2025-04-30T01:37:44Z) - SurgRAW: Multi-Agent Workflow with Chain-of-Thought Reasoning for Surgical Intelligence [16.584722724845182]
手術インテリジェンスにおける視覚-言語モデルの統合は、幻覚、ドメイン知識のギャップ、タスク相互依存性の限定的な理解によって妨げられている。
本稿では,CoT駆動型マルチエージェントフレームワークであるSurgRAWについて紹介する。
論文 参考訳(メタデータ) (2025-03-13T11:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。