論文の概要: CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support
- arxiv url: http://arxiv.org/abs/2508.13256v1
- Date: Mon, 18 Aug 2025 16:17:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.691441
- Title: CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support
- Title(参考訳): CardAIc-Agents: 階層型適応型マルチモーダルフレームワーク
- Authors: Yuting Zhang, Karina V. Bunting, Asgher Champsi, Xiaoxia Wang, Wenqi Lu, Alexander Thorley, Sandeep S Hothi, Zhaowen Qiu, Dipak Kotecha, Jinming Duan,
- Abstract要約: CardAIc-Agentsは、AIモデルを外部ツールで拡張し、多様な心臓タスクを適応的にサポートするフレームワークである。
カルディアックRAGのエージェントは、心の知識から一般的な計画を作成し、チーフエージェントはこれらの計画を自律的に実行し、決定を下すためのツールを統合した。
3つのデータセットを対象とした実験では、主流のVision-Language Models (VLM)、最先端のエージェントシステム、微調整されたVLMと比較して、CardAIc-Agentsの有効性が示された。
- 参考スコア(独自算出の注目度): 37.20545002349272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cardiovascular diseases (CVDs) remain the foremost cause of mortality worldwide, a burden worsened by a severe deficit of healthcare workers. Artificial intelligence (AI) agents have shown potential to alleviate this gap via automated early detection and proactive screening, yet their clinical application remains limited by: 1) prompt-based clinical role assignment that relies on intrinsic model capabilities without domain-specific tool support; or 2) rigid sequential workflows, whereas clinical care often requires adaptive reasoning that orders specific tests and, based on their results, guides personalised next steps; 3) general and static knowledge bases without continuous learning capability; and 4) fixed unimodal or bimodal inputs and lack of on-demand visual outputs when further clarification is needed. In response, a multimodal framework, CardAIc-Agents, was proposed to augment models with external tools and adaptively support diverse cardiac tasks. Specifically, a CardiacRAG agent generated general plans from updatable cardiac knowledge, while the chief agent integrated tools to autonomously execute these plans and deliver decisions. To enable adaptive and case-specific customization, a stepwise update strategy was proposed to dynamically refine plans based on preceding execution results, once the task was assessed as complex. In addition, a multidisciplinary discussion tool was introduced to interpret challenging cases, thereby supporting further adaptation. When clinicians raised concerns, visual review panels were provided to assist final validation. Experiments across three datasets showed the efficiency of CardAIc-Agents compared to mainstream Vision-Language Models (VLMs), state-of-the-art agentic systems, and fine-tuned VLMs.
- Abstract(参考訳): 心臓血管疾患(CVD)は、医療従事者の深刻な赤字により悪化し、世界中で死亡の最も大きな原因となっている。
人工知能(AI)エージェントは、自動早期検出と前向きスクリーニングによってこのギャップを緩和する可能性を示しているが、臨床応用は以下の通りである。
1)ドメイン固有のツールサポートを伴わない本質的なモデル能力に依存する即時的な臨床的役割割り当て
2) 厳格なシーケンシャルワークフロー,一方,臨床ケアには,特定の検査を指示し,その結果に基づいて次のステップをパーソナライズする適応的推論が必要である場合が多い。
3)継続的学習能力のない一般知識基盤と静的知識基盤
4) 固定された一様又は二様の入力と、さらなる明確化が必要な場合のオンデマンド視覚出力の欠如。
これに対し,マルチモーダルフレームワークであるCardAIc-Agentsは,外部ツールを用いたモデルの拡張と,多種多様な心臓タスクの適応的サポートを目的として提案された。
具体的には、CardiacRAGのエージェントが心の知識から一般的な計画を作成し、チーフエージェントはこれらの計画を自律的に実行し、決定を下すためのツールを統合した。
適応的かつケース固有のカスタマイズを可能にするため、タスクを複雑に評価すると、前回の実行結果に基づいて動的に計画を洗練するための段階的な更新戦略が提案された。
さらに,難解な事例を解釈し,さらなる適応を支援するための多分野議論ツールも導入された。
臨床医が懸念を抱くと、最終的な検証を支援するために視覚的レビューパネルが設けられた。
3つのデータセットを対象とした実験では、主流のVision-Language Models (VLM)、最先端のエージェントシステム、微調整されたVLMと比較して、CardAIc-Agentsの有効性が示された。
関連論文リスト
- EndoAgent: A Memory-Guided Reflective Agent for Intelligent Endoscopic Vision-to-Decision Reasoning [6.96058549084651]
EndoAgentは、視覚から決定への内視鏡分析のためのメモリ誘導剤である。
反復推論と適応的なツールの選択とコラボレーションを統合する。
一般的なマルチモーダルモデルと医療用マルチモーダルモデルの両方を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-10T11:02:57Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Prompt Mechanisms in Medical Imaging: A Comprehensive Survey [18.072753363565322]
深層学習は医療画像に変革をもたらす。
しかし、その臨床導入は、データの不足、分散シフト、堅牢なタスクの一般化の必要性といった課題によって、しばしば妨げられている。
深層学習モデルを導くための重要な戦略として,プロンプトベースの方法論が登場している。
論文 参考訳(メタデータ) (2025-06-28T03:06:25Z) - SurgRAW: Multi-Agent Workflow with Chain-of-Thought Reasoning for Surgical Intelligence [16.584722724845182]
手術インテリジェンスにおける視覚-言語モデルの統合は、幻覚、ドメイン知識のギャップ、タスク相互依存性の限定的な理解によって妨げられている。
本稿では,CoT駆動型マルチエージェントフレームワークであるSurgRAWについて紹介する。
論文 参考訳(メタデータ) (2025-03-13T11:23:13Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文 参考訳(メタデータ) (2024-11-16T18:19:53Z) - Development of a Large Language Model-based Multi-Agent Clinical Decision Support System for Korean Triage and Acuity Scale (KTAS)-Based Triage and Treatment Planning in Emergency Departments [0.0]
本研究は, 患者トリアージ, 治療計画, 救急管理全般において, LLM駆動型CDSSを用いて, ED医師や看護師を支援することを目的とするものである。
このシステムは、Triage Nuurse、救急医、薬剤師、EDコーディネーターの4つのAIエージェントで構成されている。
トリアージアセスメントにはKTAS(Korea Triage and Acuity Scale)が組み込まれ、医薬品管理にはRxNorm APIが組み込まれている。
論文 参考訳(メタデータ) (2024-08-14T13:03:41Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。