論文の概要: Agentic AI in Healthcare & Medicine: A Seven-Dimensional Taxonomy for Empirical Evaluation of LLM-based Agents
- arxiv url: http://arxiv.org/abs/2602.04813v1
- Date: Wed, 04 Feb 2026 17:59:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.670778
- Title: Agentic AI in Healthcare & Medicine: A Seven-Dimensional Taxonomy for Empirical Evaluation of LLM-based Agents
- Title(参考訳): 医療・医療におけるエージェントAI : LLMエージェントの実証評価のための7次元分類法
- Authors: Shubham Vatsal, Harsh Dubey, Aditi Singh,
- Abstract要約: 大規模言語モデル(LLM)に基づくエージェントは、医療や医療を計画し、使用し、行為を行う。
しかし、文献は概ね、広範な調査または単一の能力への狭い潜入である概要で構成されている。
我々は,認知能力,知識管理,相互作用パターン,適応と学習,安全と倫理,フレームワークの類型化,コアタスクとサブタスクという,7次元の分類学を用いた49の研究をレビューすることによって,この問題に対処する。
- 参考スコア(独自算出の注目度): 2.2375741539687644
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Model (LLM)-based agents that plan, use tools and act has begun to shape healthcare and medicine. Reported studies demonstrate competence on various tasks ranging from EHR analysis and differential diagnosis to treatment planning and research workflows. Yet the literature largely consists of overviews which are either broad surveys or narrow dives into a single capability (e.g., memory, planning, reasoning), leaving healthcare work without a common frame. We address this by reviewing 49 studies using a seven-dimensional taxonomy: Cognitive Capabilities, Knowledge Management, Interaction Patterns, Adaptation & Learning, Safety & Ethics, Framework Typology and Core Tasks & Subtasks with 29 operational sub-dimensions. Using explicit inclusion and exclusion criteria and a labeling rubric (Fully Implemented, Partially Implemented, Not Implemented), we map each study to the taxonomy and report quantitative summaries of capability prevalence and co-occurrence patterns. Our empirical analysis surfaces clear asymmetries. For instance, the External Knowledge Integration sub-dimension under Knowledge Management is commonly realized (~76% Fully Implemented) whereas Event-Triggered Activation sub-dimenison under Interaction Patterns is largely absent (~92% Not Implemented) and Drift Detection & Mitigation sub-dimension under Adaptation & Learning is rare (~98% Not Implemented). Architecturally, Multi-Agent Design sub-dimension under Framework Typology is the dominant pattern (~82% Fully Implemented) while orchestration layers remain mostly partial. Across Core Tasks & Subtasks, information centric capabilities lead e.g., Medical Question Answering & Decision Support and Benchmarking & Simulation, while action and discovery oriented areas such as Treatment Planning & Prescription still show substantial gaps (~59% Not Implemented).
- Abstract(参考訳): 大規模言語モデル(LLM)に基づくエージェントは、医療や医療を計画し、使用し、行為を行う。
報告された研究は、EHR分析や鑑別診断から治療計画や研究ワークフローに至るまで、様々なタスクにおける能力を示す。
しかし、文献は概ね、広範囲にわたる調査または単一の能力(例えば、記憶、計画、推論)への狭い潜入で、共通の枠組みなしに医療業務を継続する、という概要で構成されています。
本研究は,認知能力,知識管理,インタラクションパターン,適応と学習,安全と倫理,フレームワークのタイポロジー,コアタスクとサブタスクと29のサブディメンジョンの7次元分類を用いて49の研究をレビューすることによって,この問題に対処する。
明確な包含基準と排他基準とラベル付けルーリック(フル実装,部分実装,未実装)を用いて,各研究を分類学にマッピングし,能力の有病率と共起パターンの定量的要約を報告する。
私たちの経験分析は明らかな非対称性を表面化します。
例えば、知識管理に基づく外部知識統合のサブディメンジョン(~76%が完全実装)が一般的であるのに対して、インタラクションパターンによるイベントトリガー活性化のサブディメンション(~92%が実装されていない)と、適応と学習によるドリフト検出と緩和のサブディメンジョン(~98%が実装されていない)がほとんどである。
アーキテクチャ上、フレームワークティポロジーに基づくマルチエージェント設計のサブディメンジョンが支配的なパターン(約82%の完全実装)であるのに対して、オーケストレーション層は部分的のままである。
コアタスクとサブタスク全体にわたって、情報中心の能力は、例えば、医療質問回答と意思決定のサポート、ベンチマークとシミュレーションをリードします。
関連論文リスト
- Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Deep Learning Approaches for Medical Imaging Under Varying Degrees of Label Availability: A Comprehensive Survey [13.50671193697418]
この調査は、これらの領域における進化する研究を分類し、レビューし、2018年以降に約600の著名な貢献を分析している。
画像分類、セグメンテーション、および脳、胸部、心臓イメージングに限らず、様々な医療応用領域における検出などのタスクをカバーしている。
異なる学習パラダイムの形式的定義を提供し、様々な学習メカニズムと戦略の包括的要約と解釈を提供する。
論文 参考訳(メタデータ) (2025-04-15T20:06:43Z) - M-QALM: A Benchmark to Assess Clinical Reading Comprehension and Knowledge Recall in Large Language Models via Question Answering [14.198330378235632]
我々は,3つのジェネラリストと3つの専門的なバイオメディカルサブドメインにおいて,22のデータセットに関する大規模な実験研究を行うために,複数選択と抽象質問応答を用いた。
15個のLLMの性能の多面的解析により、リコールや理解の向上につながる命令チューニングなどの成功要因が明らかになった。
最近提案されたドメイン適応モデルには十分な知識が欠如している可能性があるが、収集した医療知識データセットを直接微調整することは、奨励的な結果を示している。
我々は、必要な知識を単に思い出し、提示された知識と統合するモデルの能力の間に大きなギャップがあることを明らかにする、スキル指向手動エラー解析で定量的結果を補完する。
論文 参考訳(メタデータ) (2024-06-06T02:43:21Z) - Does Biomedical Training Lead to Better Medical Performance? [7.341724934479004]
大規模言語モデル(LLM)は、患者のケア、診断、管理プロセスに大きく貢献することが期待されている。
本研究では, バイオメディカルトレーニングが6つの実践的医療課題の文脈に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2024-04-05T12:51:37Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Integrated Planning in Hospitals: A Review [0.0]
本稿では,病院における各種資源の総合的な計画に関する運用研究・管理科学文献に焦点を当てる。
関連文献を収集し,不確実性モデリングや実生活データの利用など,さまざまな側面について分析する。
我々は、異なるリソース中心の統合アプローチを分類し、文献のギャップを指摘するために、高いレベルの分類を提供する。
論文 参考訳(メタデータ) (2023-07-11T13:47:26Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。