論文の概要: Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges
- arxiv url: http://arxiv.org/abs/2510.09404v2
- Date: Mon, 13 Oct 2025 07:11:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 13:29:55.721836
- Title: Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges
- Title(参考訳): 放射線学におけるエージェントシステム:設計・応用・評価・課題
- Authors: Christian Bluethgen, Dave Van Veen, Daniel Truhn, Jakob Nikolas Kather, Michael Moor, Malgorzata Polacin, Akshay Chaudhari, Thomas Frauenfelder, Curtis P. Langlotz, Michael Krauthammer, Farhad Nooralahzadeh,
- Abstract要約: 大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
- 参考スコア(独自算出の注目度): 13.53016942028838
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Building agents, systems that perceive and act upon their environment with a degree of autonomy, has long been a focus of AI research. This pursuit has recently become vastly more practical with the emergence of large language models (LLMs) capable of using natural language to integrate information, follow instructions, and perform forms of "reasoning" and planning across a wide range of tasks. With its multimodal data streams and orchestrated workflows spanning multiple systems, radiology is uniquely suited to benefit from agents that can adapt to context and automate repetitive yet complex tasks. In radiology, LLMs and their multimodal variants have already demonstrated promising performance for individual tasks such as information extraction and report summarization. However, using LLMs in isolation underutilizes their potential to support complex, multi-step workflows where decisions depend on evolving context from multiple information sources. Equipping LLMs with external tools and feedback mechanisms enables them to drive systems that exhibit a spectrum of autonomy, ranging from semi-automated workflows to more adaptive agents capable of managing complex processes. This review examines the design of such LLM-driven agentic systems, highlights key applications, discusses evaluation methods for planning and tool use, and outlines challenges such as error cascades, tool-use efficiency, and health IT integration.
- Abstract(参考訳): エージェントの構築は、自律性の度合いで環境を知覚し、行動するシステムであり、長い間AI研究に焦点を合わせてきた。
この追求は、情報の統合や指示の追跡、"推論"の形式の実行、幅広いタスクの計画に自然言語を使用できる大規模言語モデル(LLM)の出現により、最近、さらに実用的になった。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションワークフローにより、ラジオロジーはコンテキストに適応し、反復的かつ複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
放射線学において、LSMとそのマルチモーダル変種は、情報抽出やレポート要約といった個々のタスクに対して有望な性能をすでに証明している。
しかし、LLMを単独で使用すると、複数の情報ソースからのコンテキストの進化に依存する複雑なマルチステップワークフローをサポートする可能性が弱まる。
LLMに外部ツールとフィードバックメカニズムを組み込むことで、半自動化ワークフローから複雑なプロセスを管理するためのより適応的なエージェントまで、自律性のスペクトルを示すシステムを動かすことができる。
本稿では,LSM駆動型エージェントシステムの設計を概観し,主要なアプリケーションを強調し,計画とツール使用の評価方法について議論し,エラーカスケード,ツール使用効率,健康IT統合といった課題を概説する。
関連論文リスト
- Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers [27.817039954088315]
ツールレベルの専門知識を学習するための自己進化型マルチエージェントシステムである textbfGeoEvolver を紹介する。
GeoEvolverはエンドツーエンドのタスクの成功を継続的に改善し、複数のバックボーンで平均12%向上することを示す。
論文 参考訳(メタデータ) (2026-01-30T15:11:07Z) - QUASAR: A Universal Autonomous System for Atomistic Simulation and a Benchmark of Its Capabilities [0.7519872646378835]
QUASARは、生産段階の科学的発見を促進するために設計された原子論シミュレーションのための普遍的な自律システムである。
我々は,光触媒スクリーニングや新規材料評価など,日常的な課題からフロンティア研究の課題まで,一連の3段階の課題に対してquariSARをベンチマークした。
その結果,quiSARはタスク固有の自動化フレームワークではなく,一般的な原子論的推論システムとして機能することが示唆された。
論文 参考訳(メタデータ) (2026-01-30T05:29:44Z) - HELP: Hierarchical Embodied Language Planner for Household Tasks [75.38606213726906]
複雑なシナリオを扱うエージェントは、堅牢な計画能力に大きく依存する。
広範な言語知識を備えた大規模言語モデルは、この役割を果たすことができる。
LLMをベースとした一組のエージェントからなる階層型エンボディード言語プランナーHELPを提案する。
論文 参考訳(メタデータ) (2025-12-25T15:54:08Z) - Beyond Task Completion: An Assessment Framework for Evaluating Agentic AI Systems [0.0]
エージェントAIの最近の進歩は、スタンドアロンの大規模言語モデルから統合システムへと焦点を移している。
LLM、メモリ、ツール、環境を含む4つの評価柱を持つエンドツーエンドのエージェントアセスメントフレームワークを提案する。
我々はこのフレームワークを、従来のメトリクスによる振る舞いの偏りを示す、代表的なAutonomous CloudOpsユースケースで検証する。
論文 参考訳(メタデータ) (2025-12-14T18:17:40Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.4890331763196]
大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。
LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文 参考訳(メタデータ) (2025-03-20T22:37:15Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - A Comprehensive Review of Multimodal Large Language Models: Performance and Challenges Across Different Tasks [74.52259252807191]
MLLM(Multimodal Large Language Models)は、単一のモダリティシステムの能力を超えた現実世界のアプリケーションの複雑さに対処する。
本稿では,自然言語,視覚,音声などのマルチモーダルタスクにおけるMLLMの応用を体系的に整理する。
論文 参考訳(メタデータ) (2024-08-02T15:14:53Z) - BMW Agents -- A Framework For Task Automation Through Multi-Agent Collaboration [0.0]
我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。
提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文 参考訳(メタデータ) (2024-06-28T16:39:20Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - TPTU: Large Language Model-based AI Agents for Task Planning and Tool
Usage [28.554981886052953]
大規模言語モデル(LLM)は、様々な現実世界のアプリケーションのための強力なツールとして登場した。
LLMの本質的な生成能力は、その長所にもかかわらず、複雑なタスクを扱うには不十分である。
本稿では,LLMベースのAIエージェントに適した構造化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-07T09:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。