論文の概要: H-AdminSim: A Multi-Agent Simulator for Realistic Hospital Administrative Workflows with FHIR Integration
- arxiv url: http://arxiv.org/abs/2602.05407v1
- Date: Thu, 05 Feb 2026 07:44:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.821508
- Title: H-AdminSim: A Multi-Agent Simulator for Realistic Hospital Administrative Workflows with FHIR Integration
- Title(参考訳): H-AdminSim:FHIRを統合した現実的な病院管理ワークフローのためのマルチエージェントシミュレータ
- Authors: Jun-Min Lee, Meong Hi Son, Edward Choi,
- Abstract要約: 病院管理部は幅広い業務をこなし、大病院では1日1万件以上の要求を処理している。
本稿では,現実的なデータ生成と病院管理業務のマルチエージェントベースシミュレーションを組み合わせた総合的なエンドツーエンドシミュレーションフレームワークであるH-AdminSimを提案する。
- 参考スコア(独自算出の注目度): 14.241144065983184
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Hospital administration departments handle a wide range of operational tasks and, in large hospitals, process over 10,000 requests per day, driving growing interest in LLM-based automation. However, prior work has focused primarily on patient--physician interactions or isolated administrative subtasks, failing to capture the complexity of real administrative workflows. To address this gap, we propose H-AdminSim, a comprehensive end-to-end simulation framework that combines realistic data generation with multi-agent-based simulation of hospital administrative workflows. These tasks are quantitatively evaluated using detailed rubrics, enabling systematic comparison of LLMs. Through FHIR integration, H-AdminSim provides a unified and interoperable environment for testing administrative workflows across heterogeneous hospital settings, serving as a standardized testbed for assessing the feasibility and performance of LLM-driven administrative automation.
- Abstract(参考訳): 病院管理部は幅広い業務をこなしており、大病院では1日1万件以上の要求を処理しており、LSMベースの自動化への関心が高まっている。
しかしながら、以前の研究は主に患者と医師の相互作用や独立した管理サブタスクに焦点を当てており、実際の管理ワークフローの複雑さを捉えていない。
このギャップに対処するために,現実的なデータ生成と病院管理ワークフローのマルチエージェントに基づくシミュレーションを組み合わせた総合的なエンドツーエンドシミュレーションフレームワークであるH-AdminSimを提案する。
これらのタスクは、詳細な潤滑剤を用いて定量的に評価され、LCMを体系的に比較することができる。
FHIRの統合により、H-AdminSimは、均一な病院設定で管理ワークフローをテストするための統一的で相互運用可能な環境を提供し、LLM駆動の管理自動化の実現性と性能を評価するための標準化されたテストベッドとして機能する。
関連論文リスト
- Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline [38.16649115214312]
一つのエージェントがKVキャッシュの再利用による効率上の利点を生かして均一性を実現できることを示す。
本稿では,単一エージェントの実行を自動的に調整し,推論コストを削減するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-01-18T08:16:09Z) - Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges [13.53016942028838]
大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
論文 参考訳(メタデータ) (2025-10-10T13:56:27Z) - EHR-MCP: Real-world Evaluation of Clinical Information Retrieval by Large Language Models via Model Context Protocol [0.0]
大規模言語モデル (LLM) は医療における有望性を示すが、病院への展開は電子健康記録(EHR)システムへのアクセス制限によって制限される。
Model Context Protocol (MCP)は、LCMと外部ツールの統合を可能にする。
EHR-MCPは病院のERHデータベースと統合されたカスタムMPPツールのフレームワークで、GPT-4.1をLangGraph ReActエージェントを介して利用した。
論文 参考訳(メタデータ) (2025-09-19T13:17:16Z) - Intelligent Assistants for the Semiconductor Failure Analysis with LLM-Based Planning Agents [1.2693545159861859]
失敗分析(FA)は、非常に複雑で知識集約的なプロセスである。
FAラボの計算インフラにおけるAIコンポーネントの統合は、さまざまなタスクを自動化する可能性がある。
本稿では,Large Language Model (LLM)-based Planning Agent (LPA) を用いた半導体FAのためのエージェントAIシステムの設計と実装について検討する。
論文 参考訳(メタデータ) (2025-06-18T15:43:10Z) - EIFBENCH: Extremely Complex Instruction Following Benchmark for Large Language Models [64.70546873396624]
大規模言語モデル(LLM)を評価するためのEIFBENCH(Extremely Complex Instruction following Benchmark)を提案する。
EIFBENCHにはマルチタスクシナリオが含まれており、多様なタスクタイプを同時に総合的に評価することができる。
また,LLMのマルチタスクワークフローを正確に満たす能力を高めるために,セグメントポリシー最適化(SegPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-10T02:39:55Z) - Cross-Task Experiential Learning on LLM-based Multi-Agent Collaboration [63.90193684394165]
マルチエージェント・クロスタスク体験学習(MAEL)は,LSM駆動型エージェントに明示的なクロスタスク学習と経験蓄積を付与する新しいフレームワークである。
経験的学習フェーズでは、タスク解決ワークフローの各ステップの品質を定量化し、その結果の報酬を記憶する。
推論中、エージェントは、各推論ステップの有効性を高めるために、いくつかの例として、高頻度のタスク関連体験を検索する。
論文 参考訳(メタデータ) (2025-05-29T07:24:37Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design [5.03859766090879]
本研究では,Large Language Models (LLM) を用いた自律型シミュレーションエージェント (ASA) の実現可能性について検討する。
実験ケースとして, 高分子鎖配座のよく研究されたシミュレーション問題を用いて, 異なるLCMを用いたASAの長期化と信頼性について検討した。
その結果,ASA-GPT-4oは指定された研究ミッションでほぼ不当に実行された。
論文 参考訳(メタデータ) (2024-08-28T03:48:05Z) - OfficeBench: Benchmarking Language Agents across Multiple Applications for Office Automation [51.27062359412488]
Officeの自動化は、ワークフローでルーチンタスクを自動的に終了することで、人間の生産性を著しく向上させる。
OfficeBenchは、現実的なオフィスにおけるオフィスタスクに対処する現在のLLMエージェントの能力を評価するための、最初のオフィス自動化ベンチマークの1つです。
各タスクにカスタマイズした評価手法を適用すると、GPT-4 Omniは47.00%の最高パス率を達成し、オフィスタスクの処理に優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-26T19:27:17Z) - EHRAgent: Code Empowers Large Language Models for Few-shot Complex Tabular Reasoning on Electronic Health Records [47.5632532642591]
大規模言語モデル(LLM)は、計画とツールの利用において例外的な能力を示した。
コードインタフェースを備えたLLMエージェントであるEHRAgentを提案し,マルチタブラル推論のためのコードの自動生成と実行を行う。
論文 参考訳(メタデータ) (2024-01-13T18:09:05Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。