論文の概要: Beyond the Algorithm: A Field Guide to Deploying AI Agents in Clinical Practice
- arxiv url: http://arxiv.org/abs/2509.26153v2
- Date: Wed, 01 Oct 2025 16:11:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-02 14:33:21.843996
- Title: Beyond the Algorithm: A Field Guide to Deploying AI Agents in Clinical Practice
- Title(参考訳): アルゴリズムを超えて:臨床実践にAIエージェントをデプロイするためのフィールドガイド
- Authors: Jack Gallifant, Katherine C. Kellogg, Matt Butler, Amanda Centi, Shan Chen, Patrick F. Doyle, Sayon Dutta, Joyce Guo, Matthew J. Hadfield, Esther H. Kim, David E. Kozono, Hugo JWL Aerts, Adam B. Landman, Raymond H. Mak, Rebecca G. Mishuris, Tanna L. Nelson, Guergana K. Savova, Elad Sharon, Benjamin C. Silverman, Umit Topaloglu, Jeremy L. Warner, Danielle S. Bitterman,
- Abstract要約: 本稿では,電子健康記録(EHR)データを用いた生成エージェントをデプロイするための実践者指向のフィールドマニュアルを提案する。
本ガイドは、臨床ノートから免疫関連有害事象を検出する自動システム「IRAE-Agent」をデプロイした経験から得られたものである。
データ統合、モデル検証、経済的な価値の確保、システムドリフトの管理、ガバナンスです。
- 参考スコア(独自算出の注目度): 4.7589523564923395
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models (LLMs) integrated into agent-driven workflows hold immense promise for healthcare, yet a significant gap exists between their potential and practical implementation within clinical settings. To address this, we present a practitioner-oriented field manual for deploying generative agents that use electronic health record (EHR) data. This guide is informed by our experience deploying the "irAE-Agent", an automated system to detect immune-related adverse events from clinical notes at Mass General Brigham, and by structured interviews with 20 clinicians, engineers, and informatics leaders involved in the project. Our analysis reveals a critical misalignment in clinical AI development: less than 20% of our effort was dedicated to prompt engineering and model development, while over 80% was consumed by the sociotechnical work of implementation. We distill this effort into five "heavy lifts": data integration, model validation, ensuring economic value, managing system drift, and governance. By providing actionable solutions for each of these challenges, this field manual shifts the focus from algorithmic development to the essential infrastructure and implementation work required to bridge the "valley of death" and successfully translate generative AI from pilot projects into routine clinical care.
- Abstract(参考訳): エージェント駆動ワークフローに統合された大規模言語モデル(LLM)は、医療にとって大きな可能性を秘めている。
そこで本稿では,電子健康記録(EHR)データを用いた生成エージェントをデプロイするための実践者指向のフィールドマニュアルを提案する。
このガイドは、ブリガム将軍の医療ノートから免疫関連有害事象を検出する自動システム「IRAE-Agent」をデプロイした経験と、プロジェクトに関わる20人の臨床医、技術者、情報学のリーダーとの構造化インタビューから得られたものである。
私たちの取り組みの20%以下は、エンジニアリングとモデル開発の促進に費やされ、80%以上は、実装の社会技術的作業によって消費されました。
データ統合、モデル検証、経済的な価値の確保、システムドリフトの管理、ガバナンスです。
これらの課題に対して実行可能なソリューションを提供することで、このフィールドマニュアルは、アルゴリズム開発から、"死の谷間"を橋渡しし、生成するAIをパイロットプロジェクトから日常的な臨床医療に翻訳するために必要な、重要なインフラと実装作業へと焦点を移す。
関連論文リスト
- Leveraging AI to Accelerate Medical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods [3.2666593942117688]
Octoziは、大規模な言語モデルとドメイン固有性を組み合わせて医療データレビューを変換する人工知能支援プラットフォームである。
代表的な第3相腫瘍学試験の経済分析により、潜在的コスト削減は510万ドルであることが判明した。
論文 参考訳(メタデータ) (2025-08-07T15:49:32Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Bridging AI Innovation and Healthcare Needs: Lessons Learned from Incorporating Modern NLP at The BC Cancer Registry [2.0447192404937353]
自然言語処理(NLP)ソリューションのデプロイは、現実的な課題を提示します。
明確なビジネス目標に基づいて問題を定義することの重要性を強調します。
実用的なモデル選択の必要性、データ品質への厳格な注意、堅牢なエラー軽減戦略を強調します。
論文 参考訳(メタデータ) (2025-07-27T15:06:43Z) - Toward a Human-Centered AI-assisted Colonoscopy System in Australia [12.548421709213379]
現在の開発は機械学習モデルのパフォーマンスを優先し、ユーザインターフェース設計、ワークフロー統合、全体的なユーザエクスペリエンスの重要な側面を見越している。
AIの可能性を最大限に実現するために、HCIコミュニティは、ユーザ中心の設計を擁護し、これらのシステムを確実に使用し、内科医の専門知識をサポートし、患者の成果を高める必要がある。
論文 参考訳(メタデータ) (2025-03-15T23:36:48Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice through Interactive Sequential Benchmarking [58.25862290294702]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Demystifying Large Language Models for Medicine: A Primer [50.83806796466396]
大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文 参考訳(メタデータ) (2024-10-24T15:41:56Z) - Autonomous Artificial Intelligence Agents for Clinical Decision Making in Oncology [0.6397820821509177]
本稿では,大規模言語モデル(LLM)を中心的推論エンジンとして活用する,マルチモーダル医療用AIの代替手法を提案する。
このエンジンは、医療用AIツールのセットを自律的に調整し、デプロイする。
適切なツール(97%)、正しい結論(93.6%)、完全(94%)、個人患者に有用な推奨(89.2%)を提示する能力が高いことを示す。
論文 参考訳(メタデータ) (2024-04-06T15:50:19Z) - End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.360760580820966]
放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - MedAlpaca -- An Open-Source Collection of Medical Conversational AI Models and Training Data [37.60056509129154]
大規模言語モデル(LLM)は、医療、診断、患者医療、教育を改善するためのかなりの約束を持っている。
しかし、患者のプライバシを保護するために、オンプレミスでデプロイできるオープンソースモデルが緊急に必要である。
本稿では、160,000以上のエントリからなる革新的なデータセットについて紹介する。
論文 参考訳(メタデータ) (2023-04-14T11:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。