論文の概要: DR. INFO at the Point of Care: A Prospective Pilot Study of Physician-Perceived Value of an Agentic AI Clinical Assistant
- arxiv url: http://arxiv.org/abs/2604.16346v2
- Date: Wed, 22 Apr 2026 13:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.913141
- Title: DR. INFO at the Point of Care: A Prospective Pilot Study of Physician-Perceived Value of an Agentic AI Clinical Assistant
- Title(参考訳): DR. INFO : エージェントAI臨床助手の医師が知覚する価値の先進的パイロット研究
- Authors: Rogerio Corga Da Silva, Miguel Romano, Tiago Mendes, Marta Isidoro, Sandhanakrishnan Ravichandran, Shivesh Kumar, Michiel van der Heijden, Olivier Fail, Valentine Emmanuel Gnanapragasam,
- Abstract要約: 本研究は, 医師が知覚する時間効率, 意思決定支援, 満足度を, DR. INFOを用いて評価することを目的とした。
ポルトガルの医療機関に勤務する29人の医師と医学生がDR. INFOを2週間以内に5日間にわたり使用した。
- 参考スコア(独自算出の注目度): 2.214814572670688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Clinical documentation and information retrieval consume over half of physicians working hours, contributing to cognitive overload and burnout. While artificial intelligence offers a potential solution, concerns over hallucinations and source reliability have limited adoption at the point of care. This study aimed to evaluate physician-perceived time efficiency, decision-making support, and satisfaction with DR. INFO, an agentic AI clinical assistant, in routine clinical practice. Methodology: In this prospective, single-arm, pilot feasibility study, 29 physicians and medical students across multiple specialties in Portuguese healthcare institutions used DR. INFO v1.0 over five working days within a two-week period. Outcomes were assessed via daily Likert-scale evaluations (time saving and decision support) and a final Net Promoter Score (NPS). Non-parametric methods were used throughout, with bootstrap confidence intervals (CIs) and sensitivity analysis to address non-response. Results: Physicians reported high perceived time saving (mean = 4.27/5; 95% CI = 3.97-4.57) and decision support (mean = 4.16/5; 95% CI = 3.86-4.45), with ratings stable across the five-day study window. Among the 16 (55%) participants who completed the final evaluation, the NPS was 81.2, with no detractors; sensitivity analysis indicated an NPS of 44.8 under conservative non-response assumptions. Conclusions: Physicians across specialties and career stages reported positive perceptions of DR. INFO for both time efficiency and clinical decision support within the study window. These findings are preliminary and should be confirmed in larger, controlled studies that include objective performance measures and independent accuracy verification.
- Abstract(参考訳): 背景: 臨床ドキュメントと情報検索は、医師の半数以上を労働時間に費やし、認知的過負荷とバーンアウトに寄与する。
人工知能は潜在的な解決策を提供するが、幻覚や情報源の信頼性に対する懸念は、注意点において限定的に採用されている。
本研究は, 医師が知覚する時間効率, 意思決定支援, 満足度を評価することを目的とした。
方法】ポルトガルの医療機関の複数の専門分野の医師29名と医学生29名を対象に,2週間の労働時間内に5日間にわたってDR. INFO v1.0を使用した。
結果は、毎日のQuat-scale評価(時間節約と意思決定支援)と最終ネットプロモータースコア(NPS)を通じて評価された。
非パラメトリック手法は、ブートストラップ信頼区間(CI)と非応答に対処するための感度分析を用いて、全期間にわたって使用された。
結果: 医師は高い認知時間節約(平均: 4.27/5; 95% CI = 3.97-4.57; 95% CI = 3.86-4.45)と意思決定支援(平均: 4.16/5; 95% CI = 3.86-4.45)を報告した。
最終評価を完了した16名 (55%) のうち, NPSは81.2名であり, 難治性は認められなかった。
結論: 専門職およびキャリア段階の医師は, DR. INFOの時間効率と臨床決定支援の両面で, 肯定的な認知を報告した。
これらの知見は予備的であり、客観的なパフォーマンス測定や独立した精度の検証を含む、より大きな制御された研究で確認する必要がある。
関連論文リスト
- Benchmarking Multi-turn Medical Diagnosis: Hold, Lure, and Self-Correction [72.89352076103889]
大規模言語モデル (LLM) は, 臨床情報がすべて一ターンで提供される場合に, 高い精度で診断を行う。
1,035例からなる高忠実多ターン診断ベンチマークであるMINTを導入する。
診断決定に大きな影響を及ぼす3つの永続的な行動パターンを明らかにする。
論文 参考訳(メタデータ) (2026-04-06T00:23:10Z) - Clinical Reasoning AI for Oncology Treatment Planning: A Multi-Specialty Case-Based Evaluation [0.7695487047291749]
アメリカのがん治療の80%以上が地域社会で行われている。
臨床医はゲノム学、ステージング、病理学、ガイドラインの変更を統合し、認知的負担を生み出す必要がある。
腫瘍治療計画作成のためのAI臨床推論プラットフォームであるOncoBrainについて検討した。
論文 参考訳(メタデータ) (2026-03-27T00:26:05Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - AI Workflow, External Validation, and Development in Eye Disease Diagnosis [5.940140611616894]
AIは診断精度が保証されるが、臨床および多様な集団の検証が不十分なため、現実の応用問題に直面している。
本研究は、年齢関連黄斑変性(AMD)診断と分類重症度に関するケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
論文 参考訳(メタデータ) (2024-09-23T15:01:09Z) - Towards Accurate Differential Diagnosis with Large Language Models [37.48155380562073]
LLM(Large Language Models)を利用した対話型インタフェースは、差分診断の側面をアシストし、自動化する新たな機会を提供する。
20人の臨床医が、ニューイングランド・ジャーナル・オブ・メディカル(New England Journal of Medicine)から入手した、302の挑戦的な現実世界の医療事例を評価した。
我々のLSMは,難治性症例の診断的推論と精度を向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-30T19:55:51Z) - Assessing the impact of emergency department short stay units using
length-of-stay prediction and discrete event simulation [1.0822676139724565]
救急部門から一般内科に入院した患者に対して,入院期間を予測する意思決定支援システムの構築を目指す。
我々は探索的データ分析を行い、最高の予測性能をもたらす属性を識別するために特徴選択手法を用いる。
論文 参考訳(メタデータ) (2023-08-04T22:26:02Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - COVID-Net Clinical ICU: Enhanced Prediction of ICU Admission for
COVID-19 Patients via Explainability and Trust Quantification [71.80459780697956]
患者臨床データに基づくICU入院予測のためのニューラルネットワークであるCOVID-Net Clinical ICUを紹介する。
提案されたCOVID-Net Clinical ICUは、1,925人のCOVID-19患者からなるシロ・リバネ病院の臨床データセットを使用して構築された。
定量的説明可能性戦略を用いたシステムレベルの洞察発見を行い,異なる臨床特徴の意思決定効果について検討した。
論文 参考訳(メタデータ) (2021-09-14T14:16:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。