論文の概要: The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology
- arxiv url: http://arxiv.org/abs/2605.26346v1
- Date: Mon, 25 May 2026 21:43:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.476533
- Title: The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology
- Title(参考訳): 日用量:放射線腫瘍学における臨床要約と試行識別のためのワークフロー統合大規模言語モデル自動化
- Authors: Jason Holmes, Federico Mastroleo, Mariana Borras-Osorio, Srinivas Seetamsetty, Satomi Shiraishi, Mirek Fatyga, Judy C. Boughey, Cornelius A. Thiels, William G. Breen, Daniel J. Ma, Daniel K. Ebner, David M. Routman, Brady S. Laughlin, Carlos E. Vargas, Samir H. Patel, Sujay A. Vora, Nadia N. Laack, Andrew Y. K. Foong, Wei Liu, Mark R. Waddle,
- Abstract要約: デイリー・ドーズ (Daily Dose) は、定期的な放射線腫瘍学の実践に統合された、自動的な臨床要約と臨床・臨床的同定システムである。
システム展開1ヶ月後に実施したクロスセクション匿名臨床検査による混合メソドの評価
全体の満足度は時間節約の認知と正の相関を示した。
- 参考スコア(独自算出の注目度): 3.261345234010411
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: To describe the design and early clinical evaluation of The Daily Dose (TDD), an LLM-driven, automated clinical summarization and clinical-trial identification system integrated into routine radiation oncology practice. Design: Mixed-methods evaluation using a cross-sectional, anonymous clinician survey administered after 1 month of system deployment. Exposure: Daily automated delivery of physician-specific email summaries generated using RadOnc-GPT, including patient schedules, concise EHR-derived clinical-status summaries, and automated identification of potentially relevant clinical trials for new or consult visits. Main Outcomes and Measures: Primary outcomes included self-reported usability, satisfaction, perceived usefulness, perceived impact on workflow, time savings, and intention for continued use. Internal consistency reliability was assessed using Cronbach's $α$. Results: Among 55 respondents, 52 (94.5\%) worked in radiation oncology, and 38 (69.1\%) were attending physicians. Most participants (83.6\%) reported using TDD daily or several times per week. Mean (SD) scores were 3.89 (1.04) for usability and satisfaction, 3.43 (1.24) for perceived usefulness, and 3.80 (1.17) for impact and future use (5-point Likert scale). Overall satisfaction was positively associated with perceived time savings ($p < .001$). Participants reported variable time savings, with 27\% estimating $\geq 10$ minutes saved per day. The questionnaire demonstrated excellent internal consistency (overall Cronbach's $α$ = 0.97).
- Abstract(参考訳): 目的: 日常放射線腫瘍学の実践に組み込まれたLLM駆動型自動臨床要約システムであるThe Daily Dose(TDD)の設計と早期臨床評価について述べる。
設計: 1ヶ月のシステム展開後, 横断的, 匿名臨床検査による混合メソドの評価を行った。
露出:RadOnc-GPTを用いた医師固有のメール要約の自動配信、患者スケジュール、EHR由来の簡潔な臨床統計要約、新規または相談訪問の潜在的臨床試験の自動識別を含む。
主な成果と尺度: 自己報告されたユーザビリティ、満足度、有用性、ワークフローに対する知覚的影響、時間の節約、継続的な使用への意図。
内部整合性の信頼性はCronbachの$α$を用いて評価された。
結果: 55名中52名(94.5\%),38名(69.1\%)が入院医であった。
ほとんどの参加者 (83.6\%) は毎日、あるいは週に数回TDDを使っていると報告しています。
平均(SD)スコアは、ユーザビリティと満足度は3.89(1.04)、有用性は3.43(1.24)、インパクトと将来の使用は3.80(1.17)であった。
全体の満足度は、知覚された時間節約(p < .001$)と関連していた。
参加者は可変時間の節約を報告し、27\%は1日あたり$\geq 10$ minutesを見積もった。
アンケートでは内部の整合性が良好であった(Cronbachの$α$ = 0.97)。
関連論文リスト
- PhysicianBench: Evaluating LLM Agents in Real-World EHR Environments [5.310457397170786]
既存の医療エージェントベンチマークは、主に静的な知識のリコール、単一ステップのアトミックアクション、環境に対する実行を検証せずにアクションインテントに焦点を当てている。
PhysicianBenchは、プライマリケアと医師の実際のケースから適応した100のロングホライゾンタスクで構成されている。
各タスクは構造化されたチェックポイント(ベンチマーク全体で合計670)に分解される。
最高のパフォーマンスモデルはわずか46%の成功率(pass@1)であり、オープンソースモデルは19%に達する。
論文 参考訳(メタデータ) (2026-05-04T05:32:25Z) - Benchmarking Multi-turn Medical Diagnosis: Hold, Lure, and Self-Correction [72.89352076103889]
大規模言語モデル (LLM) は, 臨床情報がすべて一ターンで提供される場合に, 高い精度で診断を行う。
1,035例からなる高忠実多ターン診断ベンチマークであるMINTを導入する。
診断決定に大きな影響を及ぼす3つの永続的な行動パターンを明らかにする。
論文 参考訳(メタデータ) (2026-04-06T00:23:10Z) - Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - DR. INFO at the Point of Care: A Prospective Pilot Study of Physician-Perceived Value of an Agentic AI Clinical Assistant [2.214814572670688]
本研究は, 医師が知覚する時間効率, 意思決定支援, 満足度を, DR. INFOを用いて評価することを目的とした。
ポルトガルの医療機関に勤務する29人の医師と医学生がDR. INFOを2週間以内に5日間にわたり使用した。
論文 参考訳(メタデータ) (2026-03-16T13:09:14Z) - Human-Guided Agentic AI for Multimodal Clinical Prediction: Lessons from the AgentDS Healthcare Benchmark [0.5066646435185324]
エージェントAIの人的指導がマルチモーダルな臨床予測をどのように改善するかを検討する。
本研究は,30日間の入院予測,救急医療費予測,退院準備状況評価という3つのベンチマーク課題に対するアプローチを提案する。
医療領域全体では5位にランクインし, 退院準備作業では3位にランクインした。
論文 参考訳(メタデータ) (2026-02-23T04:37:45Z) - LiveClin: A Live Clinical Benchmark without Leakage [50.45415584327275]
LiveClinは、実際の臨床実践を近似するために設計されたライブベンチマークである。
本研究は,患者を臨床経過全体にわたる複雑なマルチモーダルな評価シナリオに転換する。
LiveClin上で26のモデルを評価すると、これらの実世界のシナリオの難しさが明らかとなり、最高性能のモデルではケース精度が35.7%に達した。
論文 参考訳(メタデータ) (2026-02-18T03:59:46Z) - Patient-Centered Summarization Framework for AI Clinical Summarization: A Mixed-Methods Design [23.21070690395588]
患者中心サマリ(PCS)における人工知能(AI)臨床要約タスクの新しい標準を提案する。
本研究の目的は,患者価値を捉え,臨床的有用性を確保するためのPCS作成フレームワークを開発することである。
5つのオープンソース LLM がゼロショットプロンプトと少数ショットプロンプトを使用して72のコンサルテーションの要約を生成する。
論文 参考訳(メタデータ) (2025-10-31T15:08:18Z) - Leveraging AI to Accelerate Medical Data Cleaning: A Comparative Study of AI-Assisted vs. Traditional Methods [3.2666593942117688]
Octoziは、大規模な言語モデルとドメイン固有性を組み合わせて医療データレビューを変換する人工知能支援プラットフォームである。
代表的な第3相腫瘍学試験の経済分析により、潜在的コスト削減は510万ドルであることが判明した。
論文 参考訳(メタデータ) (2025-08-07T15:49:32Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Human Evaluation and Correlation with Automatic Metrics in Consultation
Note Generation [56.25869366777579]
近年,機械学習モデルによる臨床相談ノートの作成が急速に進んでいる。
5人の臨床医が57件のモック・コンサルテーションを聴き、自作のノートを書き、自動的に生成されたノートを編集し、全てのエラーを抽出する、広範囲にわたる人的評価研究を行った。
単純な文字ベースのLevenshtein距離測定は、BertScoreのような一般的なモデルベースの測定値に比較して、同等に動作します。
論文 参考訳(メタデータ) (2022-04-01T14:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。