論文の概要: Accelerating Clinical Evidence Synthesis with Large Language Models
- arxiv url: http://arxiv.org/abs/2406.17755v2
- Date: Mon, 28 Oct 2024 22:41:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:37:17.690710
- Title: Accelerating Clinical Evidence Synthesis with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた臨床エビデンス生成の高速化
- Authors: Zifeng Wang, Lang Cao, Benjamin Danek, Qiao Jin, Zhiyong Lu, Jimeng Sun,
- Abstract要約: 本稿では,人間とAIのコラボレーションを促進するための生成人工知能パイプラインであるTrialMindを紹介する。
TrialMindは、検索、スクリーニング、データ抽出タスクを横断的に拡張する。
人間の専門家は、GPT-4よりもTrialMindの出力を62.5%から100%のケースで好んだ。
- 参考スコア(独自算出の注目度): 28.002870749019035
- License:
- Abstract: Synthesizing clinical evidence largely relies on systematic reviews of clinical trials and retrospective analyses from medical literature. However, the rapid expansion of publications presents challenges in efficiently identifying, summarizing, and updating clinical evidence. Here, we introduce TrialMind, a generative artificial intelligence (AI) pipeline for facilitating human-AI collaboration in three crucial tasks for evidence synthesis: study search, screening, and data extraction. To assess its performance, we chose published systematic reviews to build the benchmark dataset, named TrialReviewBench, which contains 100 systematic reviews and the associated 2,220 clinical studies. Our results show that TrialMind excels across all three tasks. In study search, it generates diverse and comprehensive search queries to achieve high recall rates (Ours 0.711-0.834 v.s. Human baseline 0.138-0.232). For study screening, TrialMind surpasses traditional embedding-based methods by 30% to 160%. In data extraction, it outperforms a GPT-4 baseline by 29.6% to 61.5%. We further conducted user studies to confirm its practical utility. Compared to manual efforts, human-AI collaboration using TrialMind yielded a 71.4% recall lift and 44.2% time savings in study screening and a 23.5% accuracy lift and 63.4% time savings in data extraction. Additionally, when comparing synthesized clinical evidence presented in forest plots, medical experts favored TrialMind's outputs over GPT-4's outputs in 62.5% to 100% of cases. These findings show the promise of LLM-based approaches like TrialMind to accelerate clinical evidence synthesis via streamlining study search, screening, and data extraction from medical literature, with exceptional performance improvement when working with human experts.
- Abstract(参考訳): 臨床証拠の合成は、臨床治験の体系的レビューと医学文献の振り返り分析に大きく依存している。
しかし、出版物の急速な拡大は、効果的に臨床証拠を特定し、要約し、更新することの難しさを示している。
本稿では、人間とAIのコラボレーションを促進するための生成人工知能(AI)パイプラインであるTrialMindについて、エビデンス合成のための3つの重要なタスクとして、探索、スクリーニング、データ抽出について紹介する。
その性能を評価するために、100の体系的レビューと関連する2,220の臨床研究を含むTrialReviewBenchというベンチマークデータセットを構築するために、システマティックレビューを公開しました。
その結果,TrialMindは3つのタスクにまたがって優れていることがわかった。
調査検索では,高いリコール率を達成するために多種多様な検索クエリを生成する(Ours 0.711-0.834 v.s. Human Baseline 0.138-0.232)。
調査スクリーニングでは、TrialMindは従来の埋め込みベースの手法を30%から160%上回っている。
データ抽出では、GPT-4ベースラインを29.6%から61.5%上回る。
また,その実用性を確認するためにユーザスタディも実施した。
手作業と比較して、TrialMindを使った人間とAIのコラボレーションは71.4%のリコールリフトと44.2%のタイムセーブ、23.5%の精度リフト、63.4%のデータ抽出を達成した。
さらに、森林計画で提示された合成された臨床証拠を比較する際、医療専門家は、GPT-4の出力の62.5%から100%のケースで、TrialMindの出力を好んだ。
これらの結果から,TrialMindのようなLCMベースのアプローチが,医学文献からの検索,スクリーニング,データ抽出の合理化を通じて臨床エビデンス生成を加速し,ヒトの専門家と共同で作業する際の優れたパフォーマンス向上を実現することが示唆された。
関連論文リスト
- End-To-End Clinical Trial Matching with Large Language Models [0.6151041580858937]
大言語モデル(LLM)を用いた臨床試験のためのエンドツーエンドパイプラインを提案する。
本研究は,93.3%の症例において関連する候補試験を同定し,88.0%の予備的精度を達成している。
私たちの完全なエンドツーエンドパイプラインは、自律的または人間の監督の下で運用することができ、オンコロジーに限定されません。
論文 参考訳(メタデータ) (2024-07-18T12:36:26Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - De-identification of clinical free text using natural language
processing: A systematic review of current approaches [48.343430343213896]
自然言語処理は、その非識別プロセスの自動化の可能性を繰り返し示してきた。
本研究の目的は,過去13年間に臨床自由テキストの非識別化が進展したことを示す体系的な証拠を提供することである。
論文 参考訳(メタデータ) (2023-11-28T13:20:41Z) - Investigating Deep-Learning NLP for Automating the Extraction of
Oncology Efficacy Endpoints from Scientific Literature [0.0]
我々は,論文中のテキストから有効終端を抽出するフレームワークを開発し,最適化した。
我々の機械学習モデルは、有効性エンドポイントに関連する25のクラスを予測し、高いF1スコアを得る。
論文 参考訳(メタデータ) (2023-11-03T14:01:54Z) - Matching Patients to Clinical Trials with Large Language Models [29.265158319106604]
本稿では,患者間マッチングを支援するLLMフレームワークTrialGPTを紹介する。
患者注記が与えられた場合、TrialGPTは基準に基づいて患者の適性を予測する。
公用コホート184例を対象に,TrialGPTの試験レベル予測性能について検討した。
論文 参考訳(メタデータ) (2023-07-27T17:56:56Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - ANOVA-based Automatic Attribute Selection and a Predictive Model for
Heart Disease Prognosis [8.258177970935085]
本研究では,分散分析(ANOVA)とドメインエキスパートの知識を融合した情報融合手法を提案する。
提案手法は、平均平均精度99.2%、平均平均AUC97.9%を達成することができる。
論文 参考訳(メタデータ) (2022-07-30T19:29:18Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z) - HINT: Hierarchical Interaction Network for Trial Outcome Prediction
Leveraging Web Data [56.53715632642495]
臨床試験は、有効性、安全性、または患者採用の問題により、不確実な結果に直面する。
本稿では,より一般的な臨床試験結果予測のための階層型Interaction Network(HINT)を提案する。
論文 参考訳(メタデータ) (2021-02-08T15:09:07Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。