論文の概要: Automating Adjudication of Cardiovascular Events Using Large Language Models
- arxiv url: http://arxiv.org/abs/2503.17222v1
- Date: Fri, 21 Mar 2025 15:25:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:58:32.527904
- Title: Automating Adjudication of Cardiovascular Events Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた心血管イベントの適応の自動化
- Authors: Sonish Sivarajkumar, Kimia Ameri, Chuqin Li, Yanshan Wang, Min Jiang,
- Abstract要約: 本稿では,Large Language Models (LLMs) を用いた臨床試験において,心血管イベントの適応を自動化する新しい枠組みを提案する。
心血管系イベント特異的臨床試験データを用いて、このフレームワークは、イベント抽出のためのF1スコアが0.82であり、適応のための精度が0.68である。
このアプローチは、臨床試験において、高品質で一貫した、監査可能な結果を維持しながら、適応時間とコストを大幅に削減する大きな可能性を示している。
- 参考スコア(独自算出の注目度): 3.7312896556790855
- License:
- Abstract: Cardiovascular events, such as heart attacks and strokes, remain a leading cause of mortality globally, necessitating meticulous monitoring and adjudication in clinical trials. This process, traditionally performed manually by clinical experts, is time-consuming, resource-intensive, and prone to inter-reviewer variability, potentially introducing bias and hindering trial progress. This study addresses these critical limitations by presenting a novel framework for automating the adjudication of cardiovascular events in clinical trials using Large Language Models (LLMs). We developed a two-stage approach: first, employing an LLM-based pipeline for event information extraction from unstructured clinical data and second, using an LLM-based adjudication process guided by a Tree of Thoughts approach and clinical endpoint committee (CEC) guidelines. Using cardiovascular event-specific clinical trial data, the framework achieved an F1-score of 0.82 for event extraction and an accuracy of 0.68 for adjudication. Furthermore, we introduce the CLEART score, a novel, automated metric specifically designed for evaluating the quality of AI-generated clinical reasoning in adjudicating cardiovascular events. This approach demonstrates significant potential for substantially reducing adjudication time and costs while maintaining high-quality, consistent, and auditable outcomes in clinical trials. The reduced variability and enhanced standardization also allow for faster identification and mitigation of risks associated with cardiovascular therapies.
- Abstract(参考訳): 心臓発作や脳卒中などの心血管イベントは、世界中の死亡率の主要な原因であり、臨床治験において綿密な監視と適応を必要としている。
このプロセスは、伝統的に臨床専門家が手動で行うもので、時間がかかり、リソースが集中し、レビュー間の変動が難しく、バイアスや臨床試験の進行を妨げる可能性がある。
本研究では,Large Language Models (LLMs) を用いた臨床試験において,循環器系イベントの適応を自動化する新しい枠組みを提案することにより,これらの限界に対処する。
まず、構造化されていない臨床データからイベント情報を抽出するためにLLMベースのパイプラインを使用し、次に、Tree of Thoughtsアプローチと臨床エンドポイント委員会(CEC)ガイドラインでガイドされたLLMベースの適応プロセスを用いて、2段階のアプローチを開発した。
心血管系イベント特異的臨床試験データを用いて、このフレームワークは、イベント抽出のためのF1スコアが0.82であり、適応のための精度が0.68である。
さらに,CLEARTスコア(CLEARTスコア)を導入し,心血管イベントの予測において,AIによる臨床推論の質を評価することを目的としている。
このアプローチは、臨床試験において、高品質で一貫した、監査可能な結果を維持しながら、適応時間とコストを大幅に削減する大きな可能性を示している。
多様性の低下と標準化の強化により、心血管療法に関連するリスクの迅速かつ緩和が可能となった。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Establishing Rigorous and Cost-effective Clinical Trials for Artificial Intelligence Models [18.240773244542474]
人工知能(AI)と医学における臨床実践の間には大きなギャップが残っている。
最先端および最先端のAIモデル評価は、医療データセットの研究室研究や、患者中心または患者中心のコントロールを持たない直接臨床試験に限られる。
臨床実習におけるAIモデルの厳格かつ費用対効果評価手法の重要性を初めて強調する。
論文 参考訳(メタデータ) (2024-07-11T14:37:08Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Language Interaction Network for Clinical Trial Approval Estimation [37.60098683485169]
本稿では,言語相互作用ネットワーク(LINT, Language Interaction Network)について紹介する。
臨床治験の3段階にわたって厳格にLINTを試験し,ROC-AUCスコアは0.770,0.740,0.748となった。
論文 参考訳(メタデータ) (2024-04-26T14:50:59Z) - TrialDura: Hierarchical Attention Transformer for Interpretable Clinical Trial Duration Prediction [19.084936647082632]
マルチモーダルデータを用いて臨床試験期間を推定する機械学習に基づくTrialDuraを提案する。
バイオメディカルコンテキストに特化されたBio-BERT埋め込みにエンコードして,より深く,より関連するセマンティック理解を提供する。
提案モデルでは, 平均絶対誤差(MAE)が1.04年, 根平均二乗誤差(RMSE)が1.39年であった。
論文 参考訳(メタデータ) (2024-04-20T02:12:59Z) - AutoTrial: Prompting Language Models for Clinical Trial Design [53.630479619856516]
本稿では,言語モデルを用いた臨床検査基準の設計を支援するAutoTrialという手法を提案する。
70K以上の臨床試験で、AutoTrialが高品質な基準テキストを生成することが確認された。
論文 参考訳(メタデータ) (2023-05-19T01:04:16Z) - Machine Learning to Support Triage of Children at Risk for Epileptic
Seizures in the Pediatric Intensive Care Unit [5.708335717084799]
小児集中治療室(PICU)に入院した小児はてんかん発作が比較的多い
PICU内の発作の危険と判断された小児は、連続脳波(cEEG)を用いてモニタリングされる
本研究の目的は、重篤児の発作リスク評価を改善するためのコンピュータ支援ツールを開発することである。
論文 参考訳(メタデータ) (2022-05-11T10:24:58Z) - Clinical Temporal Relation Extraction with Probabilistic Soft Logic
Regularization and Global Inference [50.029659413650194]
既存のメソッドは、高価な機能エンジニアリングを必要とするか、イベント間のグローバルな依存関係をモデル化できない。
本稿では,確率論的ソフト論理規則化とグローバル推論を用いた新しい臨床時間緩和法を提案する。
論文 参考訳(メタデータ) (2020-12-16T08:23:03Z) - MIA-Prognosis: A Deep Learning Framework to Predict Therapy Response [58.0291320452122]
本稿では,患者の予後と治療反応を予測するための統合型深層学習手法を提案する。
我々は,マルチモーダル非同期時系列分類タスクとして,確率モデリングを定式化する。
我々の予測モデルは、長期生存の観点から、低リスク、高リスクの患者をさらに階層化する可能性がある。
論文 参考訳(メタデータ) (2020-10-08T15:30:17Z) - Prediction of the onset of cardiovascular diseases from electronic
health records using multi-task gated recurrent units [51.14334174570822]
本稿では,電子カルテから心血管イベントを予測するための注意機構を備えたマルチタスク・リカレントニューラルネットワークを提案する。
提案手法は、NHS Foundation Trustの5年間のデータを用いて、標準的な臨床リスク予測器(QRISK)と機械学習の代替手段と比較される。
論文 参考訳(メタデータ) (2020-07-16T17:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。