論文の概要: Empowering Clinical Trial Design through AI: A Randomized Evaluation of PowerGPT
- arxiv url: http://arxiv.org/abs/2509.12471v1
- Date: Mon, 15 Sep 2025 21:35:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.777366
- Title: Empowering Clinical Trial Design through AI: A Randomized Evaluation of PowerGPT
- Title(参考訳): AIによる臨床試験設計の強化:PowerGPTのランダムな評価
- Authors: Yiwen Lu, Lu Li, Dazheng Zhang, Xinyao Jian, Tingyin Wang, Siqi Chen, Yuqing Lei, Jiayi Tong, Zhaohan Xi, Haitao Chu, Chongliang Luo, Alexis Ogdie, Brian Athey, Alparslan Turan, Michael Abramoff, Joseph C Cappelleri, Hua Xu, Yun Lu, Jesse Berlin, Daniel I. Sessler, David A. Asch, Xiaoqian Jiang, Yong Chen,
- Abstract要約: 我々は,大規模言語モデル(LLM)を統合したAIによるシステムであるPowerGPTを導入し,試験設計におけるテスト選択とサンプルサイズ推定を自動化する。
ランダム化試験では、PowerGPTはタスク完了率(テスト選択で99.3%対88.9%)と精度(サンプルサイズ推定で94.1%対55.4%)を著しく改善した。
PowerGPTはスケーラブルなAI駆動型アプローチであり、臨床研究の統計分析において、効率、精度を高める。
- 参考スコア(独自算出の注目度): 21.757090386937634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sample size calculations for power analysis are critical for clinical research and trial design, yet their complexity and reliance on statistical expertise create barriers for many researchers. We introduce PowerGPT, an AI-powered system integrating large language models (LLMs) with statistical engines to automate test selection and sample size estimation in trial design. In a randomized trial to evaluate its effectiveness, PowerGPT significantly improved task completion rates (99.3% vs. 88.9% for test selection, 99.3% vs. 77.8% for sample size calculation) and accuracy (94.1% vs. 55.4% in sample size estimation, p < 0.001), while reducing average completion time (4.0 vs. 9.3 minutes, p < 0.001). These gains were consistent across various statistical tests and benefited both statisticians and non-statisticians as well as bridging expertise gaps. Already under deployment across multiple institutions, PowerGPT represents a scalable AI-driven approach that enhances accessibility, efficiency, and accuracy in statistical power analysis for clinical research.
- Abstract(参考訳): 電力分析のためのサンプルサイズ計算は臨床研究やトライアル設計において重要であるが、その複雑さと統計的専門知識への依存は多くの研究者にとって障壁となっている。
本稿では,大規模言語モデル(LLM)と統計エンジンを統合し,試験設計におけるテスト選択とサンプルサイズ推定を自動化するAIシステムであるPowerGPTを紹介する。
ランダム化試験において、PowerGPTはタスク完了率(テスト選択では99.3%対88.9%、サンプルサイズ計算では99.3%対77.8%)と精度(サンプルサイズ推定では94.1%対55.4%、サンプルサイズ推定ではp < 0.001)を大幅に改善し、平均完了時間を短縮した(4.0対9.3分、p < 0.001)。
これらの利得は様々な統計テストで一貫しており、統計学者と非統計学者の両方に恩恵を与え、専門的なギャップを埋めた。
既に複数の機関に展開されているPowerGPTは、臨床研究のための統計パワー分析におけるアクセシビリティ、効率、精度を高めるスケーラブルなAI駆動のアプローチである。
関連論文リスト
- A Clinician-Friendly Platform for Ophthalmic Image Analysis Without Technical Barriers [51.45596445363302]
GlobeReadyはクリニックフレンドリーなAIプラットフォームで、再トレーニング、微調整、技術専門知識の必要性なしに、基礎疾患の診断を可能にする。
光コヒーレンス・トモグラフィー(OCT)スキャンを用いて、カラー・ファンドス写真(CPF)を用いた11のファンドス病(93.9-98.5%)と15のファンドス病(87.2-92.7%)の精度を示した。
トレーニングなしのローカル機能拡張を活用することで、GlobeReadyプラットフォームは、センターや人口間のドメインシフトを効果的に軽減する。
論文 参考訳(メタデータ) (2025-04-22T14:17:22Z) - Accelerating Clinical Evidence Synthesis with Large Language Models [28.002870749019035]
本稿では,人間とAIのコラボレーションを促進するための生成人工知能パイプラインであるTrialMindを紹介する。
TrialMindは、検索、スクリーニング、データ抽出タスクを横断的に拡張する。
人間の専門家は、GPT-4よりもTrialMindの出力を62.5%から100%のケースで好んだ。
論文 参考訳(メタデータ) (2024-06-25T17:41:52Z) - Early prediction of onset of sepsis in Clinical Setting [0.8471078314535754]
教師付き学習手法が採用され、列車データセットの80%をXGBoostモデルでトレーニングした。
モデルは、トレーニング期間中に全く見えなかった予測データに基づいて検証された。
このモデルでは、試験データでは0.494点、予測データでは0.378点の正常化ユーティリティスコアが得られた。
論文 参考訳(メタデータ) (2024-02-05T19:58:40Z) - A Weighted Prognostic Covariate Adjustment Method for Efficient and
Powerful Treatment Effect Inferences in Randomized Controlled Trials [0.28087862620958753]
ランダム化制御試験(RCT)の重要な課題は、効率的な推定器と治療効果の強力な試験を得られる統計手法を特定することである。
過去の制御データに基づいて生成AIアルゴリズムを訓練することにより、RDT参加者のためのデジタルツインジェネレータ(DTG)を構築することができる。
DTGは、RTT参加者の潜在的制御結果の確率分布を生成する。
論文 参考訳(メタデータ) (2023-09-25T16:14:13Z) - Matching Patients to Clinical Trials with Large Language Models [29.265158319106604]
本稿では,大規模言語モデルを用いたゼロショット患者間マッチングのためのエンドツーエンドフレームワークTrialGPTを紹介する。
TrialGPTは3つのモジュールから構成されており、まず大規模フィルタリングを行い、候補トライアル(TrialGPT-Retrieval)を検索し、次に基準レベルの患者資格(TrialGPT-Matching)を予測し、最終的にトライアルレベルのスコア(TrialGPT-Ranking)を生成する。
論文 参考訳(メタデータ) (2023-07-27T17:56:56Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Using Sampling to Estimate and Improve Performance of Automated Scoring
Systems with Guarantees [63.62448343531963]
本稿では,既存のパラダイムを組み合わせることで,人間が知能的に収集する応答をサンプリングする手法を提案する。
比較的少ない予算で精度(平均19.80%)と二次重み付きカッパ(平均25.60%)の顕著な増加を観察した。
論文 参考訳(メタデータ) (2021-11-17T05:00:51Z) - Differential privacy and robust statistics in high dimensions [49.50869296871643]
高次元Propose-Test-Release (HPTR) は指数的メカニズム、頑健な統計、Propose-Test-Release メカニズムという3つの重要なコンポーネントの上に構築されている。
本論文では,HPTRが複数のシナリオで最適サンプル複雑性をほぼ達成していることを示す。
論文 参考訳(メタデータ) (2021-11-12T06:36:40Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。