論文の概要: Panacea: A foundation model for clinical trial search, summarization, design, and recruitment
- arxiv url: http://arxiv.org/abs/2407.11007v1
- Date: Tue, 25 Jun 2024 21:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 12:29:47.749774
- Title: Panacea: A foundation model for clinical trial search, summarization, design, and recruitment
- Title(参考訳): Panacea:臨床治験検索、要約、設計、採用のための基礎モデル
- Authors: Jiacheng Lin, Hanwen Xu, Zifeng Wang, Sheng Wang, Jimeng Sun,
- Abstract要約: パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
- 参考スコア(独自算出の注目度): 29.099676641424384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical trials are fundamental in developing new drugs, medical devices, and treatments. However, they are often time-consuming and have low success rates. Although there have been initial attempts to create large language models (LLMs) for clinical trial design and patient-trial matching, these models remain task-specific and not adaptable to diverse clinical trial tasks. To address this challenge, we propose a clinical trial foundation model named Panacea, designed to handle multiple tasks, including trial search, trial summarization, trial design, and patient-trial matching. We also assemble a large-scale dataset, named TrialAlign, of 793,279 trial documents and 1,113,207 trial-related scientific papers, to infuse clinical knowledge into the model by pre-training. We further curate TrialInstruct, which has 200,866 of instruction data for fine-tuning. These resources enable Panacea to be widely applicable for a range of clinical trial tasks based on user requirements. We evaluated Panacea on a new benchmark, named TrialPanorama, which covers eight clinical trial tasks. Our method performed the best on seven of the eight tasks compared to six cutting-edge generic or medicine-specific LLMs. Specifically, Panacea showed great potential to collaborate with human experts in crafting the design of eligibility criteria, study arms, and outcome measures, in multi-round conversations. In addition, Panacea achieved 14.42% improvement in patient-trial matching, 41.78% to 52.02% improvement in trial search, and consistently ranked at the top for five aspects of trial summarization. Our approach demonstrates the effectiveness of Panacea in clinical trials and establishes a comprehensive resource, including training data, model, and benchmark, for developing clinical trial foundation models, paving the path for AI-based clinical trial development.
- Abstract(参考訳): 臨床試験は、新しい薬物、医療機器、治療の開発において基礎となる。
しかし、しばしば時間がかかり、成功率も低い。
臨床試験設計と患者と臨床の整合性のための大規模言語モデル(LLM)の初期の試みはあったが、これらのモデルはタスク固有であり、多様な臨床試験タスクには適応できない。
この課題に対処するため,Panaceaという名前の臨床試験基礎モデルを提案する。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる大規模データセットTrialAlignを収集し,臨床知識を事前学習によりモデルに注入した。
さらに、微調整のための200,866個の命令データを持つTrialInstructをキュレートする。
これらのリソースにより、パナセアは、ユーザ要求に基づいた様々な臨床試験タスクに広く適用できる。
パナセアをTrialPanoramaという,8つの臨床試験タスクをカバーする新しいベンチマークで評価した。
提案手法は, 最先端のジェネリックLLMと医用LLMの7つと比較して, 8つのタスクのうち7つで最善を尽くした。
特に、パナセアは、多面的な会話において、適格基準の設計、武器の研究、結果測定を行う際に、人間の専門家と協力する大きな可能性を示した。
さらに、パナセアは14.42%の改善、41.78%から52.02%の改善を達成し、裁判要約の5つの面で一貫してトップにランクインした。
本研究は, 臨床治験におけるパナセアの有効性を実証し, 臨床基礎モデル開発のためのトレーニングデータ, モデル, ベンチマークなどの総合的な資源を確立し, 臨床治験への道を開く。
関連論文リスト
- TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - TrialDura: Hierarchical Attention Transformer for Interpretable Clinical Trial Duration Prediction [19.084936647082632]
マルチモーダルデータを用いて臨床試験期間を推定する機械学習に基づくTrialDuraを提案する。
バイオメディカルコンテキストに特化されたBio-BERT埋め込みにエンコードして,より深く,より関連するセマンティック理解を提供する。
提案モデルでは, 平均絶対誤差(MAE)が1.04年, 根平均二乗誤差(RMSE)が1.39年であった。
論文 参考訳(メタデータ) (2024-04-20T02:12:59Z) - PyTrial: Machine Learning Software and Benchmark for Clinical Trial
Applications [49.69824178329405]
PyTrialは、臨床試験の設計と運用のための一連の機械学習アルゴリズムのベンチマークとオープンソース実装を提供する。
患者結果予測,臨床試験サイト選択,トライアル結果予測,患者と臨床のマッチング,トライアル類似性検索,合成データ生成など,6つのタスクにわたる臨床試験のための34のMLアルゴリズムを網羅的に検討した。
PyTrialは、データローディング、モデル仕様、モデルトレーニング、モデル評価という、単純な4段階のプロセスで各タスクを定義します。
論文 参考訳(メタデータ) (2023-06-06T21:19:03Z) - AutoTrial: Prompting Language Models for Clinical Trial Design [53.630479619856516]
本稿では,言語モデルを用いた臨床検査基準の設計を支援するAutoTrialという手法を提案する。
70K以上の臨床試験で、AutoTrialが高品質な基準テキストを生成することが確認された。
論文 参考訳(メタデータ) (2023-05-19T01:04:16Z) - Improving Patient Pre-screening for Clinical Trials: Assisting
Physicians with Large Language Models [0.0]
LLM(Large Language Models)は臨床情報抽出や臨床推論に有効であることが示されている。
本稿では,患者の総合的医療プロファイルに基づく臨床治験の適性判定に医師を支援するために,インストラクションGPTを用いることを検討した。
論文 参考訳(メタデータ) (2023-04-14T21:19:46Z) - LeafAI: query generator for clinical cohort discovery rivaling a human
programmer [4.410832512630809]
我々は,データモデルに依存しないクエリを生成するシステムを開発した。
また、複雑な臨床試験の適格性基準に新たな論理的推論能力を提供する。
論文 参考訳(メタデータ) (2023-04-13T00:34:32Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Clinical trial site matching with improved diversity using fair policy
learning [56.01170456417214]
我々は,臨床治験記述を潜在的な試験現場のランクリストにマッピングするモデルを学習する。
既存のフェアネスフレームワークとは異なり、各トライアルサイトのグループメンバーシップは非バイナリである。
このようなマルチグループメンバーシップシナリオに対処するために、人口統計学的妥当性に基づく公平性基準を提案する。
論文 参考訳(メタデータ) (2022-04-13T16:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。