論文の概要: TrialPanorama: Database and Benchmark for Systematic Review and Design of Clinical Trials
- arxiv url: http://arxiv.org/abs/2505.16097v1
- Date: Thu, 22 May 2025 00:58:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.954061
- Title: TrialPanorama: Database and Benchmark for Systematic Review and Design of Clinical Trials
- Title(参考訳): TrialPanorama: 臨床試験のシステムレビューと設計のためのデータベースとベンチマーク
- Authors: Zifeng Wang, Qiao Jin, Jiacheng Lin, Junyi Gao, Jathurshan Pradeepkumar, Pengcheng Jiang, Benjamin Danek, Zhiyong Lu, Jimeng Sun,
- Abstract要約: 我々は15のグローバルソースから1,657,476の臨床試験記録からなる大規模構造化データベースTrialPanoramaを紹介した。
データベースは、トライアルのセットアップ、介入、条件、バイオマーカー、結果など、トライアルの設計と実行の重要な側面をキャプチャする。
その実用性を実証するために、TrialPanoramaデータベースから直接ベンチマークタスクのスイートを導出する。
- 参考スコア(独自算出の注目度): 27.101541130364343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing artificial intelligence (AI) for vertical domains requires a solid data foundation for both training and evaluation. In this work, we introduce TrialPanorama, a large-scale, structured database comprising 1,657,476 clinical trial records aggregated from 15 global sources. The database captures key aspects of trial design and execution, including trial setups, interventions, conditions, biomarkers, and outcomes, and links them to standard biomedical ontologies such as DrugBank and MedDRA. This structured and ontology-grounded design enables TrialPanorama to serve as a unified, extensible resource for a wide range of clinical trial tasks, including trial planning, design, and summarization. To demonstrate its utility, we derive a suite of benchmark tasks directly from the TrialPanorama database. The benchmark spans eight tasks across two categories: three for systematic review (study search, study screening, and evidence summarization) and five for trial design (arm design, eligibility criteria, endpoint selection, sample size estimation, and trial completion assessment). The experiments using five state-of-the-art large language models (LLMs) show that while general-purpose LLMs exhibit some zero-shot capability, their performance is still inadequate for high-stakes clinical trial workflows. We release TrialPanorama database and the benchmark to facilitate further research on AI for clinical trials.
- Abstract(参考訳): 垂直領域のための人工知能(AI)の開発には、トレーニングと評価の両方にしっかりとしたデータ基盤が必要である。
本研究では,15のグローバルソースから収集した1,657,476の臨床試験記録からなる大規模構造化データベースTrialPanoramaを紹介する。
このデータベースは、トライアル・セットアップ、介入、条件、バイオマーカー、結果など、トライアル・デザインと実行の重要な側面を捉え、それらをドラッグバンクやメドドラのような標準的なバイオメディカル・オントロジーにリンクする。
この構造的かつオントロジー的な設計により、トライアルパノラマは、治験計画、設計、要約を含む幅広い臨床試験タスクのための統一的で拡張可能なリソースとして機能することができる。
その有用性を実証するために、TrialPanoramaデータベースから直接ベンチマークタスクのスイートを導出する。
このベンチマークは、2つのカテゴリにまたがる8つのタスクにまたがっている。3つは体系的なレビュー(スタディ検索、研究スクリーニング、エビデンス要約)、5つはトライアル設計(武器設計、適性基準、エンドポイントの選択、サンプルサイズ推定、試行完了評価)である。
LLM(State-of-the-art large language model)を用いた5つの実験では、汎用LLMはゼロショット能力を示すが、その性能は高い評価の臨床試験ワークフローには不十分であることが示されている。
我々はTrialPanoramaデータベースとベンチマークを公開し、臨床試験のためのAIのさらなる研究を促進する。
関連論文リスト
- TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Panacea: A foundation model for clinical trial search, summarization, design, and recruitment [29.099676641424384]
パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
論文 参考訳(メタデータ) (2024-06-25T21:29:25Z) - Scaling Clinical Trial Matching Using Large Language Models: A Case
Study in Oncology [17.214664001970526]
大規模言語モデル(LLM)を用いた臨床治験マッチングのスケーリングに関する系統的研究を行う。
本研究は、米国の大規模医療ネットワークにおいて、現在試験展開中の臨床試験マッチングシステムに基礎を置いている。
論文 参考訳(メタデータ) (2023-08-04T07:51:15Z) - PyTrial: Machine Learning Software and Benchmark for Clinical Trial
Applications [49.69824178329405]
PyTrialは、臨床試験の設計と運用のための一連の機械学習アルゴリズムのベンチマークとオープンソース実装を提供する。
患者結果予測,臨床試験サイト選択,トライアル結果予測,患者と臨床のマッチング,トライアル類似性検索,合成データ生成など,6つのタスクにわたる臨床試験のための34のMLアルゴリズムを網羅的に検討した。
PyTrialは、データローディング、モデル仕様、モデルトレーニング、モデル評価という、単純な4段階のプロセスで各タスクを定義します。
論文 参考訳(メタデータ) (2023-06-06T21:19:03Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Clinical trial site matching with improved diversity using fair policy
learning [56.01170456417214]
我々は,臨床治験記述を潜在的な試験現場のランクリストにマッピングするモデルを学習する。
既存のフェアネスフレームワークとは異なり、各トライアルサイトのグループメンバーシップは非バイナリである。
このようなマルチグループメンバーシップシナリオに対処するために、人口統計学的妥当性に基づく公平性基準を提案する。
論文 参考訳(メタデータ) (2022-04-13T16:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。