論文の概要: PyTrial: Machine Learning Software and Benchmark for Clinical Trial
Applications
- arxiv url: http://arxiv.org/abs/2306.04018v2
- Date: Thu, 5 Oct 2023 05:55:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 22:12:56.747312
- Title: PyTrial: Machine Learning Software and Benchmark for Clinical Trial
Applications
- Title(参考訳): pytrial: 臨床試験アプリケーションのための機械学習ソフトウェアとベンチマーク
- Authors: Zifeng Wang and Brandon Theodorou and Tianfan Fu and Cao Xiao and
Jimeng Sun
- Abstract要約: PyTrialは、臨床試験の設計と運用のための一連の機械学習アルゴリズムのベンチマークとオープンソース実装を提供する。
患者結果予測,臨床試験サイト選択,トライアル結果予測,患者と臨床のマッチング,トライアル類似性検索,合成データ生成など,6つのタスクにわたる臨床試験のための34のMLアルゴリズムを網羅的に検討した。
PyTrialは、データローディング、モデル仕様、モデルトレーニング、モデル評価という、単純な4段階のプロセスで各タスクを定義します。
- 参考スコア(独自算出の注目度): 49.69824178329405
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical trials are conducted to test the effectiveness and safety of
potential drugs in humans for regulatory approval. Machine learning (ML) has
recently emerged as a new tool to assist in clinical trials. Despite this
progress, there have been few efforts to document and benchmark ML4Trial
algorithms available to the ML research community. Additionally, the
accessibility to clinical trial-related datasets is limited, and there is a
lack of well-defined clinical tasks to facilitate the development of new
algorithms.
To fill this gap, we have developed PyTrial that provides benchmarks and
open-source implementations of a series of ML algorithms for clinical trial
design and operations. In this paper, we thoroughly investigate 34 ML
algorithms for clinical trials across 6 different tasks, including patient
outcome prediction, trial site selection, trial outcome prediction,
patient-trial matching, trial similarity search, and synthetic data generation.
We have also collected and prepared 23 ML-ready datasets as well as their
working examples in Jupyter Notebooks for quick implementation and testing.
PyTrial defines each task through a simple four-step process: data loading,
model specification, model training, and model evaluation, all achievable with
just a few lines of code. Furthermore, our modular API architecture empowers
practitioners to expand the framework to incorporate new algorithms and tasks
effortlessly. The code is available at https://github.com/RyanWangZf/PyTrial.
- Abstract(参考訳): 臨床試験は、規制の承認のためにヒトの潜在的な薬物の有効性と安全性をテストするために行われる。
機械学習(ML)は最近、臨床試験を支援する新しいツールとして登場した。
この進歩にもかかわらず、ML研究コミュニティで利用可能なML4Trialアルゴリズムを文書化し、ベンチマークする取り組みはほとんど行われていない。
さらに、臨床試験関連データセットへのアクセシビリティは制限されており、新しいアルゴリズムの開発を容易にするための明確な臨床タスクが欠如している。
このギャップを埋めるために、臨床試験の設計と運用のための一連のMLアルゴリズムのベンチマークとオープンソース実装を提供するPyTrialを開発した。
本稿では, 患者結果予測, 臨床試験サイト選択, 治験結果予測, 患者と臨床のマッチング, トライアル類似性検索, 合成データ生成の6つのタスクを対象とした, 34 ML アルゴリズムを徹底的に検討する。
また、高速な実装とテストのために、23のML対応データセットとJupyter Notebooksのワーキングサンプルを収集し、準備しました。
PyTrialは、データローディング、モデル仕様、モデルトレーニング、モデル評価という、単純な4段階のプロセスで各タスクを定義します。
さらに,モジュール化されたapiアーキテクチャによって,新たなアルゴリズムやタスクをレスに組み込むためのフレームワークの拡張が可能になります。
コードはhttps://github.com/RyanWangZf/PyTrial.comで公開されている。
関連論文リスト
- Can Large Language Models Replace Data Scientists in Clinical Research? [28.211990967264818]
我々は293個の実世界のデータサイエンスコーディングタスクからなるデータセットを開発する。
このデータセットは患者データを用いて現実的な臨床研究シナリオをシミュレートする。
我々は、医療専門家のためのデータサイエンスワークフローに、大きな言語モデルを統合するプラットフォームを開発する。
論文 参考訳(メタデータ) (2024-10-28T22:48:06Z) - Harmonising the Clinical Melody: Tuning Large Language Models for Hospital Course Summarisation in Clinical Coding [5.279406017862076]
病院のコースをまとめることの課題は、さらなる研究と開発のためのオープンな領域のままである。
Llama 3, BioMistral, Mistral Instruct v0.1 の3種類のプレトレーニング LLM を病院コース要約作業に適用した。
臨床領域の微調整の有効性を評価するため,BERTScoreおよびROUGE測定値を用いて微調整モデルの評価を行った。
論文 参考訳(メタデータ) (2024-09-23T00:35:23Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Yet Another ICU Benchmark: A Flexible Multi-Center Framework for Clinical ML [0.7982607013768545]
Another ICU Benchmark (YAIB) は、再現性と同等の臨床ML実験を定義するためのモジュラーフレームワークである。
YAIBは、ほとんどのオープンアクセスICUデータセット(MIMIC III/IV、eICU、HiRID、AUMCdb)をサポートし、将来のICUデータセットに容易に適応できる。
データセットの選択,コホート定義,前処理が予測性能に大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2023-06-08T11:16:20Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Artificial Intelligence for In Silico Clinical Trials: A Review [41.85196749088317]
サイリコ臨床試験(英:silico trial)は、シミュレーションとモデリングを通じてデジタル的に行われる臨床試験である。
本稿では,臨床シミュレーション,個別化予測モデル,コンピュータ支援トライアルデザインの3つの主要なトピックで論文を体系的にレビューする。
論文 参考訳(メタデータ) (2022-09-16T14:59:31Z) - PosePipe: Open-Source Human Pose Estimation Pipeline for Clinical
Research [0.0]
我々は臨床現場で取得したデータに対して最先端のアルゴリズムの実行を容易にする人間のポーズ推定パイプラインを開発する。
本研究の目的は,新しいアルゴリズムの訓練ではなく,臨床・翻訳研究における最先端のポーズ推定アルゴリズムの活用を推し進めることである。
論文 参考訳(メタデータ) (2022-03-16T17:54:37Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。