論文の概要: TRIALSCOPE: A Unifying Causal Framework for Scaling Real-World Evidence Generation with Biomedical Language Models
- arxiv url: http://arxiv.org/abs/2311.01301v3
- Date: Sat, 16 Aug 2025 16:33:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:09.577668
- Title: TRIALSCOPE: A Unifying Causal Framework for Scaling Real-World Evidence Generation with Biomedical Language Models
- Title(参考訳): TRIALSCOPE: バイオメディカル言語モデルによる実世界のエビデンス生成をスケールするための統一因果関係フレームワーク
- Authors: Javier González, Risa Ueno, Cliff Wong, Zelalem Gero, Jass Bagga, Isabel Chien, Eduard Oravkin, Emre Kiciman, Aditya Nori, Roshanthi Weerasinghe, Rom S. Leidner, Brian Piening, Tristan Naumann, Carlo Bifulco, Hoifung Poon,
- Abstract要約: 本稿では,大規模観測データから堅牢な実世界の証拠を生成するためのフレームワークであるTRIALSCOPEを提案する。
このフレームワークは、高品質な構造化された患者データを自動的にキュレートし、データセットを拡張し、非構造化形式でのみ利用可能な主要な患者属性を組み込む。
また,TriALSCOPEは,抽出した実世界のデータから,肺癌および膵癌の臨床試験の結果を再現できることを示した。
- 参考スコア(独自算出の注目度): 21.437563965711004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid digitization of real-world data presents an unprecedented opportunity to optimize healthcare delivery and accelerate biomedical discovery. However, these data are often found in unstructured forms such as clinical notes in electronic medical records (EMRs), and is typically plagued by confounders, making it challenging to generate robust real-world evidence (RWE). Therefore, we present TRIALSCOPE, a framework designed to distil RWE from population level observational data at scale. TRIALSCOPE leverages biomedical language models to structure clinical text at scale, employs advanced probabilistic modeling for denoising and imputation, and incorporates state-of-the-art causal inference techniques to address common confounders in treatment effect estimation. Extensive experiments were conducted on a large-scale dataset of over one million cancer patients from a single large healthcare network in the United States. TRIALSCOPE was shown to automatically curate high-quality structured patient data, expanding the dataset and incorporating key patient attributes only available in unstructured form. The framework reduces confounding in treatment effect estimation, generating comparable results to randomized controlled lung cancer trials. Additionally, we demonstrate simulations of unconducted clinical trials - including a pancreatic cancer trial with varying eligibility criteria - using a suite of validation tests to ensure robustness. Thorough ablation studies were conducted to better understand key components of TRIALSCOPE and establish best practices for RWE generation from EMRs. TRIALSCOPE was able to extract data cancer treatment data from EMRs, overcoming limitations of manual curation. We were also able to show that TRIALSCOPE could reproduce results of lung and pancreatic cancer clinical trials from the extracted real world data.
- Abstract(参考訳): 現実世界のデータの迅速なデジタル化は、医療提供を最適化し、生物医学的な発見を加速する前例のない機会である。
しかしながら、これらのデータは電子医療記録(EMR)における臨床記録などの構造化されていない形で発見されることが多く、共同設立者によって悩まされているため、堅牢な実世界の証拠(RWE)の生成が困難である。
そこで本研究では,人口レベルの観測データからRWEを駆除するフレームワークであるTRIALSCOPEを提案する。
TRIALSCOPEは、バイオメディカル言語モデルを活用して、臨床テキストを大規模に構成し、より高度な確率論的モデリングを用いて、治療効果の推定において一般的な共同創設者に対処するために、最先端の因果推論手法を取り入れている。
大規模な実験は、米国の1つの大きな医療ネットワークから100万人以上のがん患者の大規模なデータセットを用いて行われた。
TRIALSCOPEは、高品質な構造化された患者データを自動的にキュレートし、データセットを拡張し、非構造化形式でのみ利用可能な主要な患者属性を組み込む。
このフレームワークは、治療効果の推定における欠点を減らし、ランダム化制御された肺がんの臨床試験に匹敵する結果を生み出す。
さらに, 膵癌治験を含む非手術的臨床試験のシミュレーションを, 信頼性を確保するために, 一連の検証試験を用いて実証した。
TRIALSCOPEの主要成分をよりよく理解し,EMRによるRWE生成のベストプラクティスを確立するため,詳細なアブレーション研究を行った。
TRIALSCOPEは手技による治療の限界を克服し、EMRからデータがん治療データを抽出することができた。
また,TriALSCOPEは,抽出した実世界のデータから,肺癌および膵癌の臨床試験の結果を再現できることを示した。
関連論文リスト
- RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Any-to-Any Vision-Language Model for Multimodal X-ray Imaging and Radiological Report Generation [26.589728923739596]
マルチモーダル医療データ生成に特化して設計されたフレームワークを提案する。
多視点胸部X線の発生と臨床報告により、汎用視覚言語モデルと医療の専門的要件とのギャップを埋める。
我々のフレームワークは、下流疾患分類タスクの実際のデータと比較して、同等またはそれ以上の性能を実現している。
論文 参考訳(メタデータ) (2025-05-02T08:07:24Z) - Generating Clinically Realistic EHR Data via a Hierarchy- and Semantics-Guided Transformer [0.0]
生成過程の新たなフレームワークとして階層型・意味型変換器(HiSGT)を提案する。
HiSGTは、親子関係と臨床コード間の兄弟関係をエンコードする階層グラフを構築し、階層認識の埋め込みを導出するためにグラフニューラルネットワークを使用する。
MIMIC-IIIおよびMIMIC-IVデータセットの実験により、HiSGTは実際の患者記録と合成データの統計的アライメントを大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-02-28T05:06:04Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
本研究は,人工知能(AI)モデルを用いた医用合成データ生成の臨床評価に焦点を当てた。
本論文は,a) 医用専門家による合成画像の体系的評価のためのプロトコルを提示し,b) 高分解能WCE画像合成のための新しい変分オートエンコーダモデルであるTIDE-IIを評価する。
その結果、TIDE-IIは臨床的に関連性のあるWCE画像を生成し、データの不足に対処し、診断ツールの強化に役立つことがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Masked Clinical Modelling: A Framework for Synthetic and Augmented Survival Data Generation [1.7769033811751995]
本稿では,マスク付き言語モデリングに触発されたMCM(Masked Clinical Modelling)について紹介する。
MCMはデータ合成と条件付きデータ拡張の両方のために設計されている。
我々は,このプロトタイプをCox Proportional Hazardsモデルを用いてWHAS500データセット上で評価する。
論文 参考訳(メタデータ) (2024-10-22T08:38:46Z) - Retrieval-Reasoning Large Language Model-based Synthetic Clinical Trial Generation [16.067841125848688]
本稿では, 大規模言語モデルを利用した新規な検索・推論フレームワークを提案する。
urlClinicalTrials.govデータベースによる実際の臨床試験で実施された実験は、我々の合成データが実際のデータセットを効果的に増大させることができることを示した。
本研究は, 臨床研究を加速し, 患者プライバシの倫理基準を高くする上で, 総合臨床試験生成のためのLCMが期待できることを示唆する。
論文 参考訳(メタデータ) (2024-10-16T11:46:32Z) - DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.827368628263997]
放射線医は、基礎疾患の診断に不十分な胸部X線をしばしば見出す。
臨床データを用いた拡張技術により臨床コンテキストを向上する新しい枠組みを提案する。
症例文脈合成データを生成するために,大規模言語モデルを用いた臨床データ拡張の先駆的アプローチを導入する。
論文 参考訳(メタデータ) (2024-07-11T07:01:50Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion [0.0]
sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。
大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-30T16:00:43Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - TrialGraph: Machine Intelligence Enabled Insight from Graph Modelling of
Clinical Trials [0.0]
我々はCT.gov, AACT, TrialTroveデータベースから収集した治験データセット(n=1191臨床試験、100万人の患者を代表する)を紹介する。
次に,グラフ機械学習アルゴリズムの数学的基礎と実装について詳述する。
我々はこれらのモデルを用いて、疾患、既往の医療状況、治療に関する情報を与えられた臨床試験の副作用情報を予測する訓練を行った。
論文 参考訳(メタデータ) (2021-12-15T15:36:57Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。