論文の概要: Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using
Self-Supervision
- arxiv url: http://arxiv.org/abs/2206.14719v1
- Date: Wed, 29 Jun 2022 15:37:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-30 21:28:02.267889
- Title: Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using
Self-Supervision
- Title(参考訳): Trial2Vec: セルフスーパービジョンを用いたゼロショット臨床試験文書類似検索
- Authors: Zifeng Wang and Jimeng Sun
- Abstract要約: 同様の臨床試験に注釈を付けずに自己監督を通じて学習するTrial2Vecを提案する。
臨床試験文書(タイトル、資格基準、対象疾患など)のメタ構造と臨床知識を活用して、コントラスト的なサンプルを自動生成する。
本手法は, 可視化により医療的に解釈可能な埋め込みを実現し, 試行錯誤における最良基準値に対して平均15%の精度向上が得られることを示す。
- 参考スコア(独自算出の注目度): 42.859662256134584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical trials are essential for drug development but are extremely
expensive and time-consuming to conduct. It is beneficial to study similar
historical trials when designing a clinical trial. However, lengthy trial
documents and lack of labeled data make trial similarity search difficult. We
propose a zero-shot clinical trial retrieval method, Trial2Vec, which learns
through self-supervision without annotating similar clinical trials.
Specifically, the meta-structure of trial documents (e.g., title, eligibility
criteria, target disease) along with clinical knowledge (e.g., UMLS knowledge
base https://www.nlm.nih.gov/research/umls/index.html) are leveraged to
automatically generate contrastive samples. Besides, Trial2Vec encodes trial
documents considering meta-structure thus producing compact embeddings
aggregating multi-aspect information from the whole document. We show that our
method yields medically interpretable embeddings by visualization and it gets a
15% average improvement over the best baselines on precision/recall for trial
retrieval, which is evaluated on our labeled 1600 trial pairs. In addition, we
prove the pre-trained embeddings benefit the downstream trial outcome
prediction task over 240k trials.
- Abstract(参考訳): 臨床試験は薬物開発に不可欠であるが、非常に高価で、実行に時間がかかる。
臨床試験を設計する際にも同様の歴史的裁判を研究することは有益である。
しかし、長いトライアル文書とラベル付きデータの欠如は、トライアルの類似性検索を困難にする。
同様の臨床試験に注釈を付けずに自己監督を通じて学習するゼロショット臨床試験検索手法Trial2Vecを提案する。
具体的には、臨床知識(例えば、umls知識ベースhttps://www.nlm.nih.gov/research/umls/index.html)とともに試験文書(タイトル、適格性基準、対象疾患など)のメタ構造を利用して、コントラストサンプルを自動的に生成する。
加えて、trial2vecは、メタ構造を考慮した試行文書をエンコードし、文書全体からマルチスペクトル情報を集約するコンパクト埋め込みを生成する。
本手法は, 医用的に解釈可能な埋め込みを可視化することで得られることを示し, 1600組の試用ペアで評価した, 精度/リコールにおける最良ベースラインに対して平均15%の改善が得られた。
さらに, 事前学習した埋め込みは, 240k以上の試験結果予測タスクに有効であることを示す。
関連論文リスト
- TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Panacea: A foundation model for clinical trial search, summarization, design, and recruitment [29.099676641424384]
パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
論文 参考訳(メタデータ) (2024-06-25T21:29:25Z) - TrialDura: Hierarchical Attention Transformer for Interpretable Clinical Trial Duration Prediction [19.084936647082632]
マルチモーダルデータを用いて臨床試験期間を推定する機械学習に基づくTrialDuraを提案する。
バイオメディカルコンテキストに特化されたBio-BERT埋め込みにエンコードして,より深く,より関連するセマンティック理解を提供する。
提案モデルでは, 平均絶対誤差(MAE)が1.04年, 根平均二乗誤差(RMSE)が1.39年であった。
論文 参考訳(メタデータ) (2024-04-20T02:12:59Z) - Scaling Clinical Trial Matching Using Large Language Models: A Case
Study in Oncology [17.214664001970526]
大規模言語モデル(LLM)を用いた臨床治験マッチングのスケーリングに関する系統的研究を行う。
本研究は、米国の大規模医療ネットワークにおいて、現在試験展開中の臨床試験マッチングシステムに基礎を置いている。
論文 参考訳(メタデータ) (2023-08-04T07:51:15Z) - CliniDigest: A Case Study in Large Language Model Based Large-Scale
Summarization of Clinical Trial Descriptions [58.720142291102135]
2022年には、毎日100件以上の臨床試験がCricerTrials.govに提出された。
CliniDigestは、私たちの知る限り、臨床試験のリアルタイム、真実、そして包括的な要約を提供するための最初のツールです。
それぞれのフィールドに対して、CliniDigestは$mu=153, igma=69$の要約を生成し、それぞれが$mu=54%, sigma=30%のソースを使用する。
論文 参考訳(メタデータ) (2023-07-26T21:49:14Z) - AutoTrial: Prompting Language Models for Clinical Trial Design [53.630479619856516]
本稿では,言語モデルを用いた臨床検査基準の設計を支援するAutoTrialという手法を提案する。
70K以上の臨床試験で、AutoTrialが高品質な基準テキストを生成することが確認された。
論文 参考訳(メタデータ) (2023-05-19T01:04:16Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Clinical trial site matching with improved diversity using fair policy
learning [56.01170456417214]
我々は,臨床治験記述を潜在的な試験現場のランクリストにマッピングするモデルを学習する。
既存のフェアネスフレームワークとは異なり、各トライアルサイトのグループメンバーシップは非バイナリである。
このようなマルチグループメンバーシップシナリオに対処するために、人口統計学的妥当性に基づく公平性基準を提案する。
論文 参考訳(メタデータ) (2022-04-13T16:35:28Z) - Predicting Clinical Trial Results by Implicit Evidence Integration [40.80948875051806]
新規な臨床試験結果予測(CTRP)タスクを導入する。
CTRPフレームワークでは、モデルがPICO形式の臨床試験の提案を受け、その背景を入力として、その結果を予測する。
PICOを暗黙的に含む医学文献から大規模非構造化文を引用し,その結果を証拠とした。
論文 参考訳(メタデータ) (2020-10-12T12:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。