論文の概要: Improving Clinical Trial Recruitment using Clinical Narratives and Large Language Models
- arxiv url: http://arxiv.org/abs/2604.05190v1
- Date: Mon, 06 Apr 2026 21:37:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.502773
- Title: Improving Clinical Trial Recruitment using Clinical Narratives and Large Language Models
- Title(参考訳): 臨床ナラティブと大規模言語モデルを用いた臨床治験の改善
- Authors: Ziyi Chen, Mengxian Lyu, Cheng Peng, Yonghui Wu,
- Abstract要約: 入院患者をスクリーニングすることは労働集約的なボトルネックであり、低入学と最終的に臨床試験の失敗につながる。
近年の大規模言語モデル(LLM)のブレークスルーは、人工知能を使ってスクリーニングを改善する有望な機会を提供する。
本研究は, エンコーダとデコーダを併用したジェネレーティブLLMを用いて, 臨床物語をスクリーニングし, 臨床トライアルの実施を促進することを目的として, 体系的に検討した。
- 参考スコア(独自算出の注目度): 11.512193481146122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Screening patients for enrollment is a well-known, labor-intensive bottleneck that leads to under-enrollment and, ultimately, trial failures. Recent breakthroughs in large language models (LLMs) offer a promising opportunity to use artificial intelligence to improve screening. This study systematically explored both encoder- and decoder-based generative LLMs for screening clinical narratives to facilitate clinical trial recruitment. We examined both general-purpose LLMs and medical-adapted LLMs and explored three strategies to alleviate the "Lost in the Middle" issue when handling long documents, including 1) Original long-context: using the default context windows of LLMs, 2) NER-based extractive summarization: converting the long document into summarizations using named entity recognition, 3) RAG: dynamic evidence retrieval based on eligibility criteria. The 2018 N2C2 Track 1 benchmark dataset is used for evaluation. Our experimental results show that the MedGemma model with the RAG strategy achieved the best micro-F1 score of 89.05%, outperforming other models. Generative LLMs have remarkably improved trial criteria that require long-term reasoning across long documents, whereas trial criteria that span a short piece of context (e.g., lab tests) show incremental improvements. The real-world adoption of LLMs for trial recruitment must consider specific criteria for selecting among rule-based queries, encoder-based LLMs, and generative LLMs to maximize efficiency within reasonable computing costs.
- Abstract(参考訳): 入院患者をスクリーニングすることは、よく知られた、労働集約的なボトルネックであり、低入学と究極的には臨床試験の失敗につながる。
近年の大規模言語モデル(LLM)のブレークスルーは、人工知能を使ってスクリーニングを改善する有望な機会を提供する。
本研究は, エンコーダとデコーダを併用したジェネレーティブLLMを用いて, 臨床物語をスクリーニングし, 臨床トライアルの実施を促進することを目的として, 体系的に検討した。
汎用LSMと医療適応LSMの双方について検討し、長い文書の扱いにおいて「中途半端な」問題を緩和するための3つの方策を検討した。
1) 本来のロングコンテキスト: LLMのデフォルトコンテキストウィンドウを使用する。
2) NERに基づく抽出要約:長い文書を名前付き実体認識を用いて要約に変換する。
3) RAG: 資格基準に基づくダイナミックエビデンス検索。
2018 N2C2 Track 1ベンチマークデータセットが評価に使用されている。
実験の結果,RAG戦略を用いたMedGemmaモデルでは,マイクロF1スコアが89.05%であり,他のモデルよりも優れていた。
生成LDMは、長い文書にわたる長期的推論を必要とする試験基準を著しく改善したのに対し、短い文脈(実験室試験など)にまたがる試験基準は漸進的に改善されている。
試行錯誤のためのLLMの現実的な採用は、合理的な計算コストで効率を最大化するために、ルールベースのクエリ、エンコーダベースのLLM、および生成LDMの中から選択する特定の基準を検討する必要がある。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Rethinking On-policy Optimization for Query Augmentation [49.87723664806526]
本稿では,様々なベンチマークにおいて,プロンプトベースとRLベースのクエリ拡張の最初の体系的比較を示す。
そこで我々は,検索性能を最大化する擬似文書の生成を学習する,新しいハイブリッド手法 On-policy Pseudo-document Query Expansion (OPQE) を提案する。
論文 参考訳(メタデータ) (2025-10-20T04:16:28Z) - CliniBench: A Clinical Outcome Prediction Benchmark for Generative and Encoder-Based Language Models [39.221038061767324]
生成型大規模言語モデル (LLMs) は, 複雑な医療業務においてますます研究されている。
実際の臨床応用におけるそれらの効果は未解明のままである。
本報告では,MIMIC-IVデータセットにおける入力音からの退避診断予測のためのエンコーダベース分類器と生成LDMの比較を可能にする最初のベンチマークであるCliniBenchについて述べる。
論文 参考訳(メタデータ) (2025-09-30T11:56:53Z) - Cohort Discovery: A Survey on LLM-Assisted Clinical Trial Recruitment [21.800829039344876]
我々は,臨床治験採用における臨床患者マッチングの課題を初めて分析し,新たなLCMベースのアプローチを文脈的に分析する。
既存のベンチマーク、アプローチ、評価フレームワークについて批判的に検討する。
論文 参考訳(メタデータ) (2025-06-18T09:32:16Z) - Iterative Self-Incentivization Empowers Large Language Models as Agentic Searchers [74.17516978246152]
大規模言語モデル(LLM)は、従来の手法を進化させるために情報検索に広く統合されている。
エージェント検索フレームワークであるEXSEARCHを提案する。
4つの知識集約ベンチマークの実験では、EXSEARCHはベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-26T15:27:55Z) - AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.54623137152208]
我々はAutoElicitを導入し、大規模言語モデルから知識を抽出し、予測モデルのための事前構築を行う。
これらの先行情報は情報的であり、自然言語を用いて洗練できることを示す。
AutoElicitは、非形式的な事前よりもエラーを大幅に減らし、ラベルを減らし、コンテクスト内学習を一貫して上回ります。
論文 参考訳(メタデータ) (2024-11-26T10:13:39Z) - Leveraging Large Language Models for Medical Information Extraction and Query Generation [2.1793134762413433]
本稿では,大言語モデル(LLM)を臨床試験検索プロセスに統合するシステムを提案する。
クエリ生成には6つのLCMを評価し,最小限の計算資源を必要とする,オープンソースと比較的小さなモデルに着目した。
論文 参考訳(メタデータ) (2024-10-31T12:01:51Z) - From RAGs to riches: Utilizing large language models to write documents for clinical trials [0.0]
この記事は、現在ジャーナルのウェブサイトで公開されている: https://journals.sagepub.com/doi177/174077452520806。
公開リンク: https://pubmed.ncbi.nlm.nih.gov/40013826/
論文 参考訳(メタデータ) (2024-02-26T08:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。