論文の概要: Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching
- arxiv url: http://arxiv.org/abs/2604.22061v1
- Date: Thu, 23 Apr 2026 20:36:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.261761
- Title: Lightweight Retrieval-Augmented Generation and Large Language Model-Based Modeling for Scalable Patient-Trial Matching
- Title(参考訳): スケーラブルな患者軌道マッチングのための軽量検索型生成と大規模言語モデルに基づくモデリング
- Authors: Xiaodi Li, Yang Xiao, Munhwan Lee, Konstantinos Leventakos, Young J. Juhn, David Jones, Terence T. Sio, Wei Liu, Maria Vassilaki, Nansu Zong,
- Abstract要約: 患者と医師のマッチングには、長期にわたる異質な電子健康記録に関する推論が必要である。
本稿では,検索拡張生成と大規模言語モデルに基づくモデリングを組み合わせた軽量なフレームワークを提案する。
- 参考スコア(独自算出の注目度): 9.59972497068424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patient-trial matching requires reasoning over long, heterogeneous electronic health records (EHRs) and complex eligibility criteria, posing significant challenges for scalability, generalization, and computational efficiency. Existing approaches either rely on full-document processing with large language models (LLMs), which is computationally expensive, or use traditional machine learning methods that struggle to capture unstructured clinical narratives. In this work, we propose a lightweight framework that combines retrieval-augmented generation and large language model-based modeling for scalable patient-trial matching. The framework explicitly separates two key components: retrieval-augmented generation is used to identify clinically relevant segments from long EHRs, reducing input complexity, while large language models are used to encode these selected segments into informative representations. These representations are further refined through dimensionality reduction and modeled using lightweight predictors, enabling efficient and scalable downstream classification. We evaluate the proposed approach on multiple public benchmarks (n2c2, SIGIR, TREC 2021/2022) and a real-world multimodal dataset from Mayo Clinic (MCPMD). Results show that retrieval-based information selection significantly reduces computational burden while preserving clinically meaningful signals. We further demonstrate that frozen LLMs provide strong representations for structured clinical data, whereas fine-tuning is essential for modeling unstructured clinical narratives. Importantly, the proposed lightweight pipeline achieves performance comparable to end-to-end LLM approaches with substantially lower computational cost.
- Abstract(参考訳): 患者と臨床のマッチングには、長い、異質な電子健康記録(EHR)と複雑な適性基準の推論が必要であり、拡張性、一般化、計算効率の重要な課題を提起する。
既存のアプローチは、計算コストのかかる大規模言語モデル(LLM)によるフルドキュメント処理に依存するか、非構造的な臨床物語を捉えるのに苦労する従来の機械学習手法を使用するかのいずれかである。
本研究では,検索拡張生成と大規模言語モデルベースモデリングを併用した,スケーラブルな患者心電図マッチングのための軽量フレームワークを提案する。
このフレームワークは2つの重要なコンポーネントを明示的に分離する: 検索拡張生成は、臨床に関係のあるセグメントを長いEHRから識別するために使用され、入力の複雑さを低減し、大きな言語モデルはこれらの選択されたセグメントを情報表現にエンコードする。
これらの表現は次元の削減によってさらに洗練され、軽量な予測器を用いてモデル化され、効率的でスケーラブルな下流分類を可能にする。
我々は,複数の公開ベンチマーク (n2c2, SIGIR, TREC 2021/2022) と,Mayo Clinical (MCPMD) による実世界のマルチモーダルデータセットについて検討した。
その結果、検索に基づく情報選択は、臨床的に有意な信号を保持しながら、計算負担を著しく低減することがわかった。
さらに,凍結LDMは構造化された臨床データに対して強力な表現を提供するのに対し,微調整は構造化されていない臨床物語のモデル化に不可欠であることを示す。
重要なことに、提案した軽量パイプラインは、計算コストを大幅に削減したエンドツーエンドのLCMアプローチに匹敵する性能を実現する。
関連論文リスト
- Selective Fine-Tuning of GPT Architectures for Parameter-Efficient Clinical Text Classification [0.0]
本研究は,GPT-2を臨床テキスト分類タスクに適用するためのパラメータ効率の選択的微調整フレームワークを提案する。
事前訓練されたモデル全体を更新する代わりに、ほとんどのネットワークパラメータは凍結され、トレーニング中に最終トランスフォーマーブロック、最終層正規化モジュール、軽量分類ヘッドのみが更新される。
5万件の実験では、選択的な微調整がおよそ91%の分類精度を達成し、モデルパラメータの6%未満を更新している。
論文 参考訳(メタデータ) (2026-03-15T02:16:06Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - From Generative Modeling to Clinical Classification: A GPT-Based Architecture for EHR Notes [0.0]
本研究は臨床テキスト分類のためのGPTアーキテクチャを提案する。
すべてのモデルパラメータを更新する代わりに、GPT-2のバックボーンの大部分は凍結されている。
提案手法はMIMIC-IV-Noteデータセットからの放射線学報告に基づいて評価する。
論文 参考訳(メタデータ) (2026-01-29T16:33:47Z) - Zero-Training Task-Specific Model Synthesis for Few-Shot Medical Image Classification [5.59515535487396]
深層学習モデルは、医用画像解析において顕著な成功を収めてきたが、大規模かつ精巧に注釈付けされたデータセットの要求に制約されている。
ゼロトレーニングタスク特化モデル合成(ZS-TMS)という新しいパラダイムを提案する。
既存のモデルに適応したり、新しいモデルをトレーニングする代わりに、大規模で事前訓練された生成エンジンを活用して、タスク固有の分類器のパラメータ集合全体を直接的に合成する。
論文 参考訳(メタデータ) (2025-11-18T03:12:01Z) - Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.23284500920266]
このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。
実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。
特徴選択戦略は臨床環境に適応する必要がある。
論文 参考訳(メタデータ) (2025-10-10T09:03:47Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。