論文の概要: Retrieval-Augmented Large Language Models for Schema-Constrained Clinical Information Extraction
- arxiv url: http://arxiv.org/abs/2605.15467v1
- Date: Thu, 14 May 2026 23:13:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.123266
- Title: Retrieval-Augmented Large Language Models for Schema-Constrained Clinical Information Extraction
- Title(参考訳): スキーマ制約付き臨床情報抽出のための検索型大規模言語モデル
- Authors: A H M Rezaul Karim, Ozlem Uzuner,
- Abstract要約: MEDIQA-SYNURは、会話型看護師・患者文書からの観察的抽出に焦点を当てている。
本稿では,トレーニングセットを模範コーパスとして利用するモジュール型検索拡張生成パイプラインを提案する。
我々の結果から,RAGは一貫して性能を向上し,最適なスキーマ制約の度合いはモデルに依存することがわかった。
- 参考スコア(独自算出の注目度): 0.6015898117103068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversational nurse-patient transcripts contain actionable observations, but converting these transcripts into structured representations at scale remains challenging. Documentation burden is substantial, with prior studies showing clinicians spend large portions of their workday on documentation and related desk work rather than direct patient care. MEDIQA-SYNUR focuses on observation extraction from conversational nurse-patient transcripts, requiring systems to normalize these narratives into a predefined schema with value-type constraints. We propose a modular retrieval-augmented generation (RAG) pipeline that uses the training set as an exemplar corpus, combines schema-constrained prompting (full schema vs. pruned candidate schema), deterministic schema-based postprocessing, and a second-pass audit, with two LLM backbones: Llama-4-Scout-17B-16E-Instruct and GPT-5.2 with corresponding embedding models for RAG. Our best configuration uses GPT-5.2 with full schema, RAG, and a second-pass auditing, achieving 80.36% F1 score. Overall, our results show that RAG consistently improves performance, while the optimal degree of schema constraint depends on the model, and second-pass auditing yields modest additional gains by correcting residual schema-adherence errors.
- Abstract(参考訳): 会話型看護師・患者書き起こしには、実行可能な観察が含まれているが、これらの書き起こしを大規模に構造化された表現に変換することは、依然として困難である。
ドキュメンテーションの負担は深刻であり、以前の研究では、臨床医が患者の直接のケアではなく、仕事のほとんどをドキュメントや関連デスク作業に費やしていることが示されている。
MEDIQA-SYNURは、会話型看護婦の書き起こしからの観察抽出に焦点を当て、これらの物語を価値型制約付き事前定義されたスキーマに正規化する必要がある。
本稿では,トレーニングセットを模範コーパスとして用い,スキーマ制約付きプロンプト(フルスキーマ対プルーンド候補スキーマ),決定論的スキーマベースのポストプロセッシング,第2パス監査を組み合わせ,Llama-4-Scout-17B-16E-Instruct と GPT-5.2 の2つの LLM バックボーンを備えたモジュール型検索拡張世代(RAG)パイプラインを提案する。
GPT-5.2でフルスキーマ、RAG、第2パスの監査を行い、80.36%のF1スコアを達成しました。
総合的な結果から,RAGは連続的に性能を向上する一方,最適なスキーマ制約度はモデルに依存し,第2パス監査では残留スキーマのアジェンスエラーを補正することで,若干の利得が得られることがわかった。
関連論文リスト
- Scaling Video Pretraining for Surgical Foundation Models [51.92777479821822]
SurgRecは、スケーラブルで再現可能な、外科的ビデオ理解のための事前学習のレシピだ。
内視鏡,腹腔鏡,白内障,ロボット手術を対象とする10,535ビデオと214.5Mフレームの大規模なコーパスをキュレートした。
論文 参考訳(メタデータ) (2026-03-31T16:31:25Z) - Visual Alignment of Medical Vision-Language Models for Grounded Radiology Report Generation [25.148217482604746]
VALOR:放射線診断用医用ビジョンランゲージモデルの視覚的アライメントを提案する。
GRPO(Group-Relative Proximal Optimization)を利用した強化学習に基づくポストアライメントフレームワークを提案する。
複数のベンチマークの実験では、VALORは事実の精度と視覚的グラウンド化を大幅に改善し、最先端のレポート生成手法よりも大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-12-18T05:48:21Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - Efficient Medical VIE via Reinforcement Learning [10.713109515157475]
ビジュアル情報抽出(VIE)は、構造化されていない文書イメージを、レポート分析やオンラインコンサルティングといった医療応用に不可欠な構造化フォーマットのような構造化フォーマットに変換する。
従来の手法はOCRと言語モデルに依存し、エンドツーエンドのマルチモーダルモデルは直接生成を提供する。
我々は、100の注釈付きサンプルを使用してこれらの課題に対処するために、Reinforcement Learning with Verifiable Rewards(RLVR)フレームワークをベースとしています。
論文 参考訳(メタデータ) (2025-06-16T11:10:25Z) - LLM-Match: An Open-Sourced Patient Matching Model Based on Large Language Models and Retrieval-Augmented Generation [6.4073053466465835]
患者マッチングとは、患者を適切な臨床試験に結びつけるプロセスであり、医療記録を正確に識別し、治験適格基準と整合させることである。
LLM-Matchは、細調整されたオープンソースの大規模言語モデルを活用する、患者マッチングのための新しいフレームワークである。
我々は、オープンソースモデルを用いて、n2c2、SIGIR、TREC 2021、TREC 2022の4つのオープンデータセットで評価し、TrialGPT、Zero-Shot、GPT-4ベースのクローズドモデルと比較した。
論文 参考訳(メタデータ) (2025-03-17T15:31:55Z) - Towards Generalizable Trajectory Prediction Using Dual-Level Representation Learning And Adaptive Prompting [107.4034346788744]
既存の車両軌道予測モデルは、一般化可能性、予測の不確実性、複雑な相互作用を扱う。
本研究では,(1)自己拡張(SD)とマスドレコンストラクション(MR)による二重レベル表現学習,グローバルコンテキストと細部の詳細の収集,(2)レジスタベースのクエリと事前学習の強化,クラスタリングと抑圧の必要性の排除,(3)微調整中の適応型プロンプトチューニング,メインアーキテクチャの凍結,および少数のプロンプトの最適化といった,新たなトラジェクタ予測フレームワークであるPerceiverを提案する。
論文 参考訳(メタデータ) (2025-01-08T20:11:09Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。