論文の概要: sebis at CRF Filling 2026: A Two-Stage Local LLM Pipeline for Medical CRF Filling
- arxiv url: http://arxiv.org/abs/2606.13082v1
- Date: Thu, 11 Jun 2026 09:04:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.689151
- Title: sebis at CRF Filling 2026: A Two-Stage Local LLM Pipeline for Medical CRF Filling
- Title(参考訳): CRFフィリング2026におけるセビス : 医療用CRFフィリング用2段局所LLMパイプライン
- Authors: Katharina Sommer, Tristan Till, Florian Matthes,
- Abstract要約: MedGemma-27Bモデルを用いた完全局所的なドメイン適応パイプラインを提案する。
本手法は英語の公式テストトラックでマクロF1スコア0.55を達成する。
- 参考スコア(独自算出の注目度): 14.140958872152476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The extraction of structured clinical information from unstructured EHR notes is a persistent bottleneck in healthcare informatics. While large language models (LLMs) offer high performance, their deployment in clinical settings is hindered by privacy risks, inference costs, and the tendency to hallucinate beyond textual evidence. We address these challenges for the CL4Health 2026 Case Report Form (CRF) filling task by proposing a fully local, domain-adapted pipeline using the MedGemma-27B model. Our two-stage architecture, which separates binary presence classification from value extraction, enforces strict adherence to textual evidence and ensures deterministic outputs for negated, uncertain, or unknown states. By leveraging item-specific, few-shot in-context learning without external API calls or fine-tuning, our approach achieves a macro-F1 score of 0.55 on the official English test track. This result secures second place among all locally-hosted, open-source submissions. Our work demonstrates that privacy-preserving, on-premise LLM pipelines can achieve near-competitive performance with proprietary frontier models, providing a practical, data-sovereign framework for clinical NLP.
- Abstract(参考訳): 構造化されていないEHRノートから構造化された臨床情報を抽出することは、医療情報学における永続的なボトルネックである。
大きな言語モデル(LLM)は高いパフォーマンスを提供するが、それらの臨床環境への展開は、プライバシのリスク、推論コスト、そしてテキストによる証拠以上の幻覚を引き起こす傾向によって妨げられる。
CL4Health 2026 Case Report Form (CRF) におけるこれらの課題に対して,MedGemma-27Bモデルを用いた完全局所的なドメイン適応パイプラインを提案する。
我々の2段階アーキテクチャは、バイナリ存在分類と値抽出を分離し、テキスト証拠への厳密な固執を強制し、否定的、不確実、不明な状態に対する決定論的出力を保証する。
外部APIコールや微調整を使わずに、項目固有の、少数ショットのインコンテキスト学習を活用することで、公式の英語テストトラックでマクロF1スコアの0.55を達成できる。
この結果は、ローカルにホストされたオープンソースの提出物の中で第2位を確保できる。
我々の研究は、プライバシ保護とオンプレミスのLLMパイプラインがプロプライエタリなフロンティアモデルとほぼ競合する性能を達成できることを示し、臨床NLPのための実用的なデータソーシングフレームワークを提供する。
関連論文リスト
- Trust but Verify: Introducing DAVinCI -- A Framework for Dual Attribution and Verification in Claim Inference for Language Models [53.279391576560755]
大規模言語モデル(LLM)は、広範囲のNLPタスクにおいて顕著な流速と汎用性を示してきたが、実際的な不正確さと制限が伴う傾向にある。
これは、信頼と妥当性が最優先される医療、法律、科学コミュニケーションといった、高リスク領域に重大なリスクをもたらす。
LLM出力の事実的信頼性と解釈可能性を高めるために設計されたDAVinCI - Dual Attribution and Verificationフレームワークを紹介する。
論文 参考訳(メタデータ) (2026-04-23T01:37:50Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - EHRSummarizer: A Privacy-Aware, FHIR-Native Architecture for Structured Clinical Summarization of Electronic Health Records [0.0]
EHRSummarizerは構造化チャートレビューをサポートする構造化要約を生成する。
システムは、データ最小化、ステートレス処理、フレキシブルなデプロイメントのために設定できる。
論文 参考訳(メタデータ) (2026-01-04T21:10:42Z) - Leveraging Open-Source Large Language Models for Clinical Information Extraction in Resource-Constrained Settings [3.799555574114989]
医療報告には豊富な臨床情報が含まれているが、しばしば非構造化され、ドメイン固有の言語で書かれる。
本研究は、オランダにおける28の臨床情報抽出タスクを含むDRAGONベンチマークにおいて、9つのオープンソースジェネレーティブLCMを評価した。
我々は,オープンソースのジェネレーティブLLMを用いた情報抽出フレームワークであるtextttllm_extractinator を開発した。
論文 参考訳(メタデータ) (2025-07-28T14:12:37Z) - CLI-RAG: A Retrieval-Augmented Framework for Clinically Structured and Context Aware Text Generation with LLMs [0.1578515540930834]
CLI-RAG (Clinically Informed Retrieval-Augmented Generation) は、構造的および臨床的な基盤となるテキスト生成のためのドメイン固有のフレームワークである。
臨床文書構造を尊重する新しい階層的チャンキング戦略を取り入れ、タスク固有の2段階検索機構を導入する。
本システムを用いて,MIMIC-IIIデータセットから15種類の臨床ノートを作成した。
論文 参考訳(メタデータ) (2025-07-09T10:13:38Z) - An Unsupervised Natural Language Processing Pipeline for Assessing Referral Appropriateness [0.0]
本稿では,参照理由の抽出と評価が可能な,完全に教師なしの自然言語処理パイプラインを提案する。
我々のパイプラインは、イタリアの医療用テキストで事前訓練されたTransformerベースの埋め込みを活用して、参照の理由をクラスタ化する。
教師なしの環境で動作し、さまざまな試験タイプにまたがって一般化されるように設計されている。
論文 参考訳(メタデータ) (2025-01-24T18:24:16Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Generating Faithful and Complete Hospital-Course Summaries from the Electronic Health Record [3.6513957125331555]
ドキュメントの負担の増加による意図しない結果が、患者との対面時間を短縮した。
本稿では,患者の入院状況の要約を自動生成するためのソリューションを提案し,評価する。
論文 参考訳(メタデータ) (2024-04-01T15:47:21Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。