論文の概要: Key Coverage Matters: Semi-Structured Extraction of OCR Clinical Reports
- arxiv url: http://arxiv.org/abs/2605.09440v1
- Date: Sun, 10 May 2026 09:29:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.25295
- Title: Key Coverage Matters: Semi-Structured Extraction of OCR Clinical Reports
- Title(参考訳): 要旨:OCR臨床報告の半構造化抽出
- Authors: Yu Wang, Yingyun Li, Ying Qin, Haiyang Qian,
- Abstract要約: プライバシ規制とデータサイロが直接的な情報共有を制限するため、臨床報告は医療機関によって断片化されることが多い。
我々はこの問題を,OCR由来の臨床報告に対する標準キー条件抽出質問応答として定式化する。
0.2BのBERTベースのモデルを用いて、20以上の病院の実際の報告実験は、キーカバレッジによってパフォーマンスが単調に向上することを示している。
- 参考スコア(独自算出の注目度): 5.2232051743738905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical reports are often fragmented across healthcare institutions because privacy regulations and data silos limit direct information sharing. When patients seek care at a different hospital, they often carry paper or scanned reports from prior visits. This hinders EHR integration and longitudinal review, and downstream applications that depend on more complete patient records, such as patient management, follow-up care, real-world studies, and clinical-trial matching. Although OCR can digitize such reports, reliable extraction remains challenging because clinical documents are heterogeneous, OCR text is noisy, and many healthcare settings require low-cost on-premise deployment. We formulate this problem as canonical key-conditioned extractive question answering over OCR-derived clinical reports. Because the key fields are neither fixed nor known in advance, the key space is open. We maintain a canonical key inventory through iterative key mining, normalization, clustering, and lightweight human verification, and introduce key coverage as a metric to quantify inventory completeness. Using a 0.2B BERT-based model, experiments on real-world reports from more than 20 hospitals show performance improves monotonically with key coverage. The model achieves F1 scores of 0.839 and 0.893 under exact match and boundary-tolerant matching, respectively, once the Top-90 canonical keys are covered. These results show that key coverage is a dominant factor for end-to-end performance. At Top-90 coverage, our model outperforms a fine-tuned Qwen3-0.6B baseline under exact match. Although our annotated corpus is Chinese, the method relies on the language-agnostic key-value organization of semi-structured clinical reports and can be adapted to other settings given an appropriate canonical key inventory and alias mapping.
- Abstract(参考訳): プライバシ規制とデータサイロが直接的な情報共有を制限するため、臨床報告は医療機関によって断片化されることが多い。
患者が別の病院でケアを求めるとき、彼らはしばしば以前の訪問から紙やスキャンされたレポートを運ぶ。
これにより、患者管理、フォローアップケア、現実世界の研究、臨床と臨床の整合性など、より完全な患者の記録に依存する、EHR統合と縦断的レビューの妨げとなる。
OCRはそのような報告をデジタル化できるが、臨床文書は異質であり、OCRテキストはノイズが多く、多くの医療環境は低コストのオンプレミス展開を必要としているため、信頼性の高い抽出は依然として困難である。
我々はこの問題を,OCR由来の臨床報告に対する標準キー条件抽出質問応答として定式化する。
鍵場は前もって固定されていないし、既知でもないので、鍵空間は開である。
我々は、反復鍵採掘、正規化、クラスタ化、軽量な人間の検証を通じて標準鍵在庫を維持し、在庫の完全性を定量化するための指標としてキーカバレッジを導入する。
0.2BのBERTベースのモデルを用いて、20以上の病院の実際の報告実験は、キーカバレッジによってパフォーマンスが単調に向上することを示している。
このモデルは、Top-90カノニカルキーがカバーされると、それぞれ正確なマッチとバウンダリ耐性マッチングの下で、0.839と0.893のF1スコアを達成する。
これらの結果は、キーカバレッジがエンド・ツー・エンドのパフォーマンスの主要な要因であることを示している。
トップ90のカバレッジでは、我々のモデルは正確なマッチの下で微調整されたQwen3-0.6Bベースラインより優れています。
注釈付きコーパスは中国語であるが, 半構造化臨床報告の言語に依存しないキーバリュー構成に依存し, 適切なカノニカルキーインベントリとエイリアスマッピングを付与して他の設定に適応することができる。
関連論文リスト
- MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports [2.289837306672451]
MedStruct-Sは未知のキーとOCRノイズ下でのタスク評価に特化して設計されたベンチマークである。
その結果,エンコーダのみのモデルでは,非null値鍵条件QAに対して最高の性能が得られることがわかった。
これらの結果は、このベンチマークが、異なる半構造化IE設定でモデルを選択し比較するための信頼性と実用的な基礎を提供することを示している。
論文 参考訳(メタデータ) (2026-05-04T19:37:21Z) - CT-FineBench: A Diagnostic Fidelity Benchmark for Fine-Grained Evaluation of CT Report Generation [51.11942945171396]
従来の評価指標は、語彙重なり合いやエンティティマッチングの粗い尺度のみを提供する。
我々はCT-RATEとMerlinのベンチマークであるCT-FineBenchを提案し、CTレポートの微細な事実整合性を評価する。
我々のベンチマークは、綿密な質問回答(QA)ベースのプロセスによって構築されます。
論文 参考訳(メタデータ) (2026-04-27T03:32:46Z) - How Robust Are Large Language Models for Clinical Numeracy? An Empirical Study on Numerical Reasoning Abilities in Clinical Contexts [11.740513556909542]
ClinicalNumRobBenchは、1,624のコンテキスト検索インスタンスのベンチマークで、基調的な回答がある。
本研究は, 値検索, 算術演算, リレーショナル比較, 集約の4種類の臨床数値性を評価する。
論文 参考訳(メタデータ) (2026-04-13T07:44:41Z) - Longitudinal Vestibular Schwannoma Dataset with Consensus-based Human-in-the-loop Annotations [3.1898695141875772]
このデータセットには,184例のT1強調検査(T1CE)534例と6例の非アノテーションT2強調検査(T2強調検査)190例が含まれている。
提案手法は,自動セグメンテーションモデルの目的とするデータ分布への効率的かつ資源効率の高い一般化を可能にする。
従来の手作業による注釈処理と比較して、効率を約37.4%向上させると見積もられている。
論文 参考訳(メタデータ) (2025-11-01T09:53:28Z) - A systematic review of trial-matching pipelines using large language models [0.9176056742068814]
患者を臨床試験の選択肢に合わせることは、特に腫瘍学において新しい治療法を特定するために重要である。
大規模言語モデル(LLM)はこの問題に対して有望な解決策を提供する。
本総説では, 臨床治験におけるLSMの応用の進展を概説し, 有望な方向性と限界を強調した。
論文 参考訳(メタデータ) (2025-09-13T21:21:05Z) - Decoupling Clinical and Class-Agnostic Features for Reliable Few-Shot Adaptation under Shift [12.373281238541296]
医療ビジョン言語モデル(VLM)は、臨床診断支援を約束するが、分布シフトによる信頼性は、安全なデプロイメントにとって大きな関心事である。
そこで我々はDRiFtを提案する。DRiFtは機能分離フレームワークで、臨床的に関連する信号をタスク非依存のノイズから明確に分離する。
提案手法は,従来のプロンプトベースの手法に比べて,Top-1精度+11.4%,Macro-F1+3.3%向上する。
論文 参考訳(メタデータ) (2025-09-11T12:26:57Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。