論文の概要: Hierarchical Section Matching Prediction (HSMP) BERT for Fine-Grained Extraction of Structured Data from Hebrew Free-Text Radiology Reports in Crohn's Disease
- arxiv url: http://arxiv.org/abs/2509.04519v1
- Date: Wed, 03 Sep 2025 10:12:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.354882
- Title: Hierarchical Section Matching Prediction (HSMP) BERT for Fine-Grained Extraction of Structured Data from Hebrew Free-Text Radiology Reports in Crohn's Disease
- Title(参考訳): クローン病におけるHebrew Free-Text Radiology からの微細なデータ抽出のための階層的セクションマッチング予測 (HSMP) BERT
- Authors: Zvi Badash, Hadas Ben-Atya, Naama Gavrielov, Liam Hazan, Gili Focht, Ruth Cytter-Kuint, Talar Hagopian, Dan Turner, Moti Freiman,
- Abstract要約: 我々はヘブライ語ラジオグラフィテキストから抽出するプロンプトベースモデルHSMP-BERTを開発した。
イスラエル全土で2010-2023年に撮影されたクローン患者の9,683件の報告を分析した。
HSMP-BERTはF1 0.83$pm$0.08と$kappa$ 0.65$pm$0.17を達成し、SMPゼロショットベースラインを上回った。
- 参考スコア(独自算出の注目度): 0.9290045684108277
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Extracting structured clinical information from radiology reports is challenging, especially in low-resource languages. This is pronounced in Crohn's disease, with sparsely represented multi-organ findings. We developed Hierarchical Structured Matching Prediction BERT (HSMP-BERT), a prompt-based model for extraction from Hebrew radiology text. In an administrative database study, we analyzed 9,683 reports from Crohn's patients imaged 2010-2023 across Israeli providers. A subset of 512 reports was radiologist-annotated for findings across six gastrointestinal organs and 15 pathologies, yielding 90 structured labels per subject. Multilabel-stratified split (66% train+validation; 33% test), preserving label prevalence. Performance was evaluated with accuracy, F1, Cohen's $\kappa$, AUC, PPV, NPV, and recall. On 24 organ-finding combinations with $>$15 positives, HSMP-BERT achieved mean F1 0.83$\pm$0.08 and $\kappa$ 0.65$\pm$0.17, outperforming the SMP zero-shot baseline (F1 0.49$\pm$0.07, $\kappa$ 0.06$\pm$0.07) and standard fine-tuning (F1 0.30$\pm$0.27, $\kappa$ 0.27$\pm$0.34; paired t-test $p < 10^{-7}$). Hierarchical inference cuts runtime 5.1$\times$ vs. traditional inference. Applied to all reports, it revealed associations among ileal wall thickening, stenosis, and pre-stenotic dilatation, plus age- and sex-specific trends in inflammatory findings. HSMP-BERT offers a scalable solution for structured extraction in radiology, enabling population-level analysis of Crohn's disease and demonstrating AI's potential in low-resource settings.
- Abstract(参考訳): 放射線医学報告から構造化された臨床情報を抽出することは、特に低リソース言語では困難である。
クローン病と診断され,多臓器所見が軽快した。
ヘブライ語ラジオグラフィテキストから抽出するプロンプトベースモデルである階層構造マッチング予測BERT (HSMP-BERT) を開発した。
行政データベースによる調査では、クローンの患者による9,683件の報告を分析し、2010-2023年にイスラエルのプロバイダーで撮影された。
512例の報告のサブセットは, 消化管6例, 病理組織15例で, 被検体90例と診断された。
マルチラベル化スプリット(66%の列車+バリデーション、33%のテスト)、ラベルの有病率を維持する。
性能は精度、F1、コーエンの$\kappa$、AUC、PPV、NPV、リコールで評価された。
F1 0.83$\pm$0.08, $\kappa$ 0.65$\pm$0.17, $\kappa$ 0.06$\pm$0.07, $\kappa$ 0.06$\pm$0.07, $\kappa$ 0.30$\pm$0.27, $\kappa$ 0.27$\pm$0.34, paired t-test $p < 10^{-7}$を達成した。
階層推論は、ランタイム5.1$\times$と従来の推論を削減します。
以上より, 回腸壁肥厚, 狭窄, 狭窄前拡張, および炎症所見の年齢, 性別別傾向について検討した。
HSMP-BERTは、放射線学における構造化抽出のためのスケーラブルなソリューションを提供し、クローン病の集団レベルでの分析を可能にし、低リソース環境でAIの可能性を示す。
関連論文リスト
- Extracting Post-Acute Sequelae of SARS-CoV-2 Infection Symptoms from Clinical Notes via Hybrid Natural Language Processing [20.25145258120295]
我々は,ルールに基づく名前付きエンティティ認識とBERTに基づくアサーション検出モジュールを統合するハイブリッド自然言語処理パイプラインを開発した。
人口レベルの有病率調査では,47,654件の経過ノートを収集した。
パイプラインは各音符を平均2.448pm 0.812$秒で処理した。
論文 参考訳(メタデータ) (2025-08-17T15:43:05Z) - Development of a Large-scale Dataset of Chest Computed Tomography Reports in Japanese and a High-performance Finding Classification Model [4.989937142229914]
大規模言語モデルの最近の進歩は、高品質な多言語医療データセットの必要性を強調している。
我が国はCTスキャナの展開と利用を世界中にリードしているが,大規模な放射線学データセットの欠如により,医用画像解析のための特化言語モデルの開発が妨げられている。
われわれは,CT-BERT-JPNを「tohoku-nlp/bert-base-japanese-v3」アーキテクチャで構築した。
論文 参考訳(メタデータ) (2024-12-20T13:59:11Z) - Leveraging Prompt-Learning for Structured Information Extraction from Crohn's Disease Radiology Reports in a Low-Resource Language [11.688665498310405]
SMP-BERTは、自由テキストラジオグラフィーレポートを自動的に構造化データに変換する新しいプロンプト学習法である。
そこで本研究では,SMP-BERTが従来の微調整法をはるかに上回った。
論文 参考訳(メタデータ) (2024-05-02T19:11:54Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Chest X-ray lung and heart segmentation based on minimal training sets [0.0]
本研究では、アテンションBCDU-Netと呼ばれるディープニューラルネットワークを胸部X線(CXR)画像から肺と心臓のセグメンテーションのタスクに適用する。
微調整されたモデルは、以前の最新結果を上回り、98.1pm 0.1%$ diceスコアと95.2pm 0.1%$ iouスコアに達した。
論文 参考訳(メタデータ) (2021-01-20T20:24:35Z) - Segmentation for Classification of Screening Pancreatic Neuroendocrine
Tumors [72.65802386845002]
本研究は,腹部CTで膵神経内分泌腫瘍(PNET)を早期に検出するための包括的結果を提示する。
我々の知る限りでは、このタスクは以前まで計算タスクとして研究されていなかった。
我々の手法は最先端のセグメンテーションネットワークより優れ、感度は89.47%、特異性は81.08%である。
論文 参考訳(メタデータ) (2020-04-04T21:21:44Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。