論文の概要: Improving the Performance of Radiology Report De-identification with Large-Scale Training and Benchmarking Against Cloud Vendor Methods
- arxiv url: http://arxiv.org/abs/2511.04079v1
- Date: Thu, 06 Nov 2025 05:37:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.316837
- Title: Improving the Performance of Radiology Report De-identification with Large-Scale Training and Benchmarking Against Cloud Vendor Methods
- Title(参考訳): 大規模トレーニングとクラウドベンダ手法のベンチマークによる放射線診断レポートの非識別化
- Authors: Eva Prakash, Maayane Attias, Pierre Chambon, Justin Xu, Steven Truong, Jean-Benoit Delbrouck, Tessa Cook, Curtis Langlotz,
- Abstract要約: 我々は、スタンフォード大学から2つの大きな注釈付き放射線学コーパスを微調整することで、最先端のトランスフォーマーベースのPHI識別パイプラインを構築した。
スタンフォードとペンシルバニア大学によるトークンレベルのPHI検出実験において, モデル性能を評価した。
- 参考スコア(独自算出の注目度): 4.980073263011964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: To enhance automated de-identification of radiology reports by scaling transformer-based models through extensive training datasets and benchmarking performance against commercial cloud vendor systems for protected health information (PHI) detection. Materials and Methods: In this retrospective study, we built upon a state-of-the-art, transformer-based, PHI de-identification pipeline by fine-tuning on two large annotated radiology corpora from Stanford University, encompassing chest X-ray, chest CT, abdomen/pelvis CT, and brain MR reports and introducing an additional PHI category (AGE) into the architecture. Model performance was evaluated on test sets from Stanford and the University of Pennsylvania (Penn) for token-level PHI detection. We further assessed (1) the stability of synthetic PHI generation using a "hide-in-plain-sight" method and (2) performance against commercial systems. Precision, recall, and F1 scores were computed across all PHI categories. Results: Our model achieved overall F1 scores of 0.973 on the Penn dataset and 0.996 on the Stanford dataset, outperforming or maintaining the previous state-of-the-art model performance. Synthetic PHI evaluation showed consistent detectability (overall F1: 0.959 [0.958-0.960]) across 50 independently de-identified Penn datasets. Our model outperformed all vendor systems on synthetic Penn reports (overall F1: 0.960 vs. 0.632-0.754). Discussion: Large-scale, multimodal training improved cross-institutional generalization and robustness. Synthetic PHI generation preserved data utility while ensuring privacy. Conclusion: A transformer-based de-identification model trained on diverse radiology datasets outperforms prior academic and commercial systems in PHI detection and establishes a new benchmark for secure clinical text processing.
- Abstract(参考訳): 目的: 広範囲なトレーニングデータセットを通じてトランスフォーマーベースのモデルをスケールし、保護された健康情報(PHI)検出のために商用のクラウドベンダーシステムに対してパフォーマンスをベンチマークすることにより、放射線学レポートの自動識別を向上する。
材料と方法:本研究は,胸部X線,胸部CT,腹部・骨盤CT,脳MRを包含し,さらにPHIカテゴリー(AGE)をアーキテクチャに導入することにより,最先端の変圧器を用いたPHI脱同定パイプラインを構築した。
スタンフォードとペンシルバニア大学(ペンシルベニア大学)によるトークンレベルのPHI検出実験において,モデル性能を評価した。
さらに,(1)ハイド・イン・プレーン・シット法による合成PHI生成の安定性と,(2)商用システムに対する性能について検討した。
精度、リコール、F1スコアはすべてのPHIカテゴリで計算された。
結果:本モデルでは,Pennデータセットで0.973点,Stanfordデータセットで0.996点のスコアが得られた。
合成PHI評価では,50個のペンデータセットに対して一貫した検出性(全F1:0.959[0.958-0.960])を示した。
我々のモデルは、合成ペンレポート(F1:0.960 vs. 0.632-0.754)で全てのベンダーシステムを上回った。
議論: 大規模マルチモーダルトレーニングは、クロスインスティカルな一般化とロバストネスを改善した。
合成PHI生成は、プライバシを確保しながらデータユーティリティを保存する。
結論: 多様な放射線学データセットに基づいて訓練されたトランスフォーマーに基づく非識別モデルは,PHI検出において学術・商業システムよりも優れ,安全な臨床テキスト処理のための新しいベンチマークを確立する。
関連論文リスト
- Skin Cancer Classification: Hybrid CNN-Transformer Models with KAN-Based Fusion [0.0]
Convolutional Kolmogorov-Arnold Network (CKAN) を用いた逐次および並列ハイブリッドCNN-Transformerモデルについて検討する。
そこでCNNは局所的な空間的特徴を抽出し、トランスフォーマーはグローバルな依存関係をモデル化し、CKANは表現学習を改善するために非線形な特徴融合を促進する。
HAM10000データセットで92.81%の精度と92.47%のF1スコア、PAD-UFESデータセットで97.83%のF1スコア、91.79%のF1スコア、91.17%のF1スコアを示す。
論文 参考訳(メタデータ) (2025-08-17T19:57:34Z) - PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets [0.0]
我々は、様々な臨床データセット間で堅牢な発作検出を可能にする、革新的なオープンソースの機械学習フレームワークを導入する。
堅牢性を高めるため、このフレームワークは自動前処理パイプラインを組み込んで、データの標準化と過半数の投票機構を備えている。
データセット内のモデルをトレーニングし、チューニングし、評価し、データセット間の転送可能性を評価します。
論文 参考訳(メタデータ) (2025-08-10T09:12:29Z) - BioSerenity-E1: a self-supervised EEG model for medical applications [0.0]
BioSerenity-E1は臨床脳波治療のための自己監督型基礎モデルの1つである。
スペクトルトークン化とマスク付き予測を組み合わせることで、関連する診断タスク間で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-03-13T13:42:46Z) - Simulated patient systems are intelligent when powered by large language model-based AI agents [32.73072809937573]
我々は,大規模言語モデルに基づくAIエージェントを用いた,インテリジェントシミュレートされた患者システムAIatientを開発した。
このシステムにはRetrieval Augmented Generationフレームワークが組み込まれており、複雑な推論のために6つのタスク固有のLLMベースのAIエージェントが使用されている。
シミュレーションの現実のために、このシステムはAIPatient KG (Knowledge Graph) も利用している。
論文 参考訳(メタデータ) (2024-09-27T17:17:15Z) - Phikon-v2, A large and public feature extractor for biomarker prediction [42.52549987351643]
我々は、DINOv2を用いて視覚変換器を訓練し、このモデルの1つのイテレーションを公開して、Phikon-v2と呼ばれるさらなる実験を行う。
Phikon-v2は、公開されている組織学のスライドをトレーニングしながら、以前リリースしたモデル(Phikon)を上回り、プロプライエタリなデータでトレーニングされた他の病理学基盤モデル(FM)と同等に動作します。
論文 参考訳(メタデータ) (2024-09-13T20:12:29Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - A Federated Learning Framework for Stenosis Detection [70.27581181445329]
本研究は,冠動脈造影画像(CA)の狭窄検出におけるFL(Federated Learning)の使用について検討した。
アンコナのOspedale Riuniti(イタリア)で取得した200人の患者1219枚の画像を含む2施設の異種データセットについて検討した。
データセット2には、文献で利用可能な90人の患者からの7492のシーケンシャルな画像が含まれている。
論文 参考訳(メタデータ) (2023-10-30T11:13:40Z) - The Utility of the Virtual Imaging Trials Methodology for Objective Characterization of AI Systems and Training Data [1.6040478776985583]
臨床および仮想CTとCXRを用いた畳み込みニューラルネットワークを用いた新型コロナウイルスの診断例について検討した。
複数のAIモデルは、多様なデータセットにわたる3D ResNet-likeと2D EfficientNetv2アーキテクチャを使用して開発、テストされた。
VITアプローチは、モデルの透明性と信頼性を高めるために使用することができ、AIのパフォーマンスを駆動する要因に関する微妙な洞察を提供し、実験的および臨床的設定のギャップを埋める。
論文 参考訳(メタデータ) (2023-08-17T19:12:32Z) - Clinical Concept and Relation Extraction Using Prompt-based Machine
Reading Comprehension [38.79665143111312]
我々は,統合されたプロンプトベース機械読解アーキテクチャを用いて,臨床概念抽出と関係抽出の両方を定式化する。
MRCモデルと既存のディープラーニングモデルを比較し,概念抽出とエンドツーエンド関係抽出を行う。
クロスインスティテュート・セッティングにおいて,提案したMRCモデルの伝達学習能力を評価する。
論文 参考訳(メタデータ) (2023-03-14T22:37:31Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。