論文の概要: Extracting Post-Acute Sequelae of SARS-CoV-2 Infection Symptoms from Clinical Notes via Hybrid Natural Language Processing
- arxiv url: http://arxiv.org/abs/2508.12405v1
- Date: Sun, 17 Aug 2025 15:43:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.747571
- Title: Extracting Post-Acute Sequelae of SARS-CoV-2 Infection Symptoms from Clinical Notes via Hybrid Natural Language Processing
- Title(参考訳): ハイブリッド自然言語処理によるSARS-CoV-2感染症状の抽出
- Authors: Zilong Bai, Zihan Xu, Cong Sun, Chengxi Zang, H. Timothy Bunnell, Catherine Sinfield, Jacqueline Rutter, Aaron Thomas Martinez, L. Charles Bailey, Mark Weiner, Thomas R. Campion, Thomas Carton, Christopher B. Forrest, Rainu Kaushal, Fei Wang, Yifan Peng,
- Abstract要約: 我々は,ルールに基づく名前付きエンティティ認識とBERTに基づくアサーション検出モジュールを統合するハイブリッド自然言語処理パイプラインを開発した。
人口レベルの有病率調査では,47,654件の経過ノートを収集した。
パイプラインは各音符を平均2.448pm 0.812$秒で処理した。
- 参考スコア(独自算出の注目度): 20.25145258120295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately and efficiently diagnosing Post-Acute Sequelae of COVID-19 (PASC) remains challenging due to its myriad symptoms that evolve over long- and variable-time intervals. To address this issue, we developed a hybrid natural language processing pipeline that integrates rule-based named entity recognition with BERT-based assertion detection modules for PASC-symptom extraction and assertion detection from clinical notes. We developed a comprehensive PASC lexicon with clinical specialists. From 11 health systems of the RECOVER initiative network across the U.S., we curated 160 intake progress notes for model development and evaluation, and collected 47,654 progress notes for a population-level prevalence study. We achieved an average F1 score of 0.82 in one-site internal validation and 0.76 in 10-site external validation for assertion detection. Our pipeline processed each note at $2.448\pm 0.812$ seconds on average. Spearman correlation tests showed $\rho >0.83$ for positive mentions and $\rho >0.72$ for negative ones, both with $P <0.0001$. These demonstrate the effectiveness and efficiency of our models and their potential for improving PASC diagnosis.
- Abstract(参考訳): 新型コロナウイルス(PASC)のポストアカット・セケラエ(英語版)の正確な診断は、長期と変動の間隔で進行する無数の症状のため、依然として困難である。
そこで本研究では,ルールベースのエンティティ認識とBERTベースのアサーション検出モジュールを統合し,臨床ノートからのPASC症状抽出とアサーション検出を行うハイブリッド自然言語処理パイプラインを開発した。
臨床専門医による包括的PASCレキシコンを開発した。
米国全土のRECOVERイニシアチブネットワークの11の健康システムから、モデル開発と評価のための160のインテーク進捗ノートを収集し、人口レベルの有病率調査のために47,654の進捗ノートを収集した。
平均F1スコアは1サイト内検定では0.82、アサーション検出では10サイト外検定では0.76であった。
パイプラインは各音符を平均2.448\pm 0.812$秒で処理した。
スピアマン相関試験では、正の言及に対して$\rho >0.83$、負の言及に対して$\rho > 0.72$、ともに$P <0.0001$であった。
これらの結果は,本モデルの有効性と有効性を示し,PASC診断の改善の可能性を示した。
関連論文リスト
- On the effectiveness of smartphone IMU sensors and Deep Learning in the detection of cardiorespiratory conditions [0.21987601456703473]
本研究は, 心肺疾患の早期スクリーニングのための, 取得プロトコルに基づく革新的な手法を提案する。
5つの異なる身体領域の加速度計とジャイロスコープで得られた呼吸動態を記録したデータセットを臨床的に収集した。
本研究では,早期心肺疾患スクリーニングのためのエンド・ツー・エンドのディープラーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2024-08-27T18:29:47Z) - SDoH-GPT: Using Large Language Models to Extract Social Determinants of Health (SDoH) [43.79125048893811]
SDoH-GPTは,医療用ノートから健康の社会的決定因子を抽出する,シンプルで効果的なLarge Language Model (LLM) 法である。
これは時間とコストでそれぞれ10倍と20倍の削減を実現し、コーエンのカッパの最大0.92で測定された人間のアノテータとの整合性が向上した。
本研究は, LLMを医療ノート分類に革命をもたらす可能性を強調し, 時間とコストを大幅に削減して, 高精度な分類を実現する能力を示す。
論文 参考訳(メタデータ) (2024-07-24T09:57:51Z) - Thyroidiomics: An Automated Pipeline for Segmentation and Classification of Thyroid Pathologies from Scintigraphy Images [0.23960026858846614]
本研究の目的は,甲状腺シンチグラフィー画像を用いた甲状腺疾患分類を向上する自動パイプラインを開発することである。
2,643人の甲状腺シンチグラフィー画像を収集し,DG(diffuse goiter),MNG(multinodal goiter),甲状腺炎(TH)に分類した。
パイプラインは、さまざまなクラスにわたるいくつかの分類指標で、医師のセグメンテーションに匹敵するパフォーマンスを示した。
論文 参考訳(メタデータ) (2024-07-14T21:29:28Z) - Quantifying Impairment and Disease Severity Using AI Models Trained on
Healthy Subjects [27.786240241494436]
Confidence-based chaRacterization of Anomalies (COBRA) スコアは、障害または疾患のある患者に提示された場合、これらのモデルの信頼性の低下を利用する。
脳卒中患者の上半身障害の現在の臨床的評価の鍵となる限界にCOBRAスコアを適用した。
論文 参考訳(メタデータ) (2023-11-21T18:45:52Z) - Deep Reinforcement Learning for Cost-Effective Medical Diagnosis [41.10546022107126]
強化学習を用いて、以前の観測結果に基づいて順次実験室のテストパネルを選択する動的ポリシーを探索する。
エンド・ツー・エンドのトレーニングやオンライン学習と互換性のあるセミモデルに基づく深層診断ポリシー最適化フレームワークを提案する。
SM-DDPOは、フェリチン異常検出、敗血症死亡予測、急性腎障害の診断など、様々な臨床的タスクでテストされている。
論文 参考訳(メタデータ) (2023-02-20T19:47:25Z) - Sparse Dynamical Features generation, application to Parkinson's Disease
diagnosis [0.0]
本稿では,脳波の動的,頻度,時間的内容を用いて脳の機能に着想を得た新しいアプローチを提案する。
本手法は,N=50名の被験者を含む3眼球聴覚タスク中に記録された脳波信号を含む公開データセットを用いて評価し,そのうち25名がPDに罹患した。
論文 参考訳(メタデータ) (2022-10-20T22:39:29Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - Dual-Sampling Attention Network for Diagnosis of COVID-19 from Community
Acquired Pneumonia [46.521323145636906]
胸部CT(Central Computed Tomography)において,地域肺炎(CAP)からCOVID-19を自動診断するデュアルサンプリングアテンションネットワークを開発した。
特に,3D畳み込みネットワーク(CNN)を用いた新しいオンラインアテンションモジュールを提案する。
我々のアルゴリズムは、受信機動作特性曲線(AUC)値0.944、精度87.5%、感度86.9%、特異度90.1%、F1スコア82.0%の領域で、COVID-19画像を識別することができる。
論文 参考訳(メタデータ) (2020-05-06T09:56:51Z) - Automated Quantification of CT Patterns Associated with COVID-19 from
Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。
この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。
このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文 参考訳(メタデータ) (2020-04-02T21:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。