論文の概要: Improving ICD coding using Chapter based Named Entities and Attentional Models
- arxiv url: http://arxiv.org/abs/2407.17230v1
- Date: Wed, 24 Jul 2024 12:34:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 13:54:30.603045
- Title: Improving ICD coding using Chapter based Named Entities and Attentional Models
- Title(参考訳): 章ベース名前付きエンティティと注意モデルを用いたICD符号化の改良
- Authors: Abhijith R. Beeravolu, Mirjam Jonkman, Sami Azam, Friso De Boer,
- Abstract要約: 我々は、章ベースの名前付きエンティティと注意モデルを用いて、F1スコアを改善するICD符号化の強化アプローチを導入する。
本手法は, 放電サマリーをICD-9章に分類し, 章別データを用いた注意モデルを開発する。
分類には第IV章を使用し、ニューラルネットワークを使わずに重要な要素や重みをデバイアスし、影響を及ぼす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in natural language processing (NLP) have led to automation in various domains. However, clinical NLP often relies on benchmark datasets that may not reflect real-world scenarios accurately. Automatic ICD coding, a vital NLP task, typically uses outdated and imbalanced datasets like MIMIC-III, with existing methods yielding micro-averaged F1 scores between 0.4 and 0.7 due to many false positives. Our research introduces an enhanced approach to ICD coding that improves F1 scores by using chapter-based named entities and attentional models. This method categorizes discharge summaries into ICD-9 Chapters and develops attentional models with chapter-specific data, eliminating the need to consider external data for code identification. For categorization, we use Chapter-IV to de-bias and influence key entities and weights without neural networks, creating accurate thresholds and providing interpretability for human validation. Post-validation, we develop attentional models for three frequent and three non-frequent codes from Chapter-IV using Bidirectional-Gated Recurrent Units (GRUs) with Attention and Transformer with Multi-head Attention architectures. The average Micro-F1 scores of 0.79 and 0.81 from these models demonstrate significant performance improvements in ICD coding.
- Abstract(参考訳): 自然言語処理(NLP)の最近の進歩は、様々な領域における自動化につながっている。
しかし、臨床NLPは実世界のシナリオを正確に反映しないベンチマークデータセットに依存することが多い。
重要なNLPタスクである自動ICD符号化は、MIMIC-IIIのような時代遅れで不均衡なデータセットを使用するのが一般的であり、既存の手法では多くの偽陽性のために平均F1スコアが0.4から0.7の間である。
本研究は、章ベースの名前付きエンティティと注意モデルを用いて、F1スコアを改善するICD符号化の強化手法を提案する。
本手法は, 放電サマリーをICD-9章に分類し, 章別データを用いた注意モデルを構築し, コード識別のための外部データを検討する必要をなくす。
分類には、第IV章を使用して、ニューラルネットワークなしでキーエンティティやウェイトをデバイアスし、影響を与え、正確なしきい値を作成し、人間のバリデーションに解釈性を提供する。
検証後,2方向ゲート型リカレントユニット(GRU)とマルチヘッド型アテンションアーキテクチャを用いたトランスフォーマーを用いて,章IVの3つの頻繁かつ3つの非頻繁なコードに対する注意モデルを構築した。
これらのモデルの平均的なMicro-F1スコアは0.79と0.81であり、ICD符号化の性能は大幅に向上した。
関連論文リスト
- Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation Models [84.8919069953397]
Self-Taught Recognizer (STAR) は、音声認識システムのための教師なし適応フレームワークである。
その結果,STARは14のドメインで平均13.5%の単語誤り率の相対的な減少を実現していることがわかった。
STARは1時間以内のラベル付きデータを必要とする高いデータ効率を示す。
論文 参考訳(メタデータ) (2024-05-23T04:27:11Z) - In-Context Language Learning: Architectures and Algorithms [73.93205821154605]
我々は、文脈言語学習(ICLL)において、私たちが用語する新しいモデル問題群(英語版)のレンズを通してICLを研究する。
我々は,通常のICLLタスクにおいて,多種多様なニューラルシーケンスモデルを評価する。
論文 参考訳(メタデータ) (2024-01-23T18:59:21Z) - Predicting Infant Brain Connectivity with Federated Multi-Trajectory
GNNs using Scarce Data [54.55126643084341]
既存のディープラーニングソリューションには,3つの大きな制限がある。
我々はフェデレートグラフベースの多軌道進化ネットワークであるFedGmTE-Net++を紹介する。
フェデレーションの力を利用して、限られたデータセットを持つ多種多様な病院の地域学習を集約する。
論文 参考訳(メタデータ) (2024-01-01T10:20:01Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Multi-label Few-shot ICD Coding as Autoregressive Generation with Prompt [7.554528566861559]
本研究では,このマルチラベル分類タスクを自己回帰生成タスクに変換する。
ICD符号の高次元空間を直接予測する代わりに、我々のモデルはテキスト記述の低次元を生成する。
MIMIC-III-few実験により,従来のMIMIC-III-full SOTAモデルよりも大幅に優れるマルコF130.2が得られた。
論文 参考訳(メタデータ) (2022-11-24T22:10:50Z) - Hierarchical Label-wise Attention Transformer Model for Explainable ICD
Coding [10.387366211090734]
臨床文書からのICD符号の予測のための階層型ラベル対応アテンショントランスフォーマモデル (HiLAT) を提案する。
MIMIC-IIIデータベースから,病院の退院サマリーと対応するICD-9符号を用いたHiLATの評価を行った。
注意重みの可視化は、ICDコード予測の顔の妥当性を確認するための潜在的な説明可能性ツールを示す。
論文 参考訳(メタデータ) (2022-04-22T14:12:22Z) - Secondary Use of Clinical Problem List Entries for Neural Network-Based
Disease Code Assignment [1.3190581566723918]
国際疾患分類(ICD-10)を用いた50文字長大臨床問題リストの自動符号化の検討
fastTextベースラインは、マクロ平均F1スコアの0.83に到達し、その後、マクロ平均F1スコアの0.84に文字レベルLSTMが続いた。
ニューラルネットワークのアクティベーション分析と、偽陽性と偽陰性の調査により、一貫性のない手動コーディングが主な制限因子として明らかにされた。
論文 参考訳(メタデータ) (2021-12-27T16:11:05Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z) - Predicting Multiple ICD-10 Codes from Brazilian-Portuguese Clinical
Notes [4.971638713979981]
我々は,ロジスティック回帰モデル,畳み込みニューラルネットワーク (CNN) , Gated Recurrent Unit Neural Network, CNN を開発した。
MIMIC-IIIと比較すると、ブラジルのポルトガル語のデータセットは1文書あたりの単語がはるかに少ない。
CNN-Attモデルでは,MIMIC-IIIでは平均0.537点,追加文書では0.485点のマイクロ平均F1スコアが得られた。
論文 参考訳(メタデータ) (2020-07-29T22:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。