論文の概要: Prediction of ICD Codes with Clinical BERT Embeddings and Text
Augmentation with Label Balancing using MIMIC-III
- arxiv url: http://arxiv.org/abs/2008.10492v1
- Date: Mon, 24 Aug 2020 14:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 09:07:34.599315
- Title: Prediction of ICD Codes with Clinical BERT Embeddings and Text
Augmentation with Label Balancing using MIMIC-III
- Title(参考訳): MIMIC-IIIを用いたクリニカルBERT埋め込みによるICD符号の予測とラベルバランスによるテキスト拡張
- Authors: Brent Biseda, Gaurav Desai, Haifeng Lin, and Anish Philip
- Abstract要約: 本報告では,MIMIC-IIIデータセットを用いたICD符号予測タスクにおける技術成果について述べる。
本研究は,学習中の文の順序を狭めるために,新しいテキスト増補を用いたことを中心に,改良された性能が評価されたことに起因する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper achieves state of the art results for the ICD code prediction task
using the MIMIC-III dataset. This was achieved through the use of Clinical BERT
(Alsentzer et al., 2019). embeddings and text augmentation and label balancing
to improve F1 scores for both ICD Chapter as well as ICD disease codes. We
attribute the improved performance mainly to the use of novel text augmentation
to shuffle the order of sentences during training. In comparison to the Top-32
ICD code prediction (Keyang Xu, et. al.) with an F1 score of 0.76, we achieve a
final F1 score of 0.75 but on a total of the top 50 ICD codes.
- Abstract(参考訳): 本報告では,MIMIC-IIIデータセットを用いたICD符号予測タスクにおける技術成果について述べる。
これは臨床用bert(alsentzer et al., 2019)の使用によって達成された。
埋め込みとテキスト拡張とラベルバランスは、ICD章とICD病コードの両方のF1スコアを改善する。
学習中の文章の順序をシャッフルするために,新しいテキスト拡張を用いたことによる性能向上が主である。
トップ32icd符号予測(keyang xu, et. al.)とf1スコア0.76と比較すると、最終的なf1スコアは0.75であるが、トップ50icd符号の総数である。
関連論文リスト
- CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Can GPT-3.5 Generate and Code Discharge Summaries? [45.633849969788315]
ICD-10のコード記述リストに基づいて,9,606個の放電サマリーを生成し,符号化した。
ニューラルネットワークモデルはベースラインと拡張データに基づいて訓練された。
マイクロF1スコアとマクロF1スコアを全コードセット、生成コードおよびそれらの家族について報告する。
論文 参考訳(メタデータ) (2024-01-24T15:10:13Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - Multi-label Few-shot ICD Coding as Autoregressive Generation with Prompt [7.554528566861559]
本研究では,このマルチラベル分類タスクを自己回帰生成タスクに変換する。
ICD符号の高次元空間を直接予測する代わりに、我々のモデルはテキスト記述の低次元を生成する。
MIMIC-III-few実験により,従来のMIMIC-III-full SOTAモデルよりも大幅に優れるマルコF130.2が得られた。
論文 参考訳(メタデータ) (2022-11-24T22:10:50Z) - Knowledge Injected Prompt Based Fine-tuning for Multi-label Few-shot ICD
Coding [7.8183215844641]
本研究は,ラベルセマンティクスを用いたプロンプトベースファインチューニング手法を適用することで,長期的課題に対処する。
コード代入のベンチマークデータセットであるMIMIC-III-fullの実験により,提案手法はマルコF1の14.5%で従来の最先端手法よりも優れた性能を示した。
本モデルでは, マルコF1を17.1から30.4に改善し, マイクロF1を17.2から32.6に改善した。
論文 参考訳(メタデータ) (2022-10-07T03:25:58Z) - Hierarchical Label-wise Attention Transformer Model for Explainable ICD
Coding [10.387366211090734]
臨床文書からのICD符号の予測のための階層型ラベル対応アテンショントランスフォーマモデル (HiLAT) を提案する。
MIMIC-IIIデータベースから,病院の退院サマリーと対応するICD-9符号を用いたHiLATの評価を行った。
注意重みの可視化は、ICDコード予測の顔の妥当性を確認するための潜在的な説明可能性ツールを示す。
論文 参考訳(メタデータ) (2022-04-22T14:12:22Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - Few-Shot Electronic Health Record Coding through Graph Contrastive
Learning [64.8138823920883]
我々は,グラフベースのEHRコーディングフレームワークであるCoGraphを用いて,頻繁かつ希少なICD符号の性能向上を図る。
CoGraphは、異なるICDコードからHEWEグラフ間の類似点と相似点を学習し、それら間で情報を転送する。
2つのグラフコントラスト学習スキームであるGSCLとGECLは、HEWEグラフ構造を利用して、転送可能な特徴を符号化する。
論文 参考訳(メタデータ) (2021-06-29T14:53:17Z) - Medical Code Prediction from Discharge Summary: Document to Sequence
BERT using Sequence Attention [0.0]
ICD符号の自動割り当てにシーケンスアテンション法を用いた変換器(BERT)からの双方向エンコーダ表現に基づくモデルを提案する。
我々はMIMIC-IIIベンチマークデータセットのap-proachを評価した。
論文 参考訳(メタデータ) (2021-06-15T07:35:50Z) - Ensemble model for pre-discharge icd10 coding prediction [45.82374977939355]
正確なコード予測のための複数の臨床データソースを組み込んだアンサンブルモデルを提案する。
平均精度は0.73および0.58、F1スコアは0.56および0.35、患者および外来データセットの主診断予測では0.71および0.4のマルチラベル分類精度を得る。
論文 参考訳(メタデータ) (2020-12-16T07:02:56Z) - Predicting Multiple ICD-10 Codes from Brazilian-Portuguese Clinical
Notes [4.971638713979981]
我々は,ロジスティック回帰モデル,畳み込みニューラルネットワーク (CNN) , Gated Recurrent Unit Neural Network, CNN を開発した。
MIMIC-IIIと比較すると、ブラジルのポルトガル語のデータセットは1文書あたりの単語がはるかに少ない。
CNN-Attモデルでは,MIMIC-IIIでは平均0.537点,追加文書では0.485点のマイクロ平均F1スコアが得られた。
論文 参考訳(メタデータ) (2020-07-29T22:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。