論文の概要: Read, Attend, and Code: Pushing the Limits of Medical Codes Prediction
from Clinical Notes by Machines
- arxiv url: http://arxiv.org/abs/2107.10650v1
- Date: Sat, 10 Jul 2021 06:01:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-25 11:57:36.307658
- Title: Read, Attend, and Code: Pushing the Limits of Medical Codes Prediction
from Clinical Notes by Machines
- Title(参考訳): 読み, 注意, コード: 機械による臨床ノートから医療用コード予測の限界を推し進める
- Authors: Byung-Hak Kim and Varun Ganapathi
- Abstract要約: 医用コード代入マッピングを学習するための、読み取り、 attend、および Code (RAC) モデルを提示する。
RACは、現在最高のマクロF1を18.7%上回るSOTA(the New State of the Art)を確立している。
この新たなマイルストーンは、マシンにおける完全自律型医療コーディング(AMC)への重要な一歩となる。
- 参考スコア(独自算出の注目度): 0.42641920138420947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prediction of medical codes from clinical notes is both a practical and
essential need for every healthcare delivery organization within current
medical systems. Automating annotation will save significant time and excessive
effort spent by human coders today. However, the biggest challenge is directly
identifying appropriate medical codes out of several thousands of
high-dimensional codes from unstructured free-text clinical notes. In the past
three years, with Convolutional Neural Networks (CNN) and Long Short-Term
Memory (LTSM) networks, there have been vast improvements in tackling the most
challenging benchmark of the MIMIC-III-full-label inpatient clinical notes
dataset. This progress raises the fundamental question of how far automated
machine learning (ML) systems are from human coders' working performance. We
assessed the baseline of human coders' performance on the same subsampled
testing set. We also present our Read, Attend, and Code (RAC) model for
learning the medical code assignment mappings. By connecting convolved
embeddings with self-attention and code-title guided attention modules,
combined with sentence permutation-based data augmentations and stochastic
weight averaging training, RAC establishes a new state of the art (SOTA),
considerably outperforming the current best Macro-F1 by 18.7%, and reaches past
the human-level coding baseline. This new milestone marks a meaningful step
toward fully autonomous medical coding (AMC) in machines reaching parity with
human coders' performance in medical code prediction.
- Abstract(参考訳): 臨床ノートから医療コードを予測することは、現在の医療システム内のすべての医療提供組織にとって実用的かつ本質的な必要性である。
アノテーションの自動化は、今日の人間のコーダーによる多大な時間と過剰な労力を節約します。
しかし、最大の課題は、構造化されていないフリーテキスト臨床ノートから数千の高次元コードの中から適切な医療コードを直接識別することである。
過去3年間で、CNN(Convolutional Neural Networks)とLTSM(Long Short-Term Memory)ネットワークによって、MIMIC-III-full-label in patient Clinical Noteデータセットの最も難しいベンチマークに対処する上で、大幅な改善が行われた。
この進歩は、自動機械学習(ML)システムが人間のプログラマの作業パフォーマンスからどこまで遠いのかという根本的な疑問を提起する。
同じサブサンプルテストセット上で,人間のコーダのパフォーマンスのベースラインを評価した。
また、医療コードの割り当てマッピングを学習するための、読み取り、アテント、コード(RAC)モデルも提示します。
結合した埋め込みと自己注意とコードタイトル誘導注意モジュールを結合し、文置換に基づくデータ拡張と確率的ウェイト平均化トレーニングを組み合わせることで、RACは新たな技術状態(SOTA)を確立し、現在の最高のマクロF1を18.7%上回り、人間レベルのコーディングベースラインを通り過ぎている。
この新たなマイルストーンは、医療コード予測における人間のコーダのパフォーマンスと同等に達するマシンにおける完全自律型医療コーディング(AMC)への重要なステップである。
関連論文リスト
- MedCodER: A Generative AI Assistant for Medical Coding [3.7153274758003967]
我々は、自動医療コーディングのためのジェネレーティブAIフレームワークであるMedCodERを紹介する。
MedCodERは、ICD(International Classification of Diseases)コード予測において、マイクロF1スコアの0.60を達成している。
疾患診断,ICD符号,エビデンステキストを付加した医療記録を含む新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-09-18T19:36:33Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study [60.56194508762205]
我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
論文 参考訳(メタデータ) (2023-04-21T11:54:44Z) - Medical Codes Prediction from Clinical Notes: From Human Coders to
Machines [0.21320960069210473]
臨床ノートから医療コードを予測することは、すべての医療提供組織にとって実用的で不可欠である。
最大の課題は、構造化されていないフリーテキスト臨床ノートから数千の高次元コードから適切な医療コードを直接識別することである。
最近の研究では、本格的なディープラーニングベースの手法による最先端のコード予測結果が示されている。
論文 参考訳(メタデータ) (2022-10-30T14:24:13Z) - Can Current Explainability Help Provide References in Clinical Notes to
Support Humans Annotate Medical Codes? [53.45585591262433]
本稿では、注意スコアに基づくxRAC-ATTNと、モデルに依存しない知識蒸留に基づくxRAC-KDの2つのアプローチについて説明する。
我々は,xRAC-ATTNが強調した支持エビデンステキストが,xRAC-KDよりも高品質であるのに対して,xRAC-KDは本番環境において潜在的に有利であることを示した。
論文 参考訳(メタデータ) (2022-10-28T04:06:07Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Multitask Recalibrated Aggregation Network for Medical Code Prediction [19.330911490203317]
長期かつノイズの多い臨床文書の符号化の課題を解決するために,マルチタスク再校正アグリゲーションネットワークを提案する。
特に、マルチタスク学習は、異なるコーディングスキーム間で情報を共有し、異なる医療コード間の依存関係をキャプチャする。
実世界のMIMIC-IIIデータセットによる実験では、予測性能が大幅に向上した。
論文 参考訳(メタデータ) (2021-04-02T09:22:10Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Medical Code Assignment with Gated Convolution and Note-Code Interaction [39.079615516043674]
本稿では,医療コードの自動割り当てのための新しい手法,ゲート畳み込みニューラルネットワーク,ノートコードインタラクション(GatedCNN-NCI)を提案する。
新たなノート-コードインタラクション設計とグラフメッセージパッシング機構により、ノートとコード間の基盤となる依存関係を明示的にキャプチャする。
提案モデルはほとんどの場合,最先端モデルよりも優れており,モデルサイズは軽量ベースラインと同程度である。
論文 参考訳(メタデータ) (2020-10-14T11:37:24Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。