論文の概要: Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study
- arxiv url: http://arxiv.org/abs/2304.10909v1
- Date: Fri, 21 Apr 2023 11:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 14:53:03.546492
- Title: Automated Medical Coding on MIMIC-III and MIMIC-IV: A Critical Review
and Replicability Study
- Title(参考訳): MIMIC-IIIとMIMIC-IVによる医用コードの自動符号化 : 批判的レビューと再現性の検討
- Authors: Joakim Edin, Alexander Junge, Jakob D. Havtorn, Lasse Borgholt, Maria
Maistro, Tuukka Ruotsalo, Lars Maal{\o}e
- Abstract要約: 我々は、最先端の医療自動化機械学習モデルを再現し、比較し、分析する。
その結果, 弱い構成, サンプル化の不十分さ, 評価の不十分さなどにより, いくつかのモデルの性能が低下していることが判明した。
再生モデルを用いたMIMIC-IVデータセットの総合評価を行った。
- 参考スコア(独自算出の注目度): 60.56194508762205
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical coding is the task of assigning medical codes to clinical free-text
documentation. Healthcare professionals manually assign such codes to track
patient diagnoses and treatments. Automated medical coding can considerably
alleviate this administrative burden. In this paper, we reproduce, compare, and
analyze state-of-the-art automated medical coding machine learning models. We
show that several models underperform due to weak configurations, poorly
sampled train-test splits, and insufficient evaluation. In previous work, the
macro F1 score has been calculated sub-optimally, and our correction doubles
it. We contribute a revised model comparison using stratified sampling and
identical experimental setups, including hyperparameters and decision boundary
tuning. We analyze prediction errors to validate and falsify assumptions of
previous works. The analysis confirms that all models struggle with rare codes,
while long documents only have a negligible impact. Finally, we present the
first comprehensive results on the newly released MIMIC-IV dataset using the
reproduced models. We release our code, model parameters, and new MIMIC-III and
MIMIC-IV training and evaluation pipelines to accommodate fair future
comparisons.
- Abstract(参考訳): 医学的コーディングは、臨床自由テキスト文書に医療コードを割り当てるタスクである。
医療専門家は、患者の診断と治療を追跡するために、手動でこのようなコードを割り当てる。
自動化された医療コーディングは、この管理上の負担を大幅に軽減することができる。
本稿では,最先端の医療用自動コーディング機械学習モデルを再現,比較,分析する。
その結果,弱体化,粗弱な列車試験分割,不十分な評価などにより,いくつかのモデルが過小評価されることが判明した。
前回の研究では、マクロF1スコアが準最適に計算され、補正によって2倍になる。
階層化サンプリングと、ハイパーパラメータと決定境界チューニングを含む同一の実験装置を用いて、モデル比較を改訂した。
予測誤差を分析し,先行研究の仮説を検証・検証する。
分析によれば、全てのモデルはレアコードに苦しむが、長い文書は無視できない影響しか与えない。
最後に、再生モデルを用いたMIMIC-IVデータセットの総合的な結果を示す。
我々のコード、モデルパラメータ、新しいMIMIC-IIIおよびMIMIC-IVトレーニングおよび評価パイプラインをリリースし、将来の公正な比較に適合する。
関連論文リスト
- The Relevance Feature and Vector Machine for health applications [0.11538034264098687]
本稿では,臨床研究における脂肪データ問題に対処する新しいモデルを提案する。
モデル機能は、太いデータ問題のあるいくつかの医療データセットの最先端モデルに対してテストされる。
論文 参考訳(メタデータ) (2024-02-11T01:21:56Z) - Density-Aware Personalized Training for Risk Prediction in Imbalanced
Medical Data [89.79617468457393]
不均衡率(クラス密度差)のトレーニングモデルは、最適以下の予測につながる可能性がある。
この不均衡問題に対するモデルトレーニングのためのフレームワークを提案する。
実世界の医療データセットにおけるモデルの性能向上を実証する。
論文 参考訳(メタデータ) (2022-07-23T00:39:53Z) - Benchmarking AutoML Frameworks for Disease Prediction Using Medical
Claims [7.219529711278771]
我々は、人口統計情報や病気コード用のフラグなど、歴史的行政的主張を用いた大規模なデータセットを作成した。
このデータセット上で3つのAutoMLツールをトレーニングし、2019年の6つの異なる疾患結果を予測するとともに、いくつかのメトリクスでモデルパフォーマンスを評価しました。
全てのモデルでは、精度・リコール曲線の下で低面積を記録し、正の正の予測に失敗し、正の負の速度を高く保った。
論文 参考訳(メタデータ) (2021-07-22T07:34:48Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z) - EventScore: An Automated Real-time Early Warning Score for Clinical
Events [3.3039612529376625]
臨床劣化を示す各種臨床事象の早期予測のための解釈可能なモデルを構築した。
このモデルは2つのデータセットと4つの臨床イベントで評価される。
私達のモデルは手動で記録された特徴を要求しないで完全に自動化することができます。
論文 参考訳(メタデータ) (2021-02-11T11:55:08Z) - An Explainable CNN Approach for Medical Codes Prediction from Clinical
Text [1.7746314978241657]
我々は集中治療室(ICU)における臨床テキストに基づくCNNベースの自動ICD符号化法を開発した。
私たちは、私たちのモデルが各ラベルの局所的および低レベルの機能を学ぶことを可能にするShallow and Wide Attention Convolutional Mechanism(SWAM)を思いつきました。
論文 参考訳(メタデータ) (2021-01-14T02:05:34Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。