Fugu-MT 論文翻訳(概要): Supervised Learning in the Presence of Noise: Application in ICD-10 Code Classification

論文の概要: Supervised Learning in the Presence of Noise: Application in ICD-10 Code Classification

arxiv url: http://arxiv.org/abs/2103.07808v1
Date: Sat, 13 Mar 2021 23:05:50 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-16 14:33:16.927487
Title: Supervised Learning in the Presence of Noise: Application in ICD-10 Code Classification
Title（参考訳）: 騒音状態における教師付き学習:ICD-10コード分類への応用
Authors: Youngwoo Kim, Cheng Li, Bingyang Ye, Amir Tahmasebi and Javed Aslam
Abstract要約: 手動でICDコードを割り当てるのは、大きなコードの語彙とコード間の類似性のためにヒューマンエラーになりがちです。機械学習に基づくアプローチは、真実のトレーニングデータを必要とするため、人間のコーダー間の矛盾はラベル付けにおけるノイズとして表される。本稿では,手作業で割り当てられたicd-10符号の雑音特性を調査し,ラベリングノイズの存在下で頑健なicd-10分類器を訓練する方法を提案する。
参考スコア（独自算出の注目度）: 4.186711841573965
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: ICD coding is the international standard for capturing and reporting health conditions and diagnosis for revenue cycle management in healthcare. Manually assigning ICD codes is prone to human error due to the large code vocabulary and the similarities between codes. Since machine learning based approaches require ground truth training data, the inconsistency among human coders is manifested as noise in labeling, which makes the training and evaluation of ICD classifiers difficult in presence of such noise. This paper investigates the characteristics of such noise in manually-assigned ICD-10 codes and furthermore, proposes a method to train robust ICD-10 classifiers in the presence of labeling noise. Our research concluded that the nature of such noise is systematic. Most of the existing methods for handling label noise assume that the noise is completely random and independent of features or labels, which is not the case for ICD data. Therefore, we develop a new method for training robust classifiers in the presence of systematic noise. We first identify ICD-10 codes that human coders tend to misuse or confuse, based on the codes' locations in the ICD-10 hierarchy, the types of the codes, and baseline classifier's prediction behaviors; we then develop a novel training strategy that accounts for such noise. We compared our method with the baseline that does not handle label noise and the baseline methods that assume random noise, and demonstrated that our proposed method outperforms all baselines when evaluated on expert validated labels.
Abstract（参考訳）: ICDコーディングは、健康状態の把握と報告、およびヘルスケアにおける収益サイクル管理のための診断のための国際標準です。手動でICDコードを割り当てるのは、大きなコードの語彙とコード間の類似性のためにヒューマンエラーになりがちです。機械学習に基づくアプローチは基礎的真理トレーニングデータを必要とするため、人間のコーダ間の不整合はラベリングのノイズとして表され、そのようなノイズの存在下でICD分類器のトレーニングと評価が困難になります。本稿では,手作業で割り当てられたicd-10符号の雑音特性について検討し,ラベルノイズが存在する場合に頑健なicd-10分類器を訓練する方法を提案する。我々の研究は、そのような騒音の性質は体系的であると結論づけた。ラベルノイズを処理する既存の方法のほとんどは、ノイズが完全にランダムであり、機能やラベルに依存しないことを前提としています。そこで,体系的雑音の存在下でロバスト分類器を訓練する新しい手法を開発した。まず、ICD-10階層内のコードの位置、コードの種類、ベースライン分類器の予測行動に基づいて、人間のコーダが誤用または混同する傾向にあるICD-10コードを特定し、そのようなノイズを考慮に入れた新たなトレーニング戦略を開発する。提案手法は,ラベルノイズを扱わないベースラインとランダムノイズを想定するベースラインを比較し,専門家の検証ラベルで評価した場合,提案手法がすべてのベースラインを上回ることを示した。

関連論文リスト

Pre-train to Gain: Robust Learning Without Clean Labels [1.1582652820340928]
ノイズの多いラベルでディープネットワークを訓練すると、一般化が悪く、精度が低下する。ラベルなしで特徴抽出器のバックボーンを事前トレーニングすることで、クリーンなラベルのサブセットを必要とせずに、よりノイズの強いモデルをトレーニングできる。提案手法は,低雑音レベルにおけるImageNet事前学習モデルに匹敵する結果を得たが,高雑音条件下ではかなり優れていた。
論文参考訳（メタデータ） (2025-11-25T20:48:07Z)
Ordinal Adaptive Correction: A Data-Centric Approach to Ordinal Image Classification with Noisy Labels [0.9023847175654603]
雑音ラベルの適応補正にORDinal Adaptive Correction(ORDAC)を提案する。トレーニング中、ORDACは各サンプルのラベル分布の平均偏差と標準偏差を動的に調整する。その結果,ORDACとその拡張バージョンはモデル性能を著しく向上させた。
論文参考訳（メタデータ） (2025-09-02T14:17:16Z)
Training Gradient Boosted Decision Trees on Tabular Data Containing Label Noise for Classification Tasks [1.261491746208123]
本研究の目的は,ラベルノイズが勾配ブースト決定木に及ぼす影響とそれらの効果を緩和する方法を検討することである。提案手法は,成人のデータセットに対して最先端のノイズ検出性能を示し,成人および乳癌のデータセットに対して最も高い分類精度とリコールを実現する。
論文参考訳（メタデータ） (2024-09-13T09:09:24Z)
Learning Discriminative Dynamics with Label Corruption for Noisy Label Detection [25.55455239006278]
トレーニング信号のダイナミクスに基づいて,誤ラベル付きインスタンスと正しくラベル付けされたインスタンスを識別するDynaCorフレームワークを提案する。我々の総合的な実験により、DynaCorは最先端のライバルより優れており、様々なノイズタイプやノイズレートに対して強い堅牢性を示している。
論文参考訳（メタデータ） (2024-05-30T10:06:06Z)
A noisy elephant in the room: Is your out-of-distribution detector robust to label noise? [49.88894124047644]
我々は、最先端のOOD検出方法20について詳しく検討する。不正に分類されたIDサンプルとOODサンプルの分離が不十分であることを示す。
論文参考訳（メタデータ） (2024-04-02T09:40:22Z)
SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.38948127630644]
本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文参考訳（メタデータ） (2024-03-21T08:49:34Z)
Learning to Correct Noisy Labels for Fine-Grained Entity Typing via Co-Prediction Prompt Tuning [9.885278527023532]
FETにおける雑音補正のためのコプレディション・プロンプト・チューニングを提案する。ラベル付きラベルをリコールするために予測結果を統合し、区別されたマージンを用いて不正確なラベルを識別する。広範に使われている3つのFETデータセットの実験結果から,我々のノイズ補正アプローチはトレーニングサンプルの品質を著しく向上させることが示された。
論文参考訳（メタデータ） (2023-10-23T06:04:07Z)
Class Prototype-based Cleaner for Label Noise Learning [73.007001454085]
半教師付き学習法は、雑音ラベル学習問題に対する現在のSOTAソリューションである。 textbfClass textbfPrototype-based label textbfCleaner。
論文参考訳（メタデータ） (2022-12-21T04:56:41Z)
S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文参考訳（メタデータ） (2021-11-22T15:49:20Z)
Improving Medical Image Classification with Label Noise Using Dual-uncertainty Estimation [72.0276067144762]
医用画像における2種類のラベルノイズについて論じ,定義する。医用画像分類作業中にこれら2つのラベルノイズを処理する不確実性推定に基づくフレームワークを提案する。
論文参考訳（メタデータ） (2021-02-28T14:56:45Z)
Towards Robustness to Label Noise in Text Classification via Noise Modeling [7.863638253070439]
NLPの大規模なデータセットは、誤った自動および人間のアノテーション手順のために、ノイズの多いラベルに悩まされる。本稿では,ラベルノイズを用いたテキスト分類の問題について検討し,分類器上での補助雑音モデルを用いてこのノイズを捉えることを目的とする。
論文参考訳（メタデータ） (2021-01-27T05:41:57Z)
A Second-Order Approach to Learning with Instance-Dependent Label Noise [58.555527517928596]
ラベルノイズの存在は、しばしばディープニューラルネットワークのトレーニングを誤解させる。人間による注釈付きラベルのエラーは、タスクの難易度レベルに依存する可能性が高いことを示しています。
論文参考訳（メタデータ） (2020-12-22T06:36:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。