論文の概要: Active learning for medical code assignment
- arxiv url: http://arxiv.org/abs/2104.05741v1
- Date: Mon, 12 Apr 2021 18:11:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 13:44:29.538816
- Title: Active learning for medical code assignment
- Title(参考訳): 医学的コード課題に対するアクティブラーニング
- Authors: Martha Dais Ferreira, Michal Malyska, Nicola Sahar, Riccardo Miotto,
Fernando Paulovich, Evangelos Milios
- Abstract要約: 臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
- 参考スコア(独自算出の注目度): 55.99831806138029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) is widely used to automatically extract meaningful
information from Electronic Health Records (EHR) to support operational,
clinical, and financial decision-making. However, ML models require a large
number of annotated examples to provide satisfactory results, which is not
possible in most healthcare scenarios due to the high cost of clinician-labeled
data. Active Learning (AL) is a process of selecting the most informative
instances to be labeled by an expert to further train a supervised algorithm.
We demonstrate the effectiveness of AL in multi-label text classification in
the clinical domain. In this context, we apply a set of well-known AL methods
to help automatically assign ICD-9 codes on the MIMIC-III dataset. Our results
show that the selection of informative instances provides satisfactory
classification with a significantly reduced training set (8.3\% of the total
instances). We conclude that AL methods can significantly reduce the manual
annotation cost while preserving model performance.
- Abstract(参考訳): 機械学習(ML)は、Electronic Health Records(EHR)から意味のある情報を自動抽出して、手術、臨床、財務の意思決定を支援するために広く使われている。
しかし、mlモデルは十分な結果を提供するために多くの注釈付き例を必要とするが、臨床医がラベルしたデータのコストが高いため、ほとんどの医療シナリオでは不可能である。
アクティブラーニング(al)は、教師付きアルゴリズムをさらに訓練するために専門家がラベル付けする最も有益なインスタンスを選択するプロセスである。
臨床領域における多ラベルテキスト分類におけるALの有効性を示す。
この文脈では、よく知られたalメソッドのセットを適用し、immit-iiiデータセットにicd-9コードを自動的に割り当てるのに役立つ。
以上の結果から,情報化インスタンスの選択は,トレーニングセットの大幅な削減(全インスタンスの8.3\%)で満足な分類を提供することがわかった。
AL手法は,モデル性能を維持しながら手作業によるアノテーションのコストを大幅に削減できる。
関連論文リスト
- MyriadAL: Active Few Shot Learning for Histopathology [10.652626309100889]
我々は、Myriad Active Learning (MAL)という、アクティブな数個のショットラーニングフレームワークを導入する。
MALには、コントラスト学習エンコーダ、擬似ラベル生成、ループ内の新しいクエリサンプル選択が含まれている。
2つの公的な病理組織学データセットの実験により、MALは以前の研究に比べてテスト精度、マクロF1スコア、ラベル効率が優れていることが示された。
論文 参考訳(メタデータ) (2023-10-24T20:08:15Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - M-VAAL: Multimodal Variational Adversarial Active Learning for
Downstream Medical Image Analysis Tasks [16.85572580186212]
アクティブラーニングは、アノテーションの最も有益な例を積極的にサンプリングすることで、大きな注釈付きサンプルの必要性を最小化しようとする。
本稿では,付加的なモーダルからの補助情報を用いてアクティブサンプリングを強化するマルチモーダル変分適応型アクティブラーニング(M-VAAL)手法を提案する。
論文 参考訳(メタデータ) (2023-06-21T16:40:37Z) - Efficient Medical Image Assessment via Self-supervised Learning [27.969767956918503]
高性能なディープラーニング手法は通常、大きな注釈付きトレーニングデータセットに依存する。
本稿では,未ラベルの医用画像データの品質をランク付けするための,新規で効率的なデータアセスメント戦略を提案する。
SSL埋め込み空間の理論的な意味から,我々はMasked Autoencoderを用いて特徴抽出を行う。
論文 参考訳(メタデータ) (2022-09-28T21:39:00Z) - Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。
アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。
マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文 参考訳(メタデータ) (2022-07-21T09:35:38Z) - Federated Cycling (FedCy): Semi-supervised Federated Learning of
Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。
外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2022-03-14T17:44:53Z) - A Systematic Literature Review of Automated ICD Coding and
Classification Systems using Discharge Summaries [5.156484100374058]
フリーテキスト臨床物語の体系化は、資金、保険請求処理、研究などの二次的用途に有用であると長年認識されてきた。
コードの割り当ての現在のシナリオは、非常にコストがかかり、時間がかかり、エラーが発生しやすい手作業のプロセスです。
この体系的な文献レビューは、自動化された臨床コーディングシステムの包括的概要を提供する。
論文 参考訳(メタデータ) (2021-07-12T03:55:17Z) - DEAL: Deep Evidential Active Learning for Image Classification [0.0]
アクティブラーニング(AL)は、限られたラベル付きデータの問題を緩和するためのアプローチである。
CNNの最近のAL手法は、ラベル付けするインスタンスの選択に異なる解決策を提案する。
本稿では,ラベルのないデータから高い予測不確かさを捕捉して効率よく学習する新しいALアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-22T11:14:23Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z) - Confident Coreset for Active Learning in Medical Image Analysis [57.436224561482966]
本稿では,情報的サンプルを効果的に選択するための,不確実性と分散性を考慮した新しい能動的学習手法である信頼コアセットを提案する。
2つの医用画像解析タスクの比較実験により,本手法が他の活動的学習方法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-05T13:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。