論文の概要: Exemplar Auditing for Multi-Label Biomedical Text Classification
- arxiv url: http://arxiv.org/abs/2004.03093v1
- Date: Tue, 7 Apr 2020 02:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:38:58.567442
- Title: Exemplar Auditing for Multi-Label Biomedical Text Classification
- Title(参考訳): マルチラベルバイオメディカルテキスト分類のための経験的監査
- Authors: Allen Schmaltz and Andrew Beam
- Abstract要約: 我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
- 参考スコア(独自算出の注目度): 0.4873362301533824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many practical applications of AI in medicine consist of semi-supervised
discovery: The investigator aims to identify features of interest at a
resolution more fine-grained than that of the available human labels. This is
often the scenario faced in healthcare applications as coarse, high-level
labels (e.g., billing codes) are often the only sources that are readily
available. These challenges are compounded for modalities such as text, where
the feature space is very high-dimensional, and often contains considerable
amounts of noise.
In this work, we generalize a recently proposed zero-shot sequence labeling
method, "binary labeling via a convolutional decomposition", to the case where
the available document-level human labels are themselves relatively
high-dimensional. The approach yields classification with "introspection",
relating the fine-grained features of an inference-time prediction to their
nearest neighbors from the training set, under the model. The approach is
effective, yet parsimonious, as demonstrated on a well-studied MIMIC-III
multi-label classification task of electronic health record data, and is useful
as a tool for organizing the analysis of neural model predictions and
high-dimensional datasets. Our proposed approach yields both a competitively
effective classification model and an interrogation mechanism to aid healthcare
workers in understanding the salient features that drive the model's
predictions.
- Abstract(参考訳): 研究者は、利用可能な人間のラベルよりもきめ細かい解像度で興味のある特徴を特定することを目的としています。
これはしばしば医療アプリケーションで直面するシナリオであり、粗い高水準のラベル(例えば請求コード)が容易に利用できる唯一の情報源である。
これらの課題は、特徴空間が非常に高次元であり、しばしばかなりの量のノイズを含むテキストのようなモダリティに複雑化されている。
本研究では,最近提案されているゼロショットシーケンスラベリング手法「畳み込み分解によるバイナリラベリング」を,利用可能な文書レベルの人間ラベルが相対的に高次元である場合に一般化する。
このアプローチは"イントロスペクション(introspection)"で分類され、モデルの下で、推論時間予測のきめ細かな特徴をトレーニングセットから最も近い隣人に関連付ける。
この手法は、電子健康記録データのMIMIC-IIIマルチラベル分類タスクでよく研究されているように、効果的だが同義的であり、ニューラルモデル予測と高次元データセットの分析を組織化するためのツールとして有用である。
提案手法は,競争的に効果的な分類モデルと問合せ機構を両立させ,医療従事者がモデルの予測を駆動する特徴を理解することを支援する。
関連論文リスト
- A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Multi-stage Retrieve and Re-rank Model for Automatic Medical Coding Recommendation [22.323705343864336]
国際疾患分類(ICD)は、医学的な分類体系である。
ICDインデックスの主な目的は、ICDコードのサブセットを医療記録に割り当てることである。
既存のほとんどのアプローチは、非常に大きなICDコレクションから適切なラベルサブセットを選択することに苦しんだ。
論文 参考訳(メタデータ) (2024-05-29T13:54:30Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Automated Labeling of German Chest X-Ray Radiology Reports using Deep
Learning [50.591267188664666]
本稿では,ルールベースのドイツ語CheXpertモデルによってラベル付けされたレポートに基づいて,ディープラーニングに基づくCheXpertラベル予測モデルを提案する。
その結果,3つのタスクすべてにおいて,ルールベースモデルを大幅に上回ったアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-06-09T16:08:35Z) - HiPrompt: Few-Shot Biomedical Knowledge Fusion via Hierarchy-Oriented
Prompting [33.1455954220194]
HiPromptは、監督効率の良い知識融合フレームワークである。
階層指向のプロンプトを通じて、大規模言語モデルの数発の推論能力を引き出す。
収集したKG-Hi-BKFベンチマークデータセットの実験的結果は、HiPromptの有効性を示している。
論文 参考訳(メタデータ) (2023-04-12T16:54:26Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - Learning Image Labels On-the-fly for Training Robust Classification
Models [13.669654965671604]
ノイズの多いアノテーション(例えば、異なるアルゴリズムベースのラベル付け子から)を一緒に利用し、相互に分類タスクの学習に役立てることができるかを示す。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに出席するように設計されている。
論文 参考訳(メタデータ) (2020-09-22T05:38:44Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。