論文の概要: Why I'm not Answering: Understanding Determinants of Classification of
an Abstaining Classifier for Cancer Pathology Reports
- arxiv url: http://arxiv.org/abs/2009.05094v5
- Date: Thu, 21 Apr 2022 16:45:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:54:25.476979
- Title: Why I'm not Answering: Understanding Determinants of Classification of
an Abstaining Classifier for Cancer Pathology Reports
- Title(参考訳): なぜ答えないのか : 癌病理診断のための既知分類器の分類決定因子の理解
- Authors: Sayera Dhaubhadel, Jamaludin Mohd-Yusof, Kumkum Ganguly, Gopinath
Chennupati, Sunil Thulasidasan, Nicolas W. Hengartner, Brent J. Mumphrey,
Eric B. Durbin, Jennifer A. Doherty, Mireille Lemieux, Noah Schaefferkoetter,
Georgia Tourassi, Linda Coyle, Lynne Penberthy, Benjamin H. McMahon and
Tanmoy Bhattacharya
- Abstract要約: NCI SEERがん登録簿から癌病理報告を分類するためのマルチタスク・セッティングにおける留置型分類器を実証した。
これらの課題に対して,25~45%の報告を棄却することにより,分類誤差率を2~5の因子で低減する。
LIMEは単語の出現のみの尺度よりも分類の判断力が高いことを示す。
- 参考スコア(独自算出の注目度): 4.4899047638852085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safe deployment of deep learning systems in critical real world applications
requires models to make very few mistakes, and only under predictable
circumstances. In this work, we address this problem using an abstaining
classifier that is tuned to have $>$95% accuracy, and then identify the
determinants of abstention using LIME. Essentially, we are training our model
to learn the attributes of pathology reports that are likely to lead to
incorrect classifications, albeit at the cost of reduced sensitivity. We
demonstrate an abstaining classifier in a multitask setting for classifying
cancer pathology reports from the NCI SEER cancer registries on six tasks of
interest. For these tasks, we reduce the classification error rate by factors
of 2--5 by abstaining on 25--45% of the reports. For the specific task of
classifying cancer site, we are able to identify metastasis, reports involving
lymph nodes, and discussion of multiple cancer sites as responsible for many of
the classification mistakes, and observe that the extent and types of mistakes
vary systematically with cancer site (e.g., breast, lung, and prostate). When
combining across three of the tasks, our model classifies 50% of the reports
with an accuracy greater than 95% for three of the six tasks\edit, and greater
than 85% for all six tasks on the retained samples. Furthermore, we show that
LIME provides a better determinant of classification than measures of word
occurrence alone. By combining a deep abstaining classifier with feature
identification using LIME, we are able to identify concepts responsible for
both correctness and abstention when classifying cancer sites from pathology
reports. The improvement of LIME over keyword searches is statistically
significant, presumably because words are assessed in context and have been
identified as a local determinant of classification.
- Abstract(参考訳): 重要な現実世界のアプリケーションにディープラーニングシステムの安全なデプロイを行うには、ごくわずかなミスを犯すモデルが必要である。
そこで本研究では,95%の精度を持つように調整された禁忌分類器を用いてこの問題に対処し,石灰を用いて禁忌決定要因を同定する。
本質的には、感度を低下させるコストはあるものの、誤った分類につながる可能性のある病理報告の属性を学ぶために、モデルをトレーニングしています。
本研究は,NCI SEERがん登録所のがん病理報告を6つのタスクで分類するためのマルチタスク設定における留置型分類器を実証する。
これらの課題に対して,25~45%の報告を控えることで,分類誤差率を2~5の因子で低減する。
がん部位を分類する特定のタスクについては、転移、リンパ節に関する報告、複数のがん部位の議論を分類ミスの多くの原因として特定することができ、がん部位(例えば、乳がん、肺がん、前立腺)によって、その程度や種類が系統的に異なることを観察できる。
3つのタスクを組み合わせると、我々のモデルは50%以上のレポートを6つのタスクのうち95%以上の精度で分類し、残りの6つのタスクすべてに対して85%以上の精度で分類する。
さらに, 単語出現の指標のみよりも, ライムの分類決定要因が優れていることを示す。
深層吸入分類器とlimeを用いた特徴同定を組み合わせることで,病理所見から癌部位を分類する場合の正確性と禁忌の関連概念を識別できる。
キーワード検索におけるlimeの改善は統計的に有意であり、おそらくは単語が文脈で評価され、分類の局所的決定要因として同定されているためである。
関連論文リスト
- Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Machine Learning Approach for Cancer Entities Association and
Classification [0.0]
この研究は、非自明な2つのNLP、自然言語処理機能、エンティティ認識、テキスト分類を用いて、生物医学文献から知識を発見する。
名前付きエンティティ認識(NER)は、ユーザフレンドリーなインターフェースと組み込み辞書のサポートにより、構造化されていないテキストから、がんに関連する事前定義されたエンティティを認識し、抽出する。
テキスト分類は、テキストに対する洞察を探求し、データの分類、クエリ、記事のスクリーニングを簡単にするのに役立つ。
論文 参考訳(メタデータ) (2023-05-30T07:36:12Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Gene selection from microarray expression data: A Multi-objective PSO
with adaptive K-nearest neighborhood [0.0]
本稿では,遺伝子発現データを用いたヒト癌疾患の分類問題について論じる。
マイクロアレイデータセットを解析し,がん疾患を効果的に分類するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T04:22:10Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - Label Cleaning Multiple Instance Learning: Refining Coarse Annotations
on Single Whole-Slide Images [83.7047542725469]
病理検体の全スライディング画像(WSI)における癌領域のアノテーションは、臨床診断、生医学研究、機械学習アルゴリズムの開発において重要な役割を担っている。
本稿では,外部トレーニングデータを必要とせず,単一のWSI上で粗いアノテーションを洗練するためのLC-MIL (Label Cleaning Multiple Instance Learning) を提案する。
乳癌リンパ節転移,肝癌,大腸癌の検体を併用した異種 WSI 実験の結果,LC-MIL は粗いアノテーションを著しく改善し,単一スライドから学習しながらも,最先端の代替品よりも優れていた。
論文 参考訳(メタデータ) (2021-09-22T15:06:06Z) - A Pathology Deep Learning System Capable of Triage of Melanoma Specimens
Utilizing Dermatopathologist Consensus as Ground Truth [5.46895714413677]
本稿では,デジタル化された全スライド画像(WSI)の階層的な分類を行う病理深層学習システム(PDLS)を提案する。
これまでに収集されたメラノサイト標本のうち,最大規模の3つを含む7,685枚の画像を用いて,本システムを訓練した。
以上の結果から, PDLSは皮膚検体の自動分類・トリアージが可能であり, メラノサイト性虫垂症に対する感受性が高いことが示唆された。
論文 参考訳(メタデータ) (2021-09-15T19:48:51Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Classification with Rejection Based on Cost-sensitive Classification [83.50402803131412]
学習のアンサンブルによる拒絶を用いた新しい分類法を提案する。
実験により, クリーン, ノイズ, 正の未ラベル分類における提案手法の有用性が示された。
論文 参考訳(メタデータ) (2020-10-22T14:05:05Z) - Hierarchical Deep Learning Classification of Unstructured Pathology
Reports to Automate ICD-O Morphology Grading [0.0]
本稿では,畳み込みニューラルネットワークモデルを用いた階層的深層学習分類手法を提案する。
ICD-O形態素分類のためのフラット・マルチクラスCNNモデルと比較して,階層的深層学習分類法では性能が向上することが実証された。
論文 参考訳(メタデータ) (2020-08-28T12:36:58Z) - Learning from Suspected Target: Bootstrapping Performance for Breast
Cancer Detection in Mammography [6.323318523772466]
対象領域の選択と訓練を行う新しいサンプリング手順とともに,新しいトップ可能性損失を導入する。
まず,提案手法をプライベートな高密度マンモグラフィーデータセット上で検証する。
以上の結果から,本手法は偽陽性率を大幅に低減し,質量型癌検出では0.25倍の特異性を示した。
論文 参考訳(メタデータ) (2020-03-01T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。