論文の概要: Why I'm not Answering: Understanding Determinants of Classification of
an Abstaining Classifier for Cancer Pathology Reports
- arxiv url: http://arxiv.org/abs/2009.05094v5
- Date: Thu, 21 Apr 2022 16:45:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:54:25.476979
- Title: Why I'm not Answering: Understanding Determinants of Classification of
an Abstaining Classifier for Cancer Pathology Reports
- Title(参考訳): なぜ答えないのか : 癌病理診断のための既知分類器の分類決定因子の理解
- Authors: Sayera Dhaubhadel, Jamaludin Mohd-Yusof, Kumkum Ganguly, Gopinath
Chennupati, Sunil Thulasidasan, Nicolas W. Hengartner, Brent J. Mumphrey,
Eric B. Durbin, Jennifer A. Doherty, Mireille Lemieux, Noah Schaefferkoetter,
Georgia Tourassi, Linda Coyle, Lynne Penberthy, Benjamin H. McMahon and
Tanmoy Bhattacharya
- Abstract要約: NCI SEERがん登録簿から癌病理報告を分類するためのマルチタスク・セッティングにおける留置型分類器を実証した。
これらの課題に対して,25~45%の報告を棄却することにより,分類誤差率を2~5の因子で低減する。
LIMEは単語の出現のみの尺度よりも分類の判断力が高いことを示す。
- 参考スコア(独自算出の注目度): 4.4899047638852085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safe deployment of deep learning systems in critical real world applications
requires models to make very few mistakes, and only under predictable
circumstances. In this work, we address this problem using an abstaining
classifier that is tuned to have $>$95% accuracy, and then identify the
determinants of abstention using LIME. Essentially, we are training our model
to learn the attributes of pathology reports that are likely to lead to
incorrect classifications, albeit at the cost of reduced sensitivity. We
demonstrate an abstaining classifier in a multitask setting for classifying
cancer pathology reports from the NCI SEER cancer registries on six tasks of
interest. For these tasks, we reduce the classification error rate by factors
of 2--5 by abstaining on 25--45% of the reports. For the specific task of
classifying cancer site, we are able to identify metastasis, reports involving
lymph nodes, and discussion of multiple cancer sites as responsible for many of
the classification mistakes, and observe that the extent and types of mistakes
vary systematically with cancer site (e.g., breast, lung, and prostate). When
combining across three of the tasks, our model classifies 50% of the reports
with an accuracy greater than 95% for three of the six tasks\edit, and greater
than 85% for all six tasks on the retained samples. Furthermore, we show that
LIME provides a better determinant of classification than measures of word
occurrence alone. By combining a deep abstaining classifier with feature
identification using LIME, we are able to identify concepts responsible for
both correctness and abstention when classifying cancer sites from pathology
reports. The improvement of LIME over keyword searches is statistically
significant, presumably because words are assessed in context and have been
identified as a local determinant of classification.
- Abstract(参考訳): 重要な現実世界のアプリケーションにディープラーニングシステムの安全なデプロイを行うには、ごくわずかなミスを犯すモデルが必要である。
そこで本研究では,95%の精度を持つように調整された禁忌分類器を用いてこの問題に対処し,石灰を用いて禁忌決定要因を同定する。
本質的には、感度を低下させるコストはあるものの、誤った分類につながる可能性のある病理報告の属性を学ぶために、モデルをトレーニングしています。
本研究は,NCI SEERがん登録所のがん病理報告を6つのタスクで分類するためのマルチタスク設定における留置型分類器を実証する。
これらの課題に対して,25~45%の報告を控えることで,分類誤差率を2~5の因子で低減する。
がん部位を分類する特定のタスクについては、転移、リンパ節に関する報告、複数のがん部位の議論を分類ミスの多くの原因として特定することができ、がん部位(例えば、乳がん、肺がん、前立腺)によって、その程度や種類が系統的に異なることを観察できる。
3つのタスクを組み合わせると、我々のモデルは50%以上のレポートを6つのタスクのうち95%以上の精度で分類し、残りの6つのタスクすべてに対して85%以上の精度で分類する。
さらに, 単語出現の指標のみよりも, ライムの分類決定要因が優れていることを示す。
深層吸入分類器とlimeを用いた特徴同定を組み合わせることで,病理所見から癌部位を分類する場合の正確性と禁忌の関連概念を識別できる。
キーワード検索におけるlimeの改善は統計的に有意であり、おそらくは単語が文脈で評価され、分類の局所的決定要因として同定されているためである。
関連論文リスト
- DIOR-ViT: Differential Ordinal Learning Vision Transformer for Cancer Classification in Pathology Images [4.2832657904981435]
本稿では,2組のサンプル間の分類クラスラベルの差分を定義・学習する微分順序学習問題を提案する。
差分順序学習の導入により,がんの診断精度と信頼性が向上することが実証された。
提案手法は,クラスラベル間の順序関係が関係する他の疾患や問題にも適用すべきである。
論文 参考訳(メタデータ) (2024-07-10T12:42:27Z) - Boosting Medical Image-based Cancer Detection via Text-guided Supervision from Reports [68.39938936308023]
本研究では, 高精度ながん検出を実現するための新しいテキスト誘導学習法を提案する。
本手法は,大規模プレトレーニングVLMによる臨床知識の活用により,一般化能力の向上が期待できる。
論文 参考訳(メタデータ) (2024-05-23T07:03:38Z) - Quality assurance of organs-at-risk delineation in radiotherapy [7.698565355235687]
放射線治療計画において,腫瘍標的と臓器の脱線は重要である。
自動セグメンテーションの品質保証は、まだ臨床実践において必要ではない。
提案手法は,一級分類フレームワークにおける残差ネットワークとアテンション機構を導入し,様々な種類のOAR輪郭誤差を高精度に検出することができた。
論文 参考訳(メタデータ) (2024-05-20T02:32:46Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Gene selection from microarray expression data: A Multi-objective PSO
with adaptive K-nearest neighborhood [0.0]
本稿では,遺伝子発現データを用いたヒト癌疾患の分類問題について論じる。
マイクロアレイデータセットを解析し,がん疾患を効果的に分類するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T04:22:10Z) - EMT-NET: Efficient multitask network for computer-aided diagnosis of
breast cancer [58.720142291102135]
乳腺腫瘍の分類と分別を同時に行うための,効率的で軽量な学習アーキテクチャを提案する。
腫瘍分類ネットワークにセグメンテーションタスクを組み込むことにより,腫瘍領域に着目したバックボーンネットワークで表現を学習する。
腫瘍分類の精度、感度、特異性はそれぞれ88.6%、94.1%、85.3%である。
論文 参考訳(メタデータ) (2022-01-13T05:24:40Z) - Label Cleaning Multiple Instance Learning: Refining Coarse Annotations
on Single Whole-Slide Images [83.7047542725469]
病理検体の全スライディング画像(WSI)における癌領域のアノテーションは、臨床診断、生医学研究、機械学習アルゴリズムの開発において重要な役割を担っている。
本稿では,外部トレーニングデータを必要とせず,単一のWSI上で粗いアノテーションを洗練するためのLC-MIL (Label Cleaning Multiple Instance Learning) を提案する。
乳癌リンパ節転移,肝癌,大腸癌の検体を併用した異種 WSI 実験の結果,LC-MIL は粗いアノテーションを著しく改善し,単一スライドから学習しながらも,最先端の代替品よりも優れていた。
論文 参考訳(メタデータ) (2021-09-22T15:06:06Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Hierarchical Deep Learning Classification of Unstructured Pathology
Reports to Automate ICD-O Morphology Grading [0.0]
本稿では,畳み込みニューラルネットワークモデルを用いた階層的深層学習分類手法を提案する。
ICD-O形態素分類のためのフラット・マルチクラスCNNモデルと比較して,階層的深層学習分類法では性能が向上することが実証された。
論文 参考訳(メタデータ) (2020-08-28T12:36:58Z) - Learning from Suspected Target: Bootstrapping Performance for Breast
Cancer Detection in Mammography [6.323318523772466]
対象領域の選択と訓練を行う新しいサンプリング手順とともに,新しいトップ可能性損失を導入する。
まず,提案手法をプライベートな高密度マンモグラフィーデータセット上で検証する。
以上の結果から,本手法は偽陽性率を大幅に低減し,質量型癌検出では0.25倍の特異性を示した。
論文 参考訳(メタデータ) (2020-03-01T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。