論文の概要: Classification of cancer pathology reports: a large-scale comparative
study
- arxiv url: http://arxiv.org/abs/2006.16370v1
- Date: Mon, 29 Jun 2020 20:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 13:10:13.870114
- Title: Classification of cancer pathology reports: a large-scale comparative
study
- Title(参考訳): 癌病理報告の分類 : 大規模比較研究
- Authors: Stefano Martina, Leonardo Ventura, Paolo Frasconi
- Abstract要約: 我々は,ICD-O3トポグラフィーと形態素コードの自動割り当てに最先端のディープラーニング技術を適用した。
イタリア語で書かれ、トスカーナの病院で10年以上に渡り収集された大量のデータセット(ラベル付き8万件以上、匿名化未報告1万件以上)と多数のクラスについて報告する。
- 参考スコア(独自算出の注目度): 8.211700929845689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We report about the application of state-of-the-art deep learning techniques
to the automatic and interpretable assignment of ICD-O3 topography and
morphology codes to free-text cancer reports. We present results on a large
dataset (more than 80 000 labeled and 1 500 000 unlabeled anonymized reports
written in Italian and collected from hospitals in Tuscany over more than a
decade) and with a large number of classes (134 morphological classes and 61
topographical classes). We compare alternative architectures in terms of
prediction accuracy and interpretability and show that our best model achieves
a multiclass accuracy of 90.3% on topography site assignment and 84.8% on
morphology type assignment. We found that in this context hierarchical models
are not better than flat models and that an element-wise maximum aggregator is
slightly better than attentive models on site classification. Moreover, the
maximum aggregator offers a way to interpret the classification process.
- Abstract(参考訳): ICD-O3トポグラフィーと形態素コードの自動割当てに対する最先端のディープラーニング技術のフリーテキスト癌レポートへの応用について報告する。
大規模データセット(8 000 以上のラベル付き,5 0000 以上の匿名化レポートをイタリアで記述し,10年以上にわたってトスカーナの病院から収集した)と,多数のクラス(134 種類のクラスと61 の地形クラス)について報告する。
予測精度と解釈可能性の観点から代替アーキテクチャを比較し,地形の配置において90.3%,形態型割り当てでは84.8%のマルチクラス精度を達成できることを示した。
この文脈では階層モデルは平坦モデルよりは良くなく、要素ワイドの最大アグリゲータはサイト分類における注意モデルよりもわずかに優れていることがわかった。
さらに、最大アグリゲータは分類過程を解釈する方法を提供する。
関連論文リスト
- Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文 参考訳(メタデータ) (2024-03-26T12:47:39Z) - One Model to Rule them All: Towards Universal Segmentation for Medical Images with Text Prompts [62.55349777609194]
我々は、SATと呼ばれるテキストプロンプトによって駆動される放射線学的スキャンにおいて、任意のセグメンテーションを可能にするモデルを構築することを目指している。
トレーニングのために、最大かつ最も包括的なセグメンテーションデータセットを構築します。
我々はSAT-Nano(110Mパラメータ)とSAT-Pro(447Mパラメータ)をトレーニングし、データセット/サブセット毎にトレーニングされた72の専門家nnU-Netに匹敵する性能を示した。
論文 参考訳(メタデータ) (2023-12-28T18:16:00Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Significantly improving zero-shot X-ray pathology classification via
fine-tuning pre-trained image-text encoders [51.14431540035141]
下流のゼロショット病理分類性能を改善するために,文サンプリングと正対損失緩和に基づく新たな微調整手法を提案する。
4種類の胸部X線データセットを用いてゼロショット病理分類性能を劇的に改善した。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Weakly-supervised segmentation using inherently-explainable
classification models and their application to brain tumour classification [0.46873264197900916]
本稿では,これら2つの問題に1つとして対処するために,本質的に説明可能な3つの分類法を提案する。
モデルは2つの異なるデータセットを用いたマルチクラス脳腫瘍分類のタスクに採用された。
得られた腫瘍のみの画像のサブセットの精度は、最先端のグリオーマ腫瘍グレーディングバイナリ分類器を98.7%の精度で上回った。
論文 参考訳(メタデータ) (2022-06-10T14:44:05Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Convolutional Neural Networks in Multi-Class Classification of Medical
Data [0.9137554315375922]
深層学習(CNN)と浅い学習モデル(Gradient Boosting)を組み合わせたアンサンブルモデルを紹介します。
本手法は,本研究で達成した最高3クラス分類精度である64.93の精度を実現する。
論文 参考訳(メタデータ) (2020-12-28T02:04:38Z) - A Multi-resolution Model for Histopathology Image Classification and
Localization with Multiple Instance Learning [9.36505887990307]
精度マップを利用して不審な地域を検知し,詳細なグレード予測を行うマルチレゾリューション・マルチインスタンス学習モデルを提案する。
このモデルは、830人の患者から20,229のスライドを含む大規模前立腺生検データセットに基づいて開発された。
このモデルは92.7%の精度、良性、低等級(中等級)、高等級(中等級)のCohen's Kappa、98.2%の受信機動作特性曲線(AUROC)、平均精度(AP)97.4%の予測を達成した。
論文 参考訳(メタデータ) (2020-11-05T06:42:39Z) - Hierarchical Deep Learning Classification of Unstructured Pathology
Reports to Automate ICD-O Morphology Grading [0.0]
本稿では,畳み込みニューラルネットワークモデルを用いた階層的深層学習分類手法を提案する。
ICD-O形態素分類のためのフラット・マルチクラスCNNモデルと比較して,階層的深層学習分類法では性能が向上することが実証された。
論文 参考訳(メタデータ) (2020-08-28T12:36:58Z) - Hierarchical Deep Learning Ensemble to Automate the Classification of
Breast Cancer Pathology Reports by ICD-O Topography [0.0]
本稿では,2201の病理報告の自動ラベリングに,アート畳み込みニューラルネットワークモデルの状態を取り入れた階層型深層学習アンサンブル法を提案する。
その結果,F1マイクロは14%以上,F1マクロスコアは55%以上であった。
論文 参考訳(メタデータ) (2020-08-28T10:29:56Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。