論文の概要: Hierarchical Classification System for Breast Cancer Specimen Report
(HCSBC) -- an end-to-end model for characterizing severity and diagnosis
- arxiv url: http://arxiv.org/abs/2312.12442v1
- Date: Thu, 2 Nov 2023 18:37:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 13:12:05.272581
- Title: Hierarchical Classification System for Breast Cancer Specimen Report
(HCSBC) -- an end-to-end model for characterizing severity and diagnosis
- Title(参考訳): 乳癌検診の階層分類システム(HCSBC)-重症度と診断を特徴付けるエンド・ツー・エンドモデル
- Authors: Thiago Santos, Harish Kamath, Christopher R. McAdams, Mary S. Newell,
Marina Mosunjac, Gabriela Oprea-Ilies, Geoffrey Smith, Constance Lehman, Judy
Gichoya, Imon Banerjee, Hari Trivedi
- Abstract要約: 階層型ハイブリッドトランスフォーマーベースパイプライン(59ラベル)の開発 -乳癌検体分類システム(HCSBC)-
我々は、EUHデータに基づいてモデルをトレーニングし、2つの外部データセット(MGHとMayo Clinical)でモデルの性能を評価した。
- 参考スコア(独自算出の注目度): 3.4454444815042735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated classification of cancer pathology reports can extract information
from unstructured reports and categorize each report into structured diagnosis
and severity categories. Thus, such system can reduce the burden for populating
tumor registries, help registration for clinical trial as well as developing
large dataset for deep learning model development using true pathologic ground
truth. However, the content of breast pathology reports can be difficult for
categorize due to the high linguistic variability in content and wide variety
of potential diagnoses >50. Existing NLP models are primarily focused on
developing classifier for primary breast cancer types (e.g. IDC, DCIS, ILC) and
tumor characteristics, and ignore the rare diagnosis of cancer subtypes. We
then developed a hierarchical hybrid transformer-based pipeline (59 labels) -
Hierarchical Classification System for Breast Cancer Specimen Report (HCSBC),
which utilizes the potential of the transformer context-preserving NLP
technique and compared our model to several state of the art ML and DL models.
We trained the model on the EUH data and evaluated our model's performance on
two external datasets - MGH and Mayo Clinic. We publicly release the code and a
live application under Huggingface spaces repository
- Abstract(参考訳): がん病理レポートの自動分類は、非構造化レポートから情報を抽出し、各レポートを構造化診断と重症度カテゴリに分類することができる。
これにより, 腫瘍登録の負担を軽減し, 臨床試験の登録を支援するとともに, 真の病理的基盤真理を用いた深層学習モデル開発のための大規模なデータセットを開発することができる。
しかし, 乳腺病理報告の内容は, 内容の言語的多様性が高く, 診断範囲が50以上多様であるため, 分類が困難である。
既存のNLPモデルは、主に乳がんの原発型(例えば、IDC、DCIS、ICC)と腫瘍の特徴の分類器の開発に焦点を当てており、がんサブタイプの稀な診断を無視している。
そこで我々は,トランスフォーマーの文脈保存型NLP手法の可能性を生かした階層型ハイブリットトランスフォーマーベースパイプライン(59ラベル)を開発した。
我々は、EUHデータに基づいてモデルをトレーニングし、2つの外部データセット(MGHとMayo Clinical)でモデルの性能を評価した。
Huggingface Spacesリポジトリの下で、コードとライブアプリケーションを公開しています。
関連論文リスト
- Medical-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data [2.913761513290171]
我々は, 甲状腺癌, 大腸癌, 肺癌, 一般の話題に分類した, 1,874 の生医学的抄録を収集した。
我々の研究は、特にデータスカースシナリオにおいて、分類性能を改善するためにこのデータセットを活用することに焦点を当てている。
がん関連文書のセマンティック情報と構造的関係をキャプチャする複数のグラフアテンション層を備えたResidual Graph Attention Network(R-GAT)を導入する。
論文 参考訳(メタデータ) (2024-10-19T20:07:40Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - PACS: Prediction and analysis of cancer subtypes from multi-omics data
based on a multi-head attention mechanism model [2.275409158519155]
がんサブタイプの分類を成功させるために, 教師付きマルチヘッドアテンション機構モデル(SMA)を提案する。
SMAモデルのアテンション機構と特徴共有モジュールは、マルチオミクスデータのグローバルおよびローカルの特徴情報をうまく学習することができる。
SMAモデルは、シミュレーションされた単一細胞およびがんマルチオミクスデータセットにおけるがんサブタイプの最も正確なF1マクロスコープ、F1重み付きおよび正確な分類を達成する。
論文 参考訳(メタデータ) (2023-08-21T03:54:21Z) - A Personalized Diagnostic Generation Framework Based on Multi-source
Heterogeneous Data [8.115713756776119]
本稿では,病理画像と医療報告を組み合わせることで,個別の患者に対してパーソナライズされた診断結果を生成する枠組みを提案する。
核レベルの特徴的類似性とコンテンツに基づく深層学習法を用いて,類似した病理特性を持つ個体群を探索する。
論文 参考訳(メタデータ) (2021-10-26T13:12:52Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - A Novel Self-Learning Framework for Bladder Cancer Grading Using
Histopathological Images [1.244681179922733]
組織像から膀胱癌を診断するための自己学習の枠組みについて検討した。
組織学的パッチを病のさまざまなレベルに分類できる新しいDeep Convolutional Embedded Attention Clustering (DCEAC)を提案する。
論文 参考訳(メタデータ) (2021-06-25T11:04:04Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Hierarchical Deep Learning Classification of Unstructured Pathology
Reports to Automate ICD-O Morphology Grading [0.0]
本稿では,畳み込みニューラルネットワークモデルを用いた階層的深層学習分類手法を提案する。
ICD-O形態素分類のためのフラット・マルチクラスCNNモデルと比較して,階層的深層学習分類法では性能が向上することが実証された。
論文 参考訳(メタデータ) (2020-08-28T12:36:58Z) - Weakly supervised multiple instance learning histopathological tumor
segmentation [51.085268272912415]
スライド画像全体のセグメント化のための弱教師付きフレームワークを提案する。
トレーニングモデルに複数のインスタンス学習スキームを利用する。
提案するフレームワークは,The Cancer Genome AtlasとPatchCamelyonデータセットのマルチロケーションとマルチ中心公開データに基づいて評価されている。
論文 参考訳(メタデータ) (2020-04-10T13:12:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。