論文の概要: Use of natural language processing to extract and classify papillary thyroid cancer features from surgical pathology reports
- arxiv url: http://arxiv.org/abs/2406.00015v1
- Date: Wed, 22 May 2024 22:27:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-09 16:19:21.692272
- Title: Use of natural language processing to extract and classify papillary thyroid cancer features from surgical pathology reports
- Title(参考訳): 外科的病理所見から甲状腺乳頭癌の特徴を抽出・分類する自然言語処理の応用
- Authors: Ricardo Loor-Torres, Yuqi Wu, Esteban Cabezas, Mariana Borras, David Toro-Tobon, Mayra Duran, Misk Al Zahidy, Maria Mateo Chavez, Cristian Soto Jacome, Jungwei W. Fan, Naykky M. Singh Ospina, Yonghui Wu, Juan P. Brito,
- Abstract要約: 成人甲状腺乳頭癌の1,410例をロチェスター州マヨクリニックで検討した。
甲状腺癌の特徴をリスクカテゴリに分類するために,ルールベースのNLPパイプラインであるThyroPathを開発した。
- 参考スコア(独自算出の注目度): 9.200141008020484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background We aim to use Natural Language Processing (NLP) to automate the extraction and classification of thyroid cancer risk factors from pathology reports. Methods We analyzed 1,410 surgical pathology reports from adult papillary thyroid cancer patients at Mayo Clinic, Rochester, MN, from 2010 to 2019. Structured and non-structured reports were used to create a consensus-based ground truth dictionary and categorized them into modified recurrence risk levels. Non-structured reports were narrative, while structured reports followed standardized formats. We then developed ThyroPath, a rule-based NLP pipeline, to extract and classify thyroid cancer features into risk categories. Training involved 225 reports (150 structured, 75 unstructured), with testing on 170 reports (120 structured, 50 unstructured) for evaluation. The pipeline's performance was assessed using both strict and lenient criteria for accuracy, precision, recall, and F1-score. Results In extraction tasks, ThyroPath achieved overall strict F-1 scores of 93% for structured reports and 90 for unstructured reports, covering 18 thyroid cancer pathology features. In classification tasks, ThyroPath-extracted information demonstrated an overall accuracy of 93% in categorizing reports based on their corresponding guideline-based risk of recurrence: 76.9% for high-risk, 86.8% for intermediate risk, and 100% for both low and very low-risk cases. However, ThyroPath achieved 100% accuracy across all thyroid cancer risk categories with human-extracted pathology information. Conclusions ThyroPath shows promise in automating the extraction and risk recurrence classification of thyroid pathology reports at large scale. It offers a solution to laborious manual reviews and advancing virtual registries. However, it requires further validation before implementation.
- Abstract(参考訳): 背景 我々は,病理報告から甲状腺癌危険因子の抽出と分類を自動化するために自然言語処理(NLP)を使用することを目標としている。
方法:2010年から2019年まで,MNのマヨクリニックにて成人甲状腺乳頭癌の1,410例について検討した。
構造的および非構造的報告は、コンセンサスに基づく基底真理辞書の作成に使用され、それらを修正された再発リスクレベルに分類した。
非構造化レポートは物語であり、構造化レポートは標準化されたフォーマットに従っていた。
そこで我々は,甲状腺癌の特徴をリスクカテゴリに分類するために,ルールベースのNLPパイプラインであるThyroPathを開発した。
訓練には225件(構造化150件、非構造化75件)、評価のために170件(構造化120件、非構造化50件)の報告書を試験した。
パイプラインの性能は、正確性、精度、リコール、F1スコアの厳密な基準と寛大な基準の両方を用いて評価された。
その結果,TyroPathは構造報告では93%,非構造報告では90ポイントの厳格なF-1スコアを達成し,甲状腺癌18例を対象とした。
分類タスクにおいて、ThyroPath抽出された情報は、対応するガイドラインに基づく再発リスクに基づくレポートの分類において、全体の93%の精度を示し、ハイリスクは76.9%、中間リスクは86.8%、低リスクと極低リスクの両方で100%であった。
しかし、ThyroPathはヒト摘出病理情報を用いて甲状腺癌リスクカテゴリーの100%の精度を達成した。
結論 ThyroPath は甲状腺病理報告の抽出とリスク再発分類を大規模に自動化する可能性を示唆している。
厳格なマニュアルレビューと仮想レジストリの進展に対するソリューションを提供する。
しかし、実装前にさらなる検証が必要である。
関連論文リスト
- TopoTxR: A topology-guided deep convolutional network for breast parenchyma learning on DCE-MRIs [49.69047720285225]
そこで本研究では,乳房側葉構造をよりよく近似するために,マルチスケールのトポロジ構造を明示的に抽出する新しいトポロジカルアプローチを提案する。
VICTREファントム乳房データセットを用いてemphTopoTxRを実験的に検証した。
本研究の質的および定量的分析は,乳房組織における画像診断におけるトポロジカルな挙動を示唆するものである。
論文 参考訳(メタデータ) (2024-11-05T19:35:10Z) - Predicting the risk of early-stage breast cancer recurrence using H\&E-stained tissue images [5.507561997194002]
癌組織像の病理像を解析することにより,深層学習アルゴリズムが再発リスクを予測できるかどうかを検討した。
感度は0.857, 0.746, 0.529で, 低, 中間, 高リスク, 0.816, 0.803, 0.972。
クラス活性化マップを用いてこれらの研究を通して得られたモデルをチェックすると、異なるリスクグループを予測する際に、実際に管の形成と分裂速度を検討した。
論文 参考訳(メタデータ) (2024-06-10T08:51:59Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - hist2RNA: An efficient deep learning architecture to predict gene
expression from breast cancer histopathology images [11.822321981275232]
深層学習アルゴリズムは、デジタル病理画像中の形態パターンを効果的に抽出し、分子の表現型を迅速かつ低コストで予測することができる。
我々は,138遺伝子の発現を予測するために,バルクRNAシークエンシング技術にインスパイアされたhist2RNAという新しい計算効率の高い手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T10:54:32Z) - Extracting Thyroid Nodules Characteristics from Ultrasound Reports Using
Transformer-based Natural Language Processing Methods [22.35979441935564]
甲状腺結節の特徴は超音波検査などの臨床報告でしばしば記録される。
本研究は, 超音波検査から甲状腺結節の特徴を抽出するために, トランスフォーマーを用いたNLPモデルを系統的に分類し, 適用した最初の研究である。
論文 参考訳(メタデータ) (2023-03-31T20:23:58Z) - Exploiting segmentation labels and representation learning to forecast
therapy response of PDAC patients [60.78505216352878]
化学療法に対する腫瘍反応を予測するためのハイブリッドディープニューラルネットワークパイプラインを提案する。
セグメンテーションから分類への表現伝達の組み合わせと、ローカライゼーションと表現学習を利用する。
提案手法は, 合計477個のデータセットを用いて, ROC-AUC 63.7% の処理応答を予測できる, 極めて効率的な手法である。
論文 参考訳(メタデータ) (2022-11-08T11:50:31Z) - A Pathologist-Informed Workflow for Classification of Prostate Glands in
Histopathology [62.997667081978825]
病理学者は、ガラススライド上の針生検の組織を調べて前立腺がんを診断し、診断する。
がんの重症度と転移リスクは、前立腺の組織と形態に基づくスコアであるGleason gradeによって決定される。
本稿では,病理学者のtextitmodus operandi に従って,個々の腺のマルチスケールパッチを分離・分類する自動ワークフローを提案する。
論文 参考訳(メタデータ) (2022-09-27T14:08:19Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - Event-based clinical findings extraction from radiology reports with
pre-trained language model [0.22940141855172028]
今回,臨床所見を付加した新しい放射線診断報告のコーパスを報告する。
金の標準コーパスには合計500点の注記CTレポートが含まれていた。
BERTを含む2つの最先端ディープラーニングアーキテクチャを用いて、トリガと引数のエンティティを抽出した。
論文 参考訳(メタデータ) (2021-12-27T05:03:10Z) - A Natural Language Processing Pipeline of Chinese Free-text Radiology
Reports for Liver Cancer Diagnosis [8.549162626766332]
本研究は,中国の放射線医学報告から臨床関連特徴を直接抽出するためのNLPパイプラインを設計した。
パイプラインは、名前付きエンティティ認識、同義語正規化、関係抽出から構成されていた。
肝癌診断では,無作為林が肝癌診断において最高の成績を示した。
論文 参考訳(メタデータ) (2020-04-10T09:32:07Z) - Segmentation for Classification of Screening Pancreatic Neuroendocrine
Tumors [72.65802386845002]
本研究は,腹部CTで膵神経内分泌腫瘍(PNET)を早期に検出するための包括的結果を提示する。
我々の知る限りでは、このタスクは以前まで計算タスクとして研究されていなかった。
我々の手法は最先端のセグメンテーションネットワークより優れ、感度は89.47%、特異性は81.08%である。
論文 参考訳(メタデータ) (2020-04-04T21:21:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。