論文の概要: A High Magnifications Histopathology Image Dataset for Oral Squamous Cell Carcinoma Diagnosis and Prognosis
- arxiv url: http://arxiv.org/abs/2507.16360v1
- Date: Tue, 22 Jul 2025 08:48:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.034789
- Title: A High Magnifications Histopathology Image Dataset for Oral Squamous Cell Carcinoma Diagnosis and Prognosis
- Title(参考訳): 口腔扁平上皮癌の診断と予後のための高密度組織像データセット
- Authors: Jinquan Guan, Junhong Guo, Qi Chen, Jian Chen, Yongkang Cai, Yilin He, Zhiquan Huang, Yan Wang, Yutong Xie,
- Abstract要約: Multi-OSCCは口腔扁平上皮癌1,325例からなる新しい病理組織像データセットである。
x200,x400,x1000倍率の6つの高分解能組織像を呈し,コアとエッジの腫瘍領域を2倍率で観察した。
このデータセットは、再発予測(REC)、リンパ節転移(LNM)、腫瘍分化(TD)、腫瘍浸潤(TI)、硬膜外浸潤(PI)の6つの重要な臨床的タスクに対して豊富に注釈付けされている。
- 参考スコア(独自算出の注目度): 18.549808005574985
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Oral Squamous Cell Carcinoma (OSCC) is a prevalent and aggressive malignancy where deep learning-based computer-aided diagnosis and prognosis can enhance clinical assessments.However, existing publicly available OSCC datasets often suffer from limited patient cohorts and a restricted focus on either diagnostic or prognostic tasks, limiting the development of comprehensive and generalizable models. To bridge this gap, we introduce Multi-OSCC, a new histopathology image dataset comprising 1,325 OSCC patients, integrating both diagnostic and prognostic information to expand existing public resources. Each patient is represented by six high resolution histopathology images captured at x200, x400, and x1000 magnifications-two per magnification-covering both the core and edge tumor regions.The Multi-OSCC dataset is richly annotated for six critical clinical tasks: recurrence prediction (REC), lymph node metastasis (LNM), tumor differentiation (TD), tumor invasion (TI), cancer embolus (CE), and perineural invasion (PI). To benchmark this dataset, we systematically evaluate the impact of different visual encoders, multi-image fusion techniques, stain normalization, and multi-task learning frameworks. Our analysis yields several key insights: (1) The top-performing models achieve excellent results, with an Area Under the Curve (AUC) of 94.72% for REC and 81.23% for TD, while all tasks surpass 70% AUC; (2) Stain normalization benefits diagnostic tasks but negatively affects recurrence prediction; (3) Multi-task learning incurs a 3.34% average AUC degradation compared to single-task models in our multi-task benchmark, underscoring the challenge of balancing multiple tasks in our dataset. To accelerate future research, we publicly release the Multi-OSCC dataset and baseline models at https://github.com/guanjinquan/OSCC-PathologyImageDataset.
- Abstract(参考訳): 口腔扁平上皮癌(OSCC: Oral Squamous Cell Carcinoma)は、深層学習をベースとしたコンピュータ支援診断と予後が臨床評価を促進できる悪性腫瘍である。
このギャップを埋めるために、我々は1,325人のOSCC患者からなる新しい病理画像データセットであるMulti-OSCCを導入し、既存の公共資源を拡張するために診断情報と予後情報を統合した。
再発予測(REC)、リンパ節転移(LNM)、腫瘍分化(TD)、腫瘍浸潤(TI)、癌塞栓(CE)、神経周囲浸潤(PI)の6つの重要な臨床的タスクに対して、マルチOSCCデータセットが豊富に注釈されている。
このデータセットをベンチマークするために、異なる視覚エンコーダ、マルチイメージ融合技術、染色正規化、マルチタスク学習フレームワークの影響を体系的に評価する。
分析の結果,(1) トップパフォーマンスモデルでは,RECが94.72%,TDが81.23%,(2) 正常化が70%を突破する,(2) 再帰予測に悪影響を及ぼす,(3) マルチタスク学習では,マルチタスクベンチマークのシングルタスクモデルと比較して平均3.34%のAUC劣化が発生し,データセット内の複数のタスクのバランスをとるという課題を浮き彫りにしている,という結果が得られた。
今後の研究を加速するために、Multi-OSCCデータセットとベースラインモデルをhttps://github.com/guanjinquan/OSCC-PathologyImageDatasetで公開しています。
関連論文リスト
- An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [58.78045864541539]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shot disease classification from chest X-ray [64.2434525370243]
CXR-LTシリーズは、胸部X線を用いた肺疾患の分類を強化するために設計されたコミュニティ主導のイニシアチブである。
CXR-LT 2024はデータセットを377,110の胸部X線(CXR)と45の疾患ラベルに拡張し、19の新しい稀な疾患の発見を含んでいる。
本稿では、CXR-LT 2024の概要を述べるとともに、データキュレーションプロセスの詳細と最先端ソリューションの統合について述べる。
論文 参考訳(メタデータ) (2025-06-09T17:53:31Z) - PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology [33.51485504161335]
病理基盤モデル(PFM)の最初の包括的なベンチマークであるPathBenchを紹介する。
我々のフレームワークは大規模データを組み込んで,PFMの客観的比較を可能にする。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
論文 参考訳(メタデータ) (2025-05-26T16:42:22Z) - ColonScopeX: Leveraging Explainable Expert Systems with Multimodal Data for Improved Early Diagnosis of Colorectal Cancer [3.541280502270993]
大腸癌(CRC)は、がん関連死亡の2番目に多い原因であり、世界でも3番目に多い悪性腫瘍である。
CRCの早期発見は、その非特異的でしばしば恥ずかしい症状のため、依然として問題である。
説明可能なAI(XAI)手法を利用した機械学習フレームワークであるColonScopeXを提案する。
論文 参考訳(メタデータ) (2025-04-09T20:45:11Z) - PathOrchestra: A Comprehensive Foundation Model for Computational Pathology with Over 100 Diverse Clinical-Grade Tasks [39.97710183184273]
本稿では,300Kの病理スライドからなるデータセット上で,自己教師型学習を通じて学習した多種多様な病理基盤モデルPathOrchestraを提案する。
このモデルは、61のプライベートデータセットと51のパブリックデータセットを組み合わせて、112の臨床的タスクで厳格に評価された。
PathOrchestraは27,755のWSIと9,415,729のROIで例外的なパフォーマンスを示し、47のタスクで0.950以上の精度を達成した。
論文 参考訳(メタデータ) (2025-03-31T17:28:02Z) - MSWAL: 3D Multi-class Segmentation of Whole Abdominal Lesions Dataset [41.69818086021188]
我々は,全腹部病変データセットの最初の3次元マルチクラスであるMSWALを紹介する。
MSWALは、胆石、腎臓石、肝腫瘍、腎臓腫瘍、膵癌、肝嚢胞、腎臓嚢胞など、様々な一般的な病変のカバー範囲を広げている。
Inception nnU-Netは、インセプションモジュールとnnU-Netアーキテクチャを効果的に統合し、異なるフィールドから情報を抽出する新しいセグメンテーションフレームワークである。
論文 参考訳(メタデータ) (2025-03-17T06:31:25Z) - Fast-staged CNN Model for Accurate pulmonary diseases and Lung cancer detection [0.0]
本研究は, 肺がん, 特に肺結節の検出を目的とした深層学習モデルと, 胸部X線写真を用いた8つの肺病理組織について検討した。
アンサンブル法とトランスファーラーニングを利用した2段階分類システムを用いて,最初のトリアージ画像を正規あるいは異常に分類する。
このモデルでは、最高の性能の精度は77%、感度は0.713、特異度は0.776、AUCスコアは0.888である。
論文 参考訳(メタデータ) (2024-12-16T11:47:07Z) - Multi-modal Medical Image Fusion For Non-Small Cell Lung Cancer Classification [7.002657345547741]
非小細胞肺癌(NSCLC)は、世界中のがん死亡の主な原因である。
本稿では, 融合医療画像(CT, PET)と臨床健康記録, ゲノムデータとを合成する, マルチモーダルデータの革新的な統合について紹介する。
NSCLCの検出と分類精度の大幅な向上により,本研究は既存のアプローチを超越している。
論文 参考訳(メタデータ) (2024-09-27T12:59:29Z) - TACCO: Task-guided Co-clustering of Clinical Concepts and Patient Visits for Disease Subtyping based on EHR Data [42.96821770394798]
TACCOは、EMHデータのハイパーグラフモデリングに基づいて、臨床概念と患者訪問のクラスターを共同で発見する新しいフレームワークである。
我々は,表現型分類と心血管リスク予測の下流臨床課題に対して,公共MIMIC-IIIデータセットとエモリー内部CRADLEデータセットを用いて実験を行った。
深層モデル解析,クラスタリング結果解析,臨床ケーススタディは,TACCOが提供した改良されたユーティリティと洞察に富んだ解釈をさらに検証する。
論文 参考訳(メタデータ) (2024-06-14T14:18:38Z) - Large-scale Long-tailed Disease Diagnosis on Radiology Images [51.453990034460304]
RadDiagは、様々なモダリティと解剖学にわたる2Dおよび3D入力をサポートする基礎モデルである。
私たちのデータセットであるRP3D-DiagDSは、5,568の障害をカバーする195,010のスキャンで40,936の症例を含む。
論文 参考訳(メタデータ) (2023-12-26T18:20:48Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Metastatic Cancer Outcome Prediction with Injective Multiple Instance
Pooling [1.0965065178451103]
我々は2つの公開データセットを処理し、転移性癌の予後予測を研究するために合計341人のベンチマークコホートを設定した。
結果予測に適した2つのインジェクティブ複数インスタンスプーリング関数を提案する。
本研究は, 肺がん非小細胞癌における複数症例の学習が, 頭頸部CT結果予測ベンチマークの課題において, 最先端のパフォーマンスを達成できることを示唆するものである。
論文 参考訳(メタデータ) (2022-03-09T16:58:03Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。