論文の概要: Medical-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- arxiv url: http://arxiv.org/abs/2410.15198v2
- Date: Thu, 24 Oct 2024 14:42:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 17:07:37.960171
- Title: Medical-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- Title(参考訳): 医療用GAT: 限られたデータを持つシナリオのためのグラフベース残留ネットワークを活用したがん文書分類
- Authors: Elias Hossain, Tasfia Nuzhat, Shamsul Masum, Shahram Rahimi, Sudip Mittal, Noorbakhsh Amiri Golilarz,
- Abstract要約: 我々は, 甲状腺癌, 大腸癌, 肺癌, 一般の話題に分類した, 1,874 の生医学的抄録を収集した。
我々の研究は、特にデータスカースシナリオにおいて、分類性能を改善するためにこのデータセットを活用することに焦点を当てている。
がん関連文書のセマンティック情報と構造的関係をキャプチャする複数のグラフアテンション層を備えたResidual Graph Attention Network(R-GAT)を導入する。
- 参考スコア(独自算出の注目度): 2.913761513290171
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate classification of cancer-related medical abstracts is crucial for healthcare management and research. However, obtaining large, labeled datasets in the medical domain is challenging due to privacy concerns and the complexity of clinical data. This scarcity of annotated data impedes the development of effective machine learning models for cancer document classification. To address this challenge, we present a curated dataset of 1,874 biomedical abstracts, categorized into thyroid cancer, colon cancer, lung cancer, and generic topics. Our research focuses on leveraging this dataset to improve classification performance, particularly in data-scarce scenarios. We introduce a Residual Graph Attention Network (R-GAT) with multiple graph attention layers that capture the semantic information and structural relationships within cancer-related documents. Our R-GAT model is compared with various techniques, including transformer-based models such as Bidirectional Encoder Representations from Transformers (BERT), RoBERTa, and domain-specific models like BioBERT and Bio+ClinicalBERT. We also evaluated deep learning models (CNNs, LSTMs) and traditional machine learning models (Logistic Regression, SVM). Additionally, we explore ensemble approaches that combine deep learning models to enhance classification. Various feature extraction methods are assessed, including Term Frequency-Inverse Document Frequency (TF-IDF) with unigrams and bigrams, Word2Vec, and tokenizers from BERT and RoBERTa. The R-GAT model outperforms other techniques, achieving precision, recall, and F1 scores of 0.99, 0.97, and 0.98 for thyroid cancer; 0.96, 0.94, and 0.95 for colon cancer; 0.96, 0.99, and 0.97 for lung cancer; and 0.95, 0.96, and 0.95 for generic topics.
- Abstract(参考訳): がん関連医学的抽象化の正確な分類は、医療管理と研究に不可欠である。
しかし,プライバシの懸念や臨床データの複雑さから,医療領域におけるラベル付きデータセットの取得は困難である。
この注釈付きデータの不足は、がん文書分類のための効果的な機械学習モデルの開発を妨げる。
この課題に対処するために, 甲状腺癌, 大腸癌, 肺癌, 一般の話題に分類した, 1,874 の生物医学的要約データセットを作成した。
我々の研究は、特にデータスカースシナリオにおいて、分類性能を改善するためにこのデータセットを活用することに焦点を当てている。
がん関連文書のセマンティック情報と構造的関係をキャプチャする複数のグラフアテンション層を備えたResidual Graph Attention Network(R-GAT)を導入する。
我々のR-GATモデルは、BERT(Bidirectional Encoder Representations from Transformers)やRoBERTa、BioBERTやBio+ClinicalBERTといったドメイン固有モデルなど、トランスフォーマーベースのモデルと比較される。
また,ディープラーニングモデル(CNN,LSTM)と従来の機械学習モデル(ロジスティック回帰,SVM)についても検討した。
さらに、深層学習モデルを組み合わせて分類を強化するアンサンブルアプローチについても検討する。
単一グラムと大文字を含むTF-IDF(Term Frequency-Inverse Document Frequency)、Word2Vec、BERTおよびRoBERTaのトークン化器など、様々な特徴抽出手法が評価されている。
R-GATモデルは、甲状腺癌では0.99, 0.97, 0.98, 0.96, 0.94, 0.95, 0.96, 0.99, 0.99, 0.99, 0.95, 0.95, 0.95, 0.95, 0.95, 0.95, 0.95, 精度、リコール、F1スコアを達成し、他の手法よりも優れている。
関連論文リスト
- AI Co-Scientist for Knowledge Synthesis in Medical Contexts: A Proof of Concept [0.0]
本稿では,人口,インターベンション,コンパレータ,アウトカム,学習デザイン(PICOS)の明示的な形式化に基づく,スケーラブルで透明な知識合成のためのAIを提案する。
このプラットフォームはリレーショナルストレージ、ベクトルベースのセマンティック検索、Neo4jナレッジグラフを統合している。
その結果,PICOS対応で説明可能な自然言語処理は,エビデンス合成のスケーラビリティ,透明性,効率性を向上できることがわかった。
論文 参考訳(メタデータ) (2026-01-16T23:07:58Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Bi-Axial Transformers: Addressing the Increasing Complexity of EHR Classification [6.345037597566314]
本稿では,よりリッチなデータ関係を学習するために,ERHデータの臨床的変数と時間軸の両方に対応するバイ軸変換器(BAT)を提案する。
BATは、セシス予測における最先端のパフォーマンスを達成し、死亡率分類の上位手法と競合する。
論文 参考訳(メタデータ) (2025-08-17T16:04:56Z) - BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [1.1545092788508224]
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
それぞれのサンプルは高解像度のラベルを含み、軸、矢状、およびコロナイメージングプレーンに分類される。
IoU(Intersection-over-Union, Intersection-over-Union, IoU)が82.3%と高い値を示した。
論文 参考訳(メタデータ) (2025-06-17T08:56:05Z) - Multi-Omics Fusion with Soft Labeling for Enhanced Prediction of Distant Metastasis in Nasopharyngeal Carcinoma Patients after Radiotherapy [4.971538849792411]
オミクスデータの統合で直面する課題の1つは、予測不能の存在である。
本研究の目的は,オミクスデータに固有の相違を緩和する融合手法を開発することである。
論文 参考訳(メタデータ) (2025-02-12T05:26:59Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - AI in Lung Health: Benchmarking Detection and Diagnostic Models Across Multiple CT Scan Datasets [0.33923727961771083]
肺がんは、世界中でがん関連死亡の原因となっている。
医療画像への人工知能の統合が拡大するにつれ、堅牢なAIモデルの開発と評価は、大規模で注釈の付いたデータセットへのアクセスを必要としている。
我々は,3次元結節検出と肺がん分類のためのディープラーニングモデルをベンチマークした。
論文 参考訳(メタデータ) (2024-05-07T18:36:40Z) - Deep Learning-Based Segmentation of Tumors in PET/CT Volumes: Benchmark of Different Architectures and Training Strategies [0.12301374769426145]
本研究は,癌病変の自動分類のためのニューラルネットワークアーキテクチャとトレーニング戦略について検討する。
V-NetモデルとnnU-Netモデルは、それぞれのデータセットに対して最も効果的であった。
がんのない症例をAutoPETデータセットから除去することで,ほとんどのモデルの性能が向上した。
論文 参考訳(メタデータ) (2024-04-15T13:03:42Z) - RCdpia: A Renal Carcinoma Digital Pathology Image Annotation dataset based on pathologists [14.79279940958727]
腫瘍領域と隣接領域(RCdpia)を個別にラベル付けしたTCGAデジタル病理データセットを作成した。
このデータセットはhttp://39.171.241.18:8888/RCdpia/で公開されている。
論文 参考訳(メタデータ) (2024-03-17T13:23:25Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Hierarchical Classification System for Breast Cancer Specimen Report
(HCSBC) -- an end-to-end model for characterizing severity and diagnosis [3.4454444815042735]
階層型ハイブリッドトランスフォーマーベースパイプライン(59ラベル)の開発 -乳癌検体分類システム(HCSBC)-
我々は、EUHデータに基づいてモデルをトレーニングし、2つの外部データセット(MGHとMayo Clinical)でモデルの性能を評価した。
論文 参考訳(メタデータ) (2023-11-02T18:37:45Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Enhancing Embedding Representations of Biomedical Data using Logic
Knowledge [6.295638112781736]
本稿では,PharmKGデータセット上の知識グラフモデルの埋め込み表現を強化するために,論理ルールを利用する。
R2Nは利用可能なロジックルールを使用して、KGE潜在表現を前提としたニューラルネットワークを構築する。
実験の結果,本手法はPharmKGデータセットの最先端性を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-23T13:38:21Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。