論文の概要: R-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- arxiv url: http://arxiv.org/abs/2410.15198v5
- Date: Mon, 13 Oct 2025 03:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.794722
- Title: R-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- Title(参考訳): R-GAT: 限られたデータを持つシナリオのためのグラフベース残留ネットワークを活用したがん文書分類
- Authors: Elias Hossain, Tasfia Nuzhat, Shamsul Masum, Shahram Rahimi, Noorbakhsh Amiri Golilarz,
- Abstract要約: Residual Graph Attention Network (R-GAT)は、バイオメディカルテキストのセマンティックおよびリレーショナル依存関係をキャプチャするために、マルチヘッドアテンションと残差接続を統合している。
R-GATは、BioBERTやBioClinicalBERTのようなトランスフォーマーベースのモデルに匹敵する安定かつ競争的な性能を実現している。
将来の研究を支援し、促進するために、キュレートされたデータセットもリリースします。
- 参考スコア(独自算出の注目度): 1.1200323437006519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate classification of cancer-related biomedical abstracts is critical for advancing cancer informatics and supporting decision-making in healthcare research. Yet progress in this domain is often constrained by limited availability of labeled corpora and the high computational demands of transformer-based approaches. To address these challenges, we propose a Residual Graph Attention Network (R-GAT) that integrates multi-head attention with residual connections to capture semantic and relational dependencies in biomedical texts. Evaluated on a curated dataset of 1,875 PubMed abstracts spanning thyroid, colon, lung, and generic cancer topics, R-GAT achieves stable and competitive performance, comparable to transformer-based models such as BioBERT and BioClinicalBERT and strong classical baselines like Logistic Regression, while requiring significantly fewer computational resources. Ablation studies confirm the importance of attention and residual connections in ensuring robustness under limited-data conditions. To support reproducibility and facilitate future research, we also release the curated dataset. Together, these contributions demonstrate the value of lightweight graph-based architectures as reliable and resource-efficient alternatives to computationally intensive transformers in biomedical NLP.
- Abstract(参考訳): がん関連バイオメディカル・抽象化の正確な分類は、がん情報学を推進し、医療研究における意思決定を支援するために重要である。
しかし、この領域の進歩は、ラベル付きコーパスの限られた可用性とトランスフォーマーベースのアプローチによる高い計算要求によって制約されることが多い。
これらの課題に対処するため,バイオメディカルテキストのセマンティックおよびリレーショナル依存関係を捉えるために,マルチヘッドアテンションと残差接続を統合したResidual Graph Attention Network (R-GAT)を提案する。
R-GATは甲状腺、結腸、肺、一般がんのトピックにまたがる1,875のPubMed抽象化のキュレートされたデータセットに基づいて評価され、BioBERTやBioClinicalBERTのようなトランスフォーマーベースのモデルや、ロジスティック回帰のような強力な古典的ベースラインに匹敵する安定した、競争力のあるパフォーマンスを達成する。
アブレーション研究は、限られたデータ条件下でのロバスト性確保における注意と残留接続の重要性を裏付けるものである。
再現性をサポートし、将来の研究を容易にするため、キュレートされたデータセットもリリースします。
これらの貢献は、バイオメディカルNLPにおける計算集約型トランスフォーマーの信頼性と資源効率の代替として、軽量グラフベースのアーキテクチャの価値を示すものである。
関連論文リスト
- BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [1.1545092788508224]
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
それぞれのサンプルは高解像度のラベルを含み、軸、矢状、およびコロナイメージングプレーンに分類される。
IoU(Intersection-over-Union, Intersection-over-Union, IoU)が82.3%と高い値を示した。
論文 参考訳(メタデータ) (2025-06-17T08:56:05Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - AI in Lung Health: Benchmarking Detection and Diagnostic Models Across Multiple CT Scan Datasets [0.33923727961771083]
肺がんは、世界中でがん関連死亡の原因となっている。
医療画像への人工知能の統合が拡大するにつれ、堅牢なAIモデルの開発と評価は、大規模で注釈の付いたデータセットへのアクセスを必要としている。
我々は,3次元結節検出と肺がん分類のためのディープラーニングモデルをベンチマークした。
論文 参考訳(メタデータ) (2024-05-07T18:36:40Z) - Deep Learning-Based Segmentation of Tumors in PET/CT Volumes: Benchmark of Different Architectures and Training Strategies [0.12301374769426145]
本研究は,癌病変の自動分類のためのニューラルネットワークアーキテクチャとトレーニング戦略について検討する。
V-NetモデルとnnU-Netモデルは、それぞれのデータセットに対して最も効果的であった。
がんのない症例をAutoPETデータセットから除去することで,ほとんどのモデルの性能が向上した。
論文 参考訳(メタデータ) (2024-04-15T13:03:42Z) - RCdpia: A Renal Carcinoma Digital Pathology Image Annotation dataset based on pathologists [14.79279940958727]
腫瘍領域と隣接領域(RCdpia)を個別にラベル付けしたTCGAデジタル病理データセットを作成した。
このデータセットはhttp://39.171.241.18:8888/RCdpia/で公開されている。
論文 参考訳(メタデータ) (2024-03-17T13:23:25Z) - Hierarchical Classification System for Breast Cancer Specimen Report
(HCSBC) -- an end-to-end model for characterizing severity and diagnosis [3.4454444815042735]
階層型ハイブリッドトランスフォーマーベースパイプライン(59ラベル)の開発 -乳癌検体分類システム(HCSBC)-
我々は、EUHデータに基づいてモデルをトレーニングし、2つの外部データセット(MGHとMayo Clinical)でモデルの性能を評価した。
論文 参考訳(メタデータ) (2023-11-02T18:37:45Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。