論文の概要: R-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- arxiv url: http://arxiv.org/abs/2410.15198v5
- Date: Mon, 13 Oct 2025 03:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.794722
- Title: R-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data
- Title(参考訳): R-GAT: 限られたデータを持つシナリオのためのグラフベース残留ネットワークを活用したがん文書分類
- Authors: Elias Hossain, Tasfia Nuzhat, Shamsul Masum, Shahram Rahimi, Noorbakhsh Amiri Golilarz,
- Abstract要約: Residual Graph Attention Network (R-GAT)は、バイオメディカルテキストのセマンティックおよびリレーショナル依存関係をキャプチャするために、マルチヘッドアテンションと残差接続を統合している。
R-GATは、BioBERTやBioClinicalBERTのようなトランスフォーマーベースのモデルに匹敵する安定かつ競争的な性能を実現している。
将来の研究を支援し、促進するために、キュレートされたデータセットもリリースします。
- 参考スコア(独自算出の注目度): 1.1200323437006519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate classification of cancer-related biomedical abstracts is critical for advancing cancer informatics and supporting decision-making in healthcare research. Yet progress in this domain is often constrained by limited availability of labeled corpora and the high computational demands of transformer-based approaches. To address these challenges, we propose a Residual Graph Attention Network (R-GAT) that integrates multi-head attention with residual connections to capture semantic and relational dependencies in biomedical texts. Evaluated on a curated dataset of 1,875 PubMed abstracts spanning thyroid, colon, lung, and generic cancer topics, R-GAT achieves stable and competitive performance, comparable to transformer-based models such as BioBERT and BioClinicalBERT and strong classical baselines like Logistic Regression, while requiring significantly fewer computational resources. Ablation studies confirm the importance of attention and residual connections in ensuring robustness under limited-data conditions. To support reproducibility and facilitate future research, we also release the curated dataset. Together, these contributions demonstrate the value of lightweight graph-based architectures as reliable and resource-efficient alternatives to computationally intensive transformers in biomedical NLP.
- Abstract(参考訳): がん関連バイオメディカル・抽象化の正確な分類は、がん情報学を推進し、医療研究における意思決定を支援するために重要である。
しかし、この領域の進歩は、ラベル付きコーパスの限られた可用性とトランスフォーマーベースのアプローチによる高い計算要求によって制約されることが多い。
これらの課題に対処するため,バイオメディカルテキストのセマンティックおよびリレーショナル依存関係を捉えるために,マルチヘッドアテンションと残差接続を統合したResidual Graph Attention Network (R-GAT)を提案する。
R-GATは甲状腺、結腸、肺、一般がんのトピックにまたがる1,875のPubMed抽象化のキュレートされたデータセットに基づいて評価され、BioBERTやBioClinicalBERTのようなトランスフォーマーベースのモデルや、ロジスティック回帰のような強力な古典的ベースラインに匹敵する安定した、競争力のあるパフォーマンスを達成する。
アブレーション研究は、限られたデータ条件下でのロバスト性確保における注意と残留接続の重要性を裏付けるものである。
再現性をサポートし、将来の研究を容易にするため、キュレートされたデータセットもリリースします。
これらの貢献は、バイオメディカルNLPにおける計算集約型トランスフォーマーの信頼性と資源効率の代替として、軽量グラフベースのアーキテクチャの価値を示すものである。
関連論文リスト
- AI Co-Scientist for Knowledge Synthesis in Medical Contexts: A Proof of Concept [0.0]
本稿では,人口,インターベンション,コンパレータ,アウトカム,学習デザイン(PICOS)の明示的な形式化に基づく,スケーラブルで透明な知識合成のためのAIを提案する。
このプラットフォームはリレーショナルストレージ、ベクトルベースのセマンティック検索、Neo4jナレッジグラフを統合している。
その結果,PICOS対応で説明可能な自然言語処理は,エビデンス合成のスケーラビリティ,透明性,効率性を向上できることがわかった。
論文 参考訳(メタデータ) (2026-01-16T23:07:58Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Bi-Axial Transformers: Addressing the Increasing Complexity of EHR Classification [6.345037597566314]
本稿では,よりリッチなデータ関係を学習するために,ERHデータの臨床的変数と時間軸の両方に対応するバイ軸変換器(BAT)を提案する。
BATは、セシス予測における最先端のパフォーマンスを達成し、死亡率分類の上位手法と競合する。
論文 参考訳(メタデータ) (2025-08-17T16:04:56Z) - BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [1.1545092788508224]
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
それぞれのサンプルは高解像度のラベルを含み、軸、矢状、およびコロナイメージングプレーンに分類される。
IoU(Intersection-over-Union, Intersection-over-Union, IoU)が82.3%と高い値を示した。
論文 参考訳(メタデータ) (2025-06-17T08:56:05Z) - Multi-Omics Fusion with Soft Labeling for Enhanced Prediction of Distant Metastasis in Nasopharyngeal Carcinoma Patients after Radiotherapy [4.971538849792411]
オミクスデータの統合で直面する課題の1つは、予測不能の存在である。
本研究の目的は,オミクスデータに固有の相違を緩和する融合手法を開発することである。
論文 参考訳(メタデータ) (2025-02-12T05:26:59Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - AI in Lung Health: Benchmarking Detection and Diagnostic Models Across Multiple CT Scan Datasets [0.33923727961771083]
肺がんは、世界中でがん関連死亡の原因となっている。
医療画像への人工知能の統合が拡大するにつれ、堅牢なAIモデルの開発と評価は、大規模で注釈の付いたデータセットへのアクセスを必要としている。
我々は,3次元結節検出と肺がん分類のためのディープラーニングモデルをベンチマークした。
論文 参考訳(メタデータ) (2024-05-07T18:36:40Z) - Deep Learning-Based Segmentation of Tumors in PET/CT Volumes: Benchmark of Different Architectures and Training Strategies [0.12301374769426145]
本研究は,癌病変の自動分類のためのニューラルネットワークアーキテクチャとトレーニング戦略について検討する。
V-NetモデルとnnU-Netモデルは、それぞれのデータセットに対して最も効果的であった。
がんのない症例をAutoPETデータセットから除去することで,ほとんどのモデルの性能が向上した。
論文 参考訳(メタデータ) (2024-04-15T13:03:42Z) - RCdpia: A Renal Carcinoma Digital Pathology Image Annotation dataset based on pathologists [14.79279940958727]
腫瘍領域と隣接領域(RCdpia)を個別にラベル付けしたTCGAデジタル病理データセットを作成した。
このデータセットはhttp://39.171.241.18:8888/RCdpia/で公開されている。
論文 参考訳(メタデータ) (2024-03-17T13:23:25Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - Hierarchical Classification System for Breast Cancer Specimen Report
(HCSBC) -- an end-to-end model for characterizing severity and diagnosis [3.4454444815042735]
階層型ハイブリッドトランスフォーマーベースパイプライン(59ラベル)の開発 -乳癌検体分類システム(HCSBC)-
我々は、EUHデータに基づいてモデルをトレーニングし、2つの外部データセット(MGHとMayo Clinical)でモデルの性能を評価した。
論文 参考訳(メタデータ) (2023-11-02T18:37:45Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Enhancing Embedding Representations of Biomedical Data using Logic
Knowledge [6.295638112781736]
本稿では,PharmKGデータセット上の知識グラフモデルの埋め込み表現を強化するために,論理ルールを利用する。
R2Nは利用可能なロジックルールを使用して、KGE潜在表現を前提としたニューラルネットワークを構築する。
実験の結果,本手法はPharmKGデータセットの最先端性を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-23T13:38:21Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。