論文の概要: Multi-omics Sampling-based Graph Transformer for Synthetic Lethality
Prediction
- arxiv url: http://arxiv.org/abs/2310.11082v1
- Date: Tue, 17 Oct 2023 09:06:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 17:04:00.686424
- Title: Multi-omics Sampling-based Graph Transformer for Synthetic Lethality
Prediction
- Title(参考訳): 合成致死予測のためのマルチオミクスサンプリングに基づくグラフトランス
- Authors: Xusheng Zhao, Hao Liu, Qiong Dai, Hao Peng, Xu Bai, Huailiang Peng
- Abstract要約: 合成致死性(SL)予測は、2つの遺伝子の共変異が細胞死をもたらすかどうかを識別するために用いられる。
グラフニューラルネットワーク(GNN)は、メッセージパッシング機構の制限に悩まされる。
SL予測のためのマルチオミクスサンプリンググラフ変換器(MSGT-SL)を提案する。
- 参考スコア(独自算出の注目度): 20.363977976628792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic lethality (SL) prediction is used to identify if the co-mutation of
two genes results in cell death. The prevalent strategy is to abstract SL
prediction as an edge classification task on gene nodes within SL data and
achieve it through graph neural networks (GNNs). However, GNNs suffer from
limitations in their message passing mechanisms, including over-smoothing and
over-squashing issues. Moreover, harnessing the information of non-SL gene
relationships within large-scale multi-omics data to facilitate SL prediction
poses a non-trivial challenge. To tackle these issues, we propose a new
multi-omics sampling-based graph transformer for SL prediction (MSGT-SL).
Concretely, we introduce a shallow multi-view GNN to acquire local structural
patterns from both SL and multi-omics data. Further, we input gene features
that encode multi-view information into the standard self-attention to capture
long-range dependencies. Notably, starting with batch genes from SL data, we
adopt parallel random walk sampling across multiple omics gene graphs
encompassing them. Such sampling effectively and modestly incorporates genes
from omics in a structure-aware manner before using self-attention. We showcase
the effectiveness of MSGT-SL on real-world SL tasks, demonstrating the
empirical benefits gained from the graph transformer and multi-omics data.
- Abstract(参考訳): 合成致死性(SL)予測は、2つの遺伝子の共変異が細胞死をもたらすかどうかを識別するために用いられる。
主な戦略は、SLデータ内の遺伝子ノードのエッジ分類タスクとしてSL予測を抽象化し、グラフニューラルネットワーク(GNN)を介して達成することである。
しかし、GNNはメッセージパッシング機構の制限に悩まされており、過度なスムース化や過剰なスキャッシングの問題がある。
また、大規模マルチオミクスデータ内の非sl遺伝子関係の情報を利用してsl予測を容易にすることは、非自明な課題となる。
これらの問題に対処するために、SL予測のためのマルチオミクスサンプリングベースのグラフ変換器(MSGT-SL)を提案する。
具体的には、SLデータとマルチオミクスデータの両方から局所構造パターンを取得するために、浅いマルチビューGNNを導入する。
さらに、マルチビュー情報をエンコードする遺伝子特徴を標準のセルフアテンションに入力し、長距離の依存関係を捉える。
特に、slデータからのバッチ遺伝子から始め、複数のomcs遺伝子グラフにまたがる並列ランダムウォークサンプリングを採用する。
このようなサンプリングは、自己認識を使用する前に、オミクスの遺伝子を構造認識的に効果的かつ緩やかに組み込む。
実世界のSLタスクにおけるMSGT-SLの有効性を示し、グラフトランスフォーマーとマルチオミクスデータから得られる経験的メリットを示す。
関連論文リスト
- Sampling-guided Heterogeneous Graph Neural Network with Temporal Smoothing for Scalable Longitudinal Data Imputation [17.81217890585335]
そこで本研究では,Samping-Guided Heterogeneous Graph Neural Network (SHT-GNN) を提案する。
主観的なミニバッチサンプリングと多層時間平滑化機構を活用することで、SHT-GNNは大規模データセットに効率よくスケールする。
Alzheimer's Disease Neuroimaging Initiative (ADNI)データセットを含む、合成と実世界の両方のデータセットの実験は、SHT-GNNが既存の計算方法を大幅に上回っていることを実証している。
論文 参考訳(メタデータ) (2024-11-07T17:41:07Z) - GNN-SL: Sequence Labeling Based on Nearest Examples via GNN [50.55076156520809]
グラフニューラルネットワークシーケンスラベリング(GNN-SL)を導入する。
GNN-SLは、トレーニングセット全体から取得した類似のタグ付け例でバニラシーケンスラベリングモデル出力を増強する。
我々は3つの典型的なシーケンスラベリングタスクについて様々な実験を行う。
GNN-SLはPKUの96.9(+0.2)、CITYUの98.3(+0.4)、MSRの98.5(+0.2)、CWSタスクのASの96.9(+0.2)を達成している。
論文 参考訳(メタデータ) (2022-12-05T04:22:00Z) - Generative Data Augmentation for Non-IID Problem in Decentralized
Clinical Machine Learning [8.24935363381541]
SL-GANと呼ばれるスワムラーニングにおける生成的拡張フレームワークを提案する。
SL-GANは、参加者から合成データを生成することにより、非IIDデータを増強する。
SLGANは結核、白血病、COVID-19を含む3つの臨床データセットにおいて、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-02T11:46:09Z) - Diverse Sample Generation: Pushing the Limit of Data-free Quantization [85.95032037447454]
本稿では,データ不要なポストトレーニング量子化と量子化学習のための汎用的な2次サンプル生成手法を提案する。
大規模な画像分類タスクでは、DSGは既存のデータ自由量子化手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-09-01T07:06:44Z) - Score-based Generative Modeling in Latent Space [93.8985523558869]
スコアベース生成モデル(SGM)は,最近,サンプル品質と分布範囲の両面で顕著な結果を示した。
本稿では,Latent Score-based Generative Model (LSGM)を提案する。
データから潜在空間への移動により、より表現力のある生成モデルをトレーニングし、非連続データにSGMを適用し、よりスムーズなSGMをより小さな空間で学習することができる。
論文 参考訳(メタデータ) (2021-06-10T17:26:35Z) - MG-GCN: Fast and Effective Learning with Mix-grained Aggregators for
Training Large Graph Convolutional Networks [20.07942308916373]
グラフ畳み込みネットワーク(GCN)は、隣人層の情報を層ごとに集約することでノードの埋め込みを生成する。
GCNの高計算とメモリコストにより、大きなグラフのトレーニングが不可能になる。
MG-GCNと呼ばれる新しいモデルでは、精度、トレーニング速度、収束速度、メモリコストの点で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-11-17T14:51:57Z) - Understanding Self-supervised Learning with Dual Deep Networks [74.92916579635336]
本稿では,2組の深層ReLUネットワークを用いたコントラスト型自己教師学習(SSL)手法を理解するための新しい枠組みを提案する。
種々の損失関数を持つSimCLRの各SGD更新において、各層の重みは共分散演算子によって更新されることを示す。
共分散演算子の役割と、そのようなプロセスでどのような特徴が学習されるかをさらに研究するために、我々は、階層的潜在木モデル(HLTM)を用いて、データ生成および増大過程をモデル化する。
論文 参考訳(メタデータ) (2020-10-01T17:51:49Z) - Contrastive and Generative Graph Convolutional Networks for Graph-based
Semi-Supervised Learning [64.98816284854067]
グラフベースのSemi-Supervised Learning (SSL)は、少数のラベル付きデータのラベルをグラフ経由で残りの巨大なラベル付きデータに転送することを目的としている。
本稿では,データ類似性とグラフ構造を両立させ,監視信号の強化を図るため,新しいGCNベースのSSLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-15T13:59:28Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Semi-supervised Medical Image Classification with Global Latent Mixing [8.330337646455957]
ディープラーニングによるコンピュータ支援診断は、大規模な注釈付きデータセットに依存している。
半教師付き学習は、ラベルのないデータを活用することでこの課題を軽減する。
ラベル付きおよびラベルなしデータの線形混合に基づいてニューラルネットワークをトレーニングする新しいSSL手法を提案する。
論文 参考訳(メタデータ) (2020-05-22T14:49:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。