論文の概要: GBDTSVM: Combined Support Vector Machine and Gradient Boosting Decision Tree Framework for efficient snoRNA-disease association prediction
- arxiv url: http://arxiv.org/abs/2505.06534v1
- Date: Sat, 10 May 2025 06:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.892211
- Title: GBDTSVM: Combined Support Vector Machine and Gradient Boosting Decision Tree Framework for efficient snoRNA-disease association prediction
- Title(参考訳): GBDTSVM: 効率的なスノRNA放出関連予測のためのサポートベクトルマシンとグラディエントブースティング決定木フレームワーク
- Authors: Ummay Maria Muna, Fahim Hafiz, Shanta Biswas, Riasat Azim,
- Abstract要約: 本稿では, 新規かつ効率的なスノRNA分解関連を予測するための機械学習手法として, 「GBDTSVM」 というモデルを提案する。
GBDTSVMは、GBDTとSVMを利用したsnoRNA-disease機能統合表現を効果的に抽出する。
GBDTSVMモデルの実験的評価は,現場の最先端手法と比較して優れた性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Small nucleolar RNAs (snoRNAs) are increasingly recognized for their critical role in the pathogenesis and characterization of various human diseases. Consequently, the precise identification of snoRNA-disease associations (SDAs) is essential for the progression of diseases and the advancement of treatment strategies. However, conventional biological experimental approaches are costly, time-consuming, and resource-intensive; therefore, machine learning-based computational methods offer a promising solution to mitigate these limitations. This paper proposes a model called 'GBDTSVM', representing a novel and efficient machine learning approach for predicting snoRNA-disease associations by leveraging a Gradient Boosting Decision Tree (GBDT) and Support Vector Machine (SVM). 'GBDTSVM' effectively extracts integrated snoRNA-disease feature representations utilizing GBDT and SVM is subsequently utilized to classify and identify potential associations. Furthermore, the method enhances the accuracy of these predictions by incorporating Gaussian kernel profile similarity for both snoRNAs and diseases. Experimental evaluation of the GBDTSVM model demonstrated superior performance compared to state-of-the-art methods in the field, achieving an area under the receiver operating characteristic (AUROC) of 0.96 and an area under the precision-recall curve (AUPRC) of 0.95 on MDRF dataset. Moreover, our model shows superior performance on two more datasets named LSGT and PsnoD. Additionally, a case study on the predicted snoRNA-disease associations verified the top 10 predicted snoRNAs across nine prevalent diseases, further validating the efficacy of the GBDTSVM approach. These results underscore the model's potential as a robust tool for advancing snoRNA-related disease research. Source codes and datasets our proposed framework can be obtained from: https://github.com/mariamuna04/gbdtsvm
- Abstract(参考訳): 小さなヌクレオチドRNA(snoRNA)は、様々なヒト疾患の病因と特徴において、その重要な役割を担っていると認識されている。
したがって、snoRNA-disease associations(SDAs)の正確な同定は、疾患の進行と治療戦略の進展に不可欠である。
しかし、従来の生物学的実験手法はコストがかかり、時間がかかり、資源が集中しているため、機械学習ベースの計算手法はこれらの制限を緩和する有望な解決策を提供する。
本稿では、GBDT(Gradient Boosting Decision Tree)とSVM(Support Vector Machine)を活用して、スノRNAの分解関連を予測するための新しい効率的な機械学習手法「GBDTSVM」を提案する。
GBDTSVM は GBDT と SVM を利用したsnoRNA-disease 機能表現を効果的に抽出する。
さらに、この方法は、snoRNAと疾患の両方に対してガウスのカーネルプロファイル類似性を組み込むことにより、これらの予測の精度を高める。
実験によるGBDTSVMモデルの性能評価は, 現場の最先端手法と比較して, 0.96 の受信動作特性 (AUROC) の領域, MDRFデータセットの精度-リコール曲線 (AUPRC) の領域を達成できた。
さらに,LSGTとPsnoDという2つのデータセットに対して,優れた性能を示す。
さらに、予測されたsnoRNA分解関連に関するケーススタディでは、9つの一般的な疾患で予測されたsnoRNAのトップ10が検証され、さらにGBDTSVMアプローチの有効性が検証された。
これらの結果は、snoRNA関連疾患研究を進めるための堅牢なツールとしてのモデルの可能性を強調している。
提案したフレームワークのソースコードとデータセットは、 https://github.com/mariamuna04/gbdtsvm.comから取得できます。
関連論文リスト
- scMamba: A Pre-Trained Model for Single-Nucleus RNA Sequencing Analysis in Neurodegenerative Disorders [43.24785083027205]
scMambaは、snRNA-seq解析の品質と実用性を改善するために設計された事前訓練モデルである。
最近のMambaモデルにインスパイアされた scMamba は、線形アダプタ層、遺伝子埋め込み、双方向のMambaブロックを組み込んだ新しいアーキテクチャを導入している。
scMambaは、セルタイプアノテーション、ダブルト検出、インプット、差分表現された遺伝子の同定など、様々な下流タスクにおいて、ベンチマーク手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-02-12T11:48:22Z) - scBIT: Integrating Single-cell Transcriptomic Data into fMRI-based Prediction for Alzheimer's Disease Diagnosis [24.268703526039367]
scBITは、fMRIと単一核RNA(snRNA)を組み合わせてアルツハイマー病(AD)の予測を強化する新しい方法である
snRNAデータを細胞型特異的な遺伝子ネットワークに分割するサンプリング戦略を採用し、自己説明可能なグラフニューラルネットワークを使用してクリティカルなサブグラフを抽出する。
広範囲にわたる実験により、cBITが複雑な脳領域-遺伝子関連を明らかにする効果が検証された。
論文 参考訳(メタデータ) (2025-02-04T18:37:46Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - LncRNA-disease association prediction method based on heterogeneous information completion and convolutional neural network [9.17998537192211]
lncRNA-disease associations (LDAs) の精度は、疾患の警告と治療に非常に重要である。
本稿では, HCNNLDA と命名されたlncRNA-解離関連予測に対して, 異種ネットワークと畳み込みニューラルネットワーク(CNN)に基づくディープラーニングモデルを提案する。
実験結果から,提案モデルがいくつかの最新の予測モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T06:11:27Z) - Heterogeneous network and graph attention auto-encoder for LncRNA-disease association prediction [11.73181429989457]
本研究は、lncRNAと疾患の特徴を構築するために、バイオメディカルデータの複数のソースを十分に活用する。
HGATELDAと呼ばれるグラフアテンション自動エンコーダに基づく新しいディープラーニングモデルを提案する。
HGATELDAモデルは、5倍のクロスバリデーションを用いて評価すると、印象的なAUC値0.9692を達成する。
論文 参考訳(メタデータ) (2024-05-03T02:15:05Z) - Machine Learning Modeling Of SiRNA Structure-Potency Relationship With
Applications Against Sars-Cov-2 Spike Gene [0.0]
薬の発見プロセスは長くて費用がかかるので、新しい薬を市場に出すのに10年近くかかります。
バイオテクノロジー、計算方法、機械学習アルゴリズムは、薬物発見を革命させ、プロセスをスピードアップし、患者の結果を改善する可能性がある。
新型コロナウイルス(COVID-19)のパンデミックは、これらの技術の可能性の認識をさらに加速し、さらに深めている。
論文 参考訳(メタデータ) (2024-01-18T23:00:34Z) - Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。