論文の概要: A Deep Learning Pipeline for Epilepsy Genomic Analysis Using GPT-2 XL and NVIDIA H100
- arxiv url: http://arxiv.org/abs/2510.00392v1
- Date: Wed, 01 Oct 2025 01:07:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.317378
- Title: A Deep Learning Pipeline for Epilepsy Genomic Analysis Using GPT-2 XL and NVIDIA H100
- Title(参考訳): GPT-2 XLとNVIDIA H100を用いたてんかんゲノム解析のためのディープラーニングパイプライン
- Authors: Muhammad Omer Latif, Hayat Ullah, Muhammad Ali Shafique, Zhihua Dong,
- Abstract要約: 本稿では,ディープラーニング戦略のパワーとGPUアクセラレーションを統合して,てんかんにおける遺伝子発現パターンを解析する新しい分析パイプラインを提案する。
提案手法は変換器をベースとした大規模言語モデル(LLM)であるGPT-2 XLを用いてゲノム配列解析を行う。
その結果,ケトゲン食療法後の海馬アストログリオーシスの減少,ゼブラフィッシュモデルにおける興奮抑制シグナル平衡の回復など,いくつかの重要な転写学的修飾が示された。
- 参考スコア(独自算出の注目度): 0.9139661541734707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Epilepsy is a chronic neurological condition characterized by recurrent seizures, with global prevalence estimated at 50 million people worldwide. While progress in high-throughput sequencing has allowed for broad-based transcriptomic profiling of brain tissues, the deciphering of these highly complex datasets remains one of the challenges. To address this issue, in this paper we propose a new analysis pipeline that integrates the power of deep learning strategies with GPU-acceleration computation for investigating Gene expression patterns in epilepsy. Specifically, our proposed approach employs GPT-2 XL, a transformer-based Large Language Model (LLM) with 1.5 billion parameters for genomic sequence analysis over the latest NVIDIA H100 Tensor Core GPUs based on Hopper architecture. Our proposed method enables efficient preprocessing of RNA sequence data, gene sequence encoding, and subsequent pattern identification. We conducted experiments on two epilepsy datasets including GEO accession GSE264537 and GSE275235. The obtained results reveal several significant transcriptomic modifications, including reduced hippocampal astrogliosis after ketogenic diet treatment as well as restored excitatory-inhibitory signaling equilibrium in zebrafish epilepsy model. Moreover, our results highlight the effectiveness of leveraging LLMs in combination with advanced hardware acceleration for transcriptomic characterization in neurological diseases.
- Abstract(参考訳): てんかんは慢性神経疾患で、再発性発作を特徴とし、全世界で5000万人と推定されている。
高スループットシークエンシングの進歩により、脳組織の広範な転写学的プロファイリングが可能になったが、これらの非常に複雑なデータセットの解読は依然として課題の1つである。
本稿では, 深層学習戦略のパワーとGPU加速度計算を統合して, エピレプシーにおける遺伝子発現パターンを解析する新しい解析パイプラインを提案する。
具体的には,最新のNVIDIA H100 Tensor Core GPU上でのゲノム配列解析に15億のパラメータを持つ変換器ベースのLarge Language Model(LLM)であるGPT-2 XLを用いる。
提案手法は、RNA配列データ、遺伝子配列エンコーディング、およびその後のパターン識別の効率的な前処理を可能にする。
我々はGEOアクセシオンGSE264537とGSE275235を含む2つのてんかんデータセットの実験を行った。
その結果、ケトゲン食後の海馬アストログリオーシスの減少や、ゼブラフィッシュてんかんモデルにおける興奮抑制シグナル平衡の回復など、いくつかの重要な転写学的修飾が示された。
さらに,本研究は,LLMとハードウェアアクセラレーションの併用による神経疾患の転写学的特徴評価の有効性を強調した。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - scGSDR: Harnessing Gene Semantics for Single-Cell Pharmacological Profiling [5.831554646284266]
scGSDRは、細胞状態と遺伝子シグナル伝達経路の知識に基づく2つの計算パイプラインを統合するモデルである。
scGSDRは、遺伝子セマンティクスを組み込んで予測性能を高め、解釈可能性モジュールを使用する。
モデルはシングルドラッグの予測からドラッグの組み合わせを含むシナリオまで拡張された。
論文 参考訳(メタデータ) (2025-02-02T15:43:20Z) - SincVAE: A new semi-supervised approach to improve anomaly detection on EEG data using SincNet and variational autoencoder [0.0]
本研究では,脳波データからてんかん発作を検出するための半教師付きアプローチを提案する。
以上の結果から,SncVAEは脳波データにおける発作検出を改善し,早期発作の早期発見と術後経過のモニタリングが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-06-25T13:21:01Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics [44.97217246897902]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning [3.8175773487333857]
本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
論文 参考訳(メタデータ) (2022-11-30T00:13:59Z) - Using Deep Learning Sequence Models to Identify SARS-CoV-2 Divergence [1.9573380763700707]
SARS-CoV-2は上層呼吸器系RNAウイルスで、2021年5月時点で300万人以上が死亡し、全世界で1億5000万人以上が感染している。
本稿では、繰り返しおよび畳み込み単位を利用してスパイクタンパク質のアミノ酸配列を取り込み、対応するクレードを分類するニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2021-11-12T07:52:11Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。