論文の概要: WTKO-CNN: Deep Learning Reveals Sequence Motifs Distinguishing Wild-Type and Knockout ATAC-seq Peaks
- arxiv url: http://arxiv.org/abs/2605.24034v1
- Date: Thu, 21 May 2026 07:46:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.548512
- Title: WTKO-CNN: Deep Learning Reveals Sequence Motifs Distinguishing Wild-Type and Knockout ATAC-seq Peaks
- Title(参考訳): WTKO-CNN: 野生型とノックアウト型のATAC-seqピークを解消する深層学習のモチーフ
- Authors: Lopamudra Dey,
- Abstract要約: 畳み込みニューラルネットワークを用いてDNA配列をWTまたはKOに分類する。
分類決定に最も影響を及ぼすヌクレオチドの位置を特定するために,サリエンシマップを生成する。
本分析では,KO配列からWTを識別する転写因子ファミリーに関連するモチーフを同定した。
- 参考スコア(独自算出の注目度): 0.31727619150610836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chromatin regulators can alter transcriptional programs by modifying the accessibility of regulatory DNA elements. Understanding how regulatory sequences differ between wild-type (WT) and knockout (KO) conditions is crucial for deciphering transcriptional control. Here, we applied a convolutional neural network, \textbf{WTKO-CNN} with an attention mechanism to classify DNA sequences as WT or KO, achieving high predictive performance. To interpret the model, we generated saliency maps to identify nucleotide positions most influential for the classification decision. From these high-saliency regions, we extracted and clustered k-mers, enabling de novo motif discovery. Sequence logos and consensus motifs derived from the CNN filters revealed biologically meaningful patterns, which are further validated using MEME, TOMTOM, and HOMER against known transcription factor binding sites. Our analysis identified motifs associated with transcription factor families that discriminate WT from KO sequences, demonstrating that CNN-guided saliency mapping is a powerful approach for uncovering functional sequence features.
- Abstract(参考訳): クロマチン調節因子は、調節されたDNA要素のアクセシビリティを変更することで転写プログラムを変更することができる。
転写制御の解読には,野生型(WT)とノックアウト型(KO)の制御配列の違いを理解することが重要である。
そこで我々は,DNA配列をWTまたはKOに分類するための注意機構を備えた畳み込みニューラルネットワーク \textbf{WTKO-CNN を適用し,高い予測性能を実現した。
モデルを理解するために,分類決定に最も影響を及ぼすヌクレオチドの位置を特定するために,サリエンシマップを生成した。
これらの高塩度領域からk-merを抽出,クラスタ化し,de novoモチーフの発見を可能にした。
CNNフィルタから得られた配列ロゴとコンセンサスモチーフは生物学的に有意なパターンを示し,MEME,TOMTOM,HOMERを用いて既知の転写因子結合部位に対してさらに検証した。
解析により,KO配列からWTを識別する転写因子ファミリーに関連するモチーフを同定し,CNN誘導のサリエンシマッピングが機能的配列の特徴を明らかにするための強力なアプローチであることを示した。
関連論文リスト
- Evaluating Post-hoc Explanations of the Transformer-based Genome Language Model DNABERT-2 [0.9176056742068814]
我々は,アテンション機構にレイヤワイド関連伝播の拡張であるAttnLRPを適用し,最先端のgLM DNABERT-2に適用する。
そこで我々はトークンとヌクレオチドから説明を伝達する手法を提案する。
以上の結果から, AttnLRPは既知の生物学的パターンに対応する信頼性の高い説明を得られることが示唆された。
論文 参考訳(メタデータ) (2026-04-23T13:56:55Z) - XAI-Driven Deep Learning for Protein Sequence Functional Group Classification [0.7734726150561088]
本研究では,タンパク質データバンク(PDB)由来のタンパク質配列の機能的グループ分類のためのディープラーニングフレームワークを提案する。
4つのアーキテクチャが実装された: Convolutional Neural Network (CNN)、Bidirectional Long Short-Term Memory (BiLSTM)、CNN-BiLSTM hybrid、CNN with Attention。
CNNは91.8%の検証精度を達成し、局所的なモチーフ検出の有効性を示した。
論文 参考訳(メタデータ) (2025-11-16T18:10:42Z) - ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.17845687013434]
本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。
本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。
特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文 参考訳(メタデータ) (2025-07-19T04:46:53Z) - Regulatory DNA sequence Design with Reinforcement Learning [56.20290878358356]
本稿では,強化学習を利用して事前学習した自己回帰モデルを微調整する生成手法を提案する。
2つの酵母培地条件下でのプロモーター設計タスクの評価と,3種類のヒト細胞に対するエンハンサー設計タスクの評価を行った。
論文 参考訳(メタデータ) (2025-03-11T02:33:33Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Cell Graph Transformer for Nuclei Classification [78.47566396839628]
我々は,ノードとエッジを入力トークンとして扱うセルグラフ変換器(CGT)を開発した。
不愉快な特徴は、騒々しい自己注意スコアと劣等な収束につながる可能性がある。
グラフ畳み込みネットワーク(GCN)を利用して特徴抽出器を学習する新しいトポロジ対応事前学習法を提案する。
論文 参考訳(メタデータ) (2024-02-20T12:01:30Z) - Identifying DNA Sequence Motifs Using Deep Learning [0.0]
我々は,DNAシークエンス内のヌクレオチドの長期依存性をキャプチャする,注目に基づくディープラーニングシーケンスモデルであるDeepDeCodeを紹介した。
本稿では,DeepDeCodeの解釈可能性と信頼性を高めるために,シーケンスモチーフの正確な識別に可視化技術を用いることを提案する。
論文 参考訳(メタデータ) (2023-11-20T23:14:28Z) - Stochastic Aggregation in Graph Neural Networks [9.551282469099887]
グラフニューラルネットワーク(GNN)は、過スムージングおよび限られた電力識別を含む病理を発現する。
GNNsにおける集約のための統合フレームワーク(STAG)を提案する。そこでは、近隣からの集約プロセスにノイズが(適応的に)注入され、ノード埋め込みを形成する。
論文 参考訳(メタデータ) (2021-02-25T02:52:03Z) - AM-GCN: Adaptive Multi-channel Graph Convolutional Networks [85.0332394224503]
グラフ畳み込みネットワーク(GCN)は,豊富な情報を持つ複雑なグラフにおいて,ノードの特徴と位相構造を最適に統合できるかどうかを検討する。
半教師付き分類(AM-GCN)のための適応型マルチチャネルグラフ畳み込みネットワークを提案する。
実験の結果,AM-GCNはノードの特徴とトポロジ的構造の両方から最も相関性の高い情報を抽出することがわかった。
論文 参考訳(メタデータ) (2020-07-05T08:16:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。