論文の概要: MEDNA-DFM: A Dual-View FiLM-MoE Model for Explainable DNA Methylation Prediction
- arxiv url: http://arxiv.org/abs/2602.22850v1
- Date: Thu, 26 Feb 2026 10:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.649994
- Title: MEDNA-DFM: A Dual-View FiLM-MoE Model for Explainable DNA Methylation Prediction
- Title(参考訳): MEDNA-DFM: 説明可能なDNAメチル化予測のためのデュアルビューFiLM-MoEモデル
- Authors: Yi He, Yina Cao, Jixiu Zhai, Di Wang, Junxiao Kong, Tianchi Lu,
- Abstract要約: 本稿では,機構にインスパイアされた信号浄化アルゴリズムとともに,高性能なMEDNA-DFMを提案する。
本研究は,MEDNA-DFMが保存メチル化パターンを効果的に捉えていることを示す。
開発したアルゴリズムを適用して,従来の研究よりも信頼性の高いモチーフを抽出した。
- 参考スコア(独自算出の注目度): 7.3621714430935805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate computational identification of DNA methylation is essential for understanding epigenetic regulation. Although deep learning excels in this binary classification task, its "black-box" nature impedes biological insight. We address this by introducing a high-performance model MEDNA-DFM, alongside mechanism-inspired signal purification algorithms. Our investigation demonstrates that MEDNA-DFM effectively captures conserved methylation patterns, achieving robust distinction across diverse species. Validation on external independent datasets confirms that the model's generalization is driven by conserved intrinsic motifs (e.g., GC content) rather than phylogenetic proximity. Furthermore, applying our developed algorithms extracted motifs with significantly higher reliability than prior studies. Finally, empirical evidence from a Drosophila 6mA case study prompted us to propose a "sequence-structure synergy" hypothesis, suggesting that the GAGG core motif and an upstream A-tract element function cooperatively. We further validated this hypothesis via in silico mutagenesis, confirming that the ablation of either or both elements significantly degrades the model's recognition capabilities. This work provides a powerful tool for methylation prediction and demonstrates how explainable deep learning can drive both methodological innovation and the generation of biological hypotheses.
- Abstract(参考訳): DNAメチル化の正確な計算的同定は、エピジェネティックな制御を理解するのに不可欠である。
深層学習はこの二項分類課題に優れているが、その「黒い箱」の性質は生物学的洞察を妨げている。
本稿では,機構にインスパイアされた信号浄化アルゴリズムとともに,高性能モデルMEDNA-DFMを導入することでこの問題に対処する。
本研究は、MEDNA-DFMが保存メチル化パターンを効果的に捕捉し、多様な種間で堅牢な区別を実現することを実証する。
外部の独立データセットの検証により、モデルの一般化は系統的近接性ではなく、保存された内在的モチーフ(例えばGC内容)によって駆動されることを確認した。
さらに,本アルゴリズムの適用により,従来の研究よりも信頼性の高いモチーフを抽出した。
最後に,ショウジョウバエ6mAのケーススタディから,GAGGコアモチーフと上流A-トラクション要素が協調的に機能することを示唆する「シーケンス構造相乗効果」仮説を提唱した。
さらにこの仮説をシリコ変異原性(silico mutagenesis)を用いて検証し,いずれかの要素のアブレーションがモデルの認識能力を著しく低下させることを確認した。
この研究はメチル化予測のための強力なツールを提供し、説明可能なディープラーニングが方法論的革新と生物学的仮説の生成の両方をいかに駆動するかを示す。
関連論文リスト
- MethConvTransformer: A Deep Learning Framework for Cross-Tissue Alzheimer's Disease Detection [4.931890971425293]
アルツハイマー病(英語: Alzheimer's disease, AD)は、多因子性神経変性疾患の一つで、進行性認知機能低下と脳の広範な機能低下を特徴とする。
MethConvTransformerはトランスフォーマーベースのディープラーニングフレームワークで、脳と末梢組織のDNAメチル化プロファイルを統合する。
論文 参考訳(メタデータ) (2026-01-01T00:18:33Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - BioReason: Incentivizing Multimodal Biological Reasoning within a DNA-LLM Model [12.528834366422466]
BioReasonは論理的、生物学的に一貫性のある還元物を生成することを学ぶ。
KEGGによる疾患経路予測の精度は86%から98%に向上する。
また、強いベースラインよりも平均15%の変動効果予測を改善する。
論文 参考訳(メタデータ) (2025-05-29T15:49:27Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - An interpretable generative multimodal neuroimaging-genomics framework for decoding Alzheimer's disease [13.213387075528017]
アルツハイマー病(英語: Alzheimer's disease, AD)は、認知機能障害(Mild Cognitive Impairment, MCI)として知られる前ドロマステージを含む認知症である。
この研究の目的は、マルチモーダルMRIデータと単一核化物多型に依存する脳構造と機能の構造的・機能的調節を捉えることである。
論文 参考訳(メタデータ) (2024-06-19T07:31:47Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - SemanticCAP: Chromatin Accessibility Prediction Enhanced by Features
Learning from a Language Model [3.0643865202019698]
本稿では、ゲノムのアクセス可能な領域を特定するためのSemanticCAPという新しいソリューションを提案する。
遺伝子配列のコンテキストをモデル化する遺伝子モデルを導入し、遺伝子配列の効果的な表現を提供する。
公開ベンチマークによる他のシステムと比較すると,我々のモデルは性能が向上することが判明した。
論文 参考訳(メタデータ) (2022-04-05T11:47:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。