論文の概要: Explainable AI in Genomics: Transcription Factor Binding Site Prediction with Mixture of Experts
- arxiv url: http://arxiv.org/abs/2507.09754v2
- Date: Fri, 18 Jul 2025 13:26:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 12:36:33.493598
- Title: Explainable AI in Genomics: Transcription Factor Binding Site Prediction with Mixture of Experts
- Title(参考訳): ゲノミクスにおける説明可能なAI:専門家の混在による転写因子結合サイト予測
- Authors: Aakash Tripathi, Ian E. Nielsen, Muhammad Umer, Ravi P. Ramachandran, Ghulam Rasool,
- Abstract要約: 本研究では,TFBS予測のための新しいMixture of Experts(MoE)手法を提案する。
分布内および分布外の両方のデータセットを用いて,各専門家モデルに対するMoEモデルの性能を評価する。
また、より堅牢なモデル解釈性を提供する新しい属性マッピング技術であるShiftSmoothを紹介します。
- 参考スコア(独自算出の注目度): 1.2063443893298391
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Transcription Factor Binding Site (TFBS) prediction is crucial for understanding gene regulation and various biological processes. This study introduces a novel Mixture of Experts (MoE) approach for TFBS prediction, integrating multiple pre-trained Convolutional Neural Network (CNN) models, each specializing in different TFBS patterns. We evaluate the performance of our MoE model against individual expert models on both in-distribution and out-of-distribution (OOD) datasets, using six randomly selected transcription factors (TFs) for OOD testing. Our results demonstrate that the MoE model achieves competitive or superior performance across diverse TF binding sites, particularly excelling in OOD scenarios. The Analysis of Variance (ANOVA) statistical test confirms the significance of these performance differences. Additionally, we introduce ShiftSmooth, a novel attribution mapping technique that provides more robust model interpretability by considering small shifts in input sequences. Through comprehensive explainability analysis, we show that ShiftSmooth offers superior attribution for motif discovery and localization compared to traditional Vanilla Gradient methods. Our work presents an efficient, generalizable, and interpretable solution for TFBS prediction, potentially enabling new discoveries in genome biology and advancing our understanding of transcriptional regulation.
- Abstract(参考訳): 転写因子結合部位(TFBS)の予測は、遺伝子の制御や様々な生物学的プロセスを理解するために重要である。
本研究では、TFBS予測のための新しいMixture of Experts(MoE)アプローチを導入し、複数の事前学習された畳み込みニューラルネットワーク(CNN)モデルを統合し、それぞれ異なるTFBSパターンを専門とする。
OOD試験に6つのランダム選択転写因子 (TF) を用いて, 分布内および分布外の両方のデータセット上での個々の専門家モデルに対するMoEモデルの性能評価を行った。
この結果から,MoEモデルは様々なTFバインディングサイトにおいて,特にOODシナリオにおいて優れた競合性や優れた性能を達成できることが示唆された。
ANOVA(Analytic of Variance)統計テストでは,これらの性能差の重要性が確認されている。
さらに、入力シーケンスの小さなシフトを考慮し、より堅牢なモデル解釈性を提供する、新しい属性マッピング手法であるShiftSmoothを導入する。
包括的説明可能性分析により,ShiftSmoothは従来のVanilla Gradient法と比較してモチーフ発見と局所化に優れた帰属性を示すことを示す。
我々の研究は、TFBS予測のための効率的で一般化可能で解釈可能なソリューションを示し、ゲノム生物学の新しい発見を可能にし、転写調節の理解を深める可能性がある。
関連論文リスト
- Counterfactual Explanations in Medical Imaging: Exploring SPN-Guided Latent Space Manipulation [2.9810923705287524]
医用画像解析において、深層学習モデルは顕著な性能を示した。
可変オートエンコーダ(VAE)のような深い生成モデルは、大きな生成能力を示す。
和積ネットワーク(SPN)のような確率モデルは、複雑な結合確率分布を効率的に表す。
論文 参考訳(メタデータ) (2025-07-25T15:19:32Z) - Detecting and Pruning Prominent but Detrimental Neurons in Large Language Models [68.57424628540907]
大規模言語モデル(LLM)は、しばしば特定のデータセットに特化した学習メカニズムを開発する。
本稿では,データセット固有のメカニズムに関連するニューロンの同定と解析により,一般化の促進を目的とした微調整手法を提案する。
本手法では,各ニューロンの高信頼度予測への影響を定量化するため,データセット固有の性能に不均等に寄与するニューロンを同定する。
論文 参考訳(メタデータ) (2025-07-12T08:10:10Z) - Hierarchical Sparse Bayesian Multitask Model with Scalable Inference for Microbiome Analysis [1.361248247831476]
本稿では,一般的なマルチタスク二元分類学習問題に適用可能な階層型ベイズ的マルチタスク学習モデルを提案する。
後方分布を近似するために,変分推定に基づく計算効率の良い推論アルゴリズムを導出する。
各種合成データセットに対する新しいアプローチの可能性を示し, マイクロバイオームプロファイルに基づくヒトの健康状態の予測を行う。
論文 参考訳(メタデータ) (2025-02-04T18:23:22Z) - Improving Network Interpretability via Explanation Consistency Evaluation [56.14036428778861]
本稿では、より説明可能なアクティベーションヒートマップを取得し、同時にモデル性能を向上させるフレームワークを提案する。
具体的には、モデル学習において、トレーニングサンプルを適応的に重み付けするために、新しいメトリクス、すなわち説明整合性を導入する。
そこで,本フレームワークは,これらのトレーニングサンプルに深い注意を払ってモデル学習を促進する。
論文 参考訳(メタデータ) (2024-08-08T17:20:08Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Modelling Cellular Perturbations with the Sparse Additive Mechanism
Shift Variational Autoencoder [6.352775857356592]
摂動モデルに対する合成性, 絡み合い, 解釈性を組み合わせたスパース加算機構シフト変分自動符号化器SAMS-VAEを提案する。
SAMS-VAEは、潜伏サンプルの潜伏状態を、潜伏介入効果のサンプル特異な変動と疎大なグローバル変数を捉えた局所潜伏変数の和としてモデル化する。
2つの一般的な単一セルシークエンシングデータセットを用いて,SAMS-VAEを定性的に評価した。
論文 参考訳(メタデータ) (2023-11-05T23:37:31Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - PheME: A deep ensemble framework for improving phenotype prediction from
multi-modal data [42.56953523499849]
PheMEは, 構造化EHRのマルチモーダルデータを用いたアンサンブル・フレームワークであり, 非構造化臨床ノートを用いて, 正確なフェノタイプ予測を行う。
我々はアンサンブル学習を活用し、単一モーダルモデルと多モーダルモデルからの出力を組み合わせて表現型予測を改善する。
論文 参考訳(メタデータ) (2023-03-19T23:41:04Z) - Bayesian Additive Main Effects and Multiplicative Interaction Models
using Tensor Regression for Multi-environmental Trials [0.0]
本稿では,複数の因子が表現型予測に与える影響を考慮したベイズテンソル回帰モデルを提案する。
我々は、モデルのパラメータ間で生じる可能性のある識別可能性の問題を解決するための、事前分布のセットを採用する。
我々は2010年から2019年までのアイルランドにおける小麦生産に関する実世界のデータを分析して、我々のモデルの適用性を探る。
論文 参考訳(メタデータ) (2023-01-09T19:54:50Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。