論文の概要: AttnGen: Attention-Guided Saliency Learning for Interpretable Genomic Sequence Classification
- arxiv url: http://arxiv.org/abs/2605.14073v1
- Date: Wed, 13 May 2026 19:49:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.487373
- Title: AttnGen: Attention-Guided Saliency Learning for Interpretable Genomic Sequence Classification
- Title(参考訳): AttnGen:解釈可能なゲノム配列分類のための注意誘導型サリエンシ学習
- Authors: Rayhaneh Shabani Nia, Ali Karkehabadi,
- Abstract要約: 我々は、最適化プロセスに解釈可能性を直接組み込む、注意誘導型トレーニングフレームワークであるAttnGenを紹介します。
AttnGenは、注意機構を使用してヌクレオチドレベルの重要度を計算し、トレーニング中の低コントリビューション位置を徐々に抑制する。
適度なマスキングでは、AttnGenは96.73%の検証精度を達成し、95.83%の精度で従来のCNNベースラインを上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks have achieved strong performance in genomic sequence classification; however, relating their predictions to biologically meaningful sequence patterns remains challenging. In this work, we present AttnGen, an attention-guided training framework that embeds interpretability directly into the optimization process. AttnGen computes nucleotide-level importance scores using an attention mechanism and progressively suppresses low-contribution positions during training. This encourages the model to focus its predictions on a compact set of informative regions while reducing reliance on noisy sequence elements. We evaluate AttnGen on the standardized demo_human_or_worm benchmark, a binary classification task over 200-nucleotide sequences. With moderate masking, AttnGen achieves a validation accuracy of 96.73%, outperforming a conventional CNN baseline with 95.83% accuracy, while also exhibiting faster convergence and improved training stability. To assess whether the learned importance scores reflect functionally relevant signal, we conduct perturbation-based analysis by removing high-saliency nucleotides. This causes accuracy to drop from 96.9% to near chance level on a 3,000-sequence evaluation set, indicating that the model relies on a relatively small subset of informative positions. Our analysis shows that masking 10--20% of positions provides the most favorable trade-off between predictive performance and interpretability. These results suggest that attention-guided masking not only improves classification performance but also reshapes how models distribute importance across sequence positions. Although this study focuses on short genomic sequences, the proposed approach may extend to more complex interpretable sequence modeling settings.
- Abstract(参考訳): 深層ニューラルネットワークはゲノム配列分類において強い性能を保っているが、それらの予測を生物学的に意味のある配列パターンに関連付けることは依然として困難である。
本稿では、最適化プロセスに解釈可能性を直接組み込む、注意誘導型トレーニングフレームワークであるAttnGenを紹介する。
AttnGenは、注意機構を使用してヌクレオチドレベルの重要スコアを計算し、トレーニング中の低コントリビューション位置を徐々に抑制する。
これにより、モデルは、ノイズのあるシーケンス要素への依存を減らしながら、その予測を情報領域のコンパクトな集合に焦点を合わせることができる。
我々は,200個のヌクレオチド配列のバイナリ分類タスクである demo_human_or_worm ベンチマークで AttnGen を評価する。
適度なマスキングにより、AttnGenは96.73%の検証精度を達成し、従来のCNNベースラインを95.83%の精度で上回った。
得られた重要度スコアが機能的に関連したシグナルを反映するかどうかを評価するため,高濃度ヌクレオチドを除去して摂動解析を行う。
これにより、3000列の評価セットで96.9%からほぼチャンスレベルまで精度が低下し、このモデルが情報的位置の比較的小さなサブセットに依存していることを示す。
分析の結果,10~20%の位置をマスキングすることで,予測性能と解釈可能性のトレードオフが最も良好であることがわかった。
これらの結果から,注意誘導マスキングは分類性能を向上するだけでなく,モデルが配列位置間で重要度を分配する方法を再検討すると考えられる。
本研究は、短いゲノム配列に焦点をあてるが、提案手法はより複雑な解釈可能な配列モデリング設定にまで拡張される可能性がある。
関連論文リスト
- Hierarchical Bayesian Flow Networks for Molecular Graph Generation [15.495256638671284]
GraphBFNは、分布のパラメータに基づいて動作するベイズフローネットワークに基づく、新しい階層的な粗大きめのフレームワークである。
提案手法は,QM9およびZINC250k分子グラフ生成ベンチマーク上で,新しい最先端結果を設定することにより,優れた性能と高速な生成を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-11T13:27:55Z) - Context-Aware Regularization with Markovian Integration for Attention-Based Nucleotide Analysis [0.2718525106069543]
自己回帰変換器は、固定長のコンテキストウィンドウに頼ってマルコフの振る舞いを示す。
CARMANIAは、NT予測を遷移行列(TM)損失で強化する自己教師型事前学習フレームワークである。
TM損失は、予測トークン遷移を、各入力シーケンスから経験的に導出されたn-gram統計と整合させ、局所的なコンテキストを超えた高次依存関係を捕捉するようモデルに促す。
論文 参考訳(メタデータ) (2025-07-12T19:03:28Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Toward Understanding BERT-Like Pre-Training for DNA Foundation Models [78.48760388079523]
既存のDNA配列の事前訓練方法は、NLPからのBERT事前訓練の直接的な採用に依存している。
マスク境界を連続的に拡張することにより,BERTライクな事前学習作業の難易度を徐々に向上させるRandomMaskという新しい手法を提案する。
RandomMaskは、マシューのエピジェネティック・マーク・予測の相関係数の68.16%を突破し、ベースラインの19.85%を突破した。
論文 参考訳(メタデータ) (2023-10-11T16:40:57Z) - A Neural Collapse Perspective on Feature Evolution in Graph Neural
Networks [44.31777384413466]
グラフニューラルネットワーク(GNN)は、グラフ構造化データの分類タスクでますます人気が高まっている。
本稿では,ノードワイズ分類に着目し,ニューラル崩壊現象のレンズによる特徴進化を考察する。
我々は、「最適」な数学的モデルでさえ、グラフが正確な崩壊を伴う最小値を持つためには厳密な構造条件に従う必要があることを示した。
論文 参考訳(メタデータ) (2023-07-04T23:03:21Z) - Benign Overfitting in Deep Neural Networks under Lazy Training [72.28294823115502]
データ分布が適切に分離された場合、DNNは分類のためのベイズ最適テスト誤差を達成できることを示す。
よりスムーズな関数との補間により、より一般化できることを示す。
論文 参考訳(メタデータ) (2023-05-30T19:37:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。