論文の概要: AGNES: Adaptive Graph Neural Network and Dynamic Programming Hybrid Framework for Real-Time Nanopore Seed Chaining
- arxiv url: http://arxiv.org/abs/2510.16013v1
- Date: Wed, 15 Oct 2025 08:05:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.771306
- Title: AGNES: Adaptive Graph Neural Network and Dynamic Programming Hybrid Framework for Real-Time Nanopore Seed Chaining
- Title(参考訳): AGNES: リアルタイムナノ孔シードチェインのための適応型グラフニューラルネットワークと動的プログラミングハイブリッドフレームワーク
- Authors: Jahidul Arafat, Sanjaya Poudel, Fariha Tasmin, Md Kaosar Uddin, Eftakhar Ahmed Arnob,
- Abstract要約: ナノ孔シークエンシングにより、リアルタイムの長読DNAシークエンシングが可能で、読み取りは10キロ塩基を超える。
12~15パーセントの固有エラー率は、リードアライメントにおいて重要な計算上の課題を提示する。
本稿では,グラフニューラルネットワークと古典動的プログラミングを組み合わせた適応型シードチェインのためのハイブリッドフレームワークRawHash3を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nanopore sequencing enables real-time long-read DNA sequencing with reads exceeding 10 kilobases, but inherent error rates of 12-15 percent present significant computational challenges for read alignment. The critical seed chaining step must connect exact k-mer matches between reads and reference genomes while filtering spurious matches, yet state-of-the-art methods rely on fixed gap penalty functions unable to adapt to varying genomic contexts including tandem repeats and structural variants. This paper presents RawHash3, a hybrid framework combining graph neural networks with classical dynamic programming for adaptive seed chaining that maintains real-time performance while providing statistical guarantees. We formalize seed chaining as graph learning where seeds constitute nodes with 12-dimensional feature vectors and edges encode 8-dimensional spatial relationships including gap consistency. Our architecture employs three-layer EdgeConv GNN with confidence-based method selection that dynamically switches between learned guidance and algorithmic fallback. Comprehensive evaluation on 1,000 synthetic nanopore reads with 5,200 test seeds demonstrates RawHash3 achieves 99.94 percent precision and 40.07 percent recall, representing statistically significant 25.0 percent relative improvement over baseline with p less than 0.001. The system maintains median inference latency of 1.59ms meeting real-time constraints, while demonstrating superior robustness with 100 percent success rate under 20 percent label corruption versus baseline degradation to 30.3 percent. Cross-validation confirms stability establishing graph neural networks as viable approach for production genomics pipelines.
- Abstract(参考訳): ナノ孔シークエンシングは、読み取りが10キロ塩基を超えるリアルタイムの長いDNAシークエンシングを可能にするが、本質的なエラー率12~15%は、読み取りアライメントに重要な計算上の課題を示している。
重要な種連鎖のステップは、読みと参照ゲノム間の正確なk-merマッチを繋ぎ、急激な一致をフィルタリングする一方で、最先端の手法は、タンデムリピートや構造的変異を含む様々なゲノムコンテキストに適応できない固定されたギャップペナルティ関数に依存している。
本稿では,グラフニューラルネットワークと古典動的プログラミングを組み合わせたハイブリッドフレームワークRawHash3を提案する。
種連鎖をグラフ学習として定式化し,12次元特徴ベクトルを持つノードとエッジがギャップ一貫性を含む8次元空間関係を符号化する。
本アーキテクチャでは,学習指導とアルゴリズムのフォールバックを動的に切り替える信頼度に基づく3層EdgeConv GNNを採用している。
5,200個の試験種を含む1,000個の合成ナノ孔読み取りに関する総合的な評価は、RawHash3が99.94パーセントの精度と40.07パーセントのリコールを達成し、0.001未満のベースラインに対する25.0パーセントの相対的な改善が統計的に有意であることを示している。
このシステムは、リアルタイムの制約を満たす1.59msの中央値の推論遅延を維持し、20%のラベル破損率と30.3%のベースライン劣化率で100%の成功率で優れたロバスト性を示す。
クロスバリデーションは、生産ゲノミクスパイプラインの実行可能なアプローチとしてグラフニューラルネットワークを確立する安定性を確認する。
関連論文リスト
- Neural Conformal Control for Time Series Forecasting [54.96087475179419]
非定常環境における適応性を高める時系列のニューラルネットワーク共形予測手法を提案する。
提案手法は,ニューラルネットワークエンコーダを用いた補助的マルチビューデータを活用することにより,望ましい対象範囲を達成するために設計されたニューラルネットワークコントローラとして機能する。
予測間隔の整合性に優れたキャリブレーションを組み合わさった手法は, 適用範囲と確率的精度の大幅な向上を実証的に示す。
論文 参考訳(メタデータ) (2024-12-24T03:56:25Z) - PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [6.2921559513184695]
本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文 参考訳(メタデータ) (2024-05-20T17:06:24Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Continual Spatio-Temporal Graph Convolutional Networks [87.86552250152872]
時空間グラフ畳み込みニューラルネットワークを連続推論ネットワークとして再構成する。
オンライン推論において、最大109倍の時間複雑性、26倍のハードウェアアクセラレーション、最大割り当てメモリの最大52%の削減を観測した。
論文 参考訳(メタデータ) (2022-03-21T14:23:18Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。