論文の概要: A Scalable Trie Building Algorithm for High-Throughput Phyloanalysis of Wafer-Scale Digital Evolution Experiments
- arxiv url: http://arxiv.org/abs/2508.15074v1
- Date: Wed, 20 Aug 2025 21:18:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.098969
- Title: A Scalable Trie Building Algorithm for High-Throughput Phyloanalysis of Wafer-Scale Digital Evolution Experiments
- Title(参考訳): ウェーハスケールデジタル進化実験の高速フィロアナリシスのためのスケーラブルなトライビルディングアルゴリズム
- Authors: Vivaan Singhvi, Joey Wagner, Emily Dolson, Luis Zaman, Matthew Andres Moreno,
- Abstract要約: デジタル実験から得られた系譜の高解像度スナップショットは、進化可能性とオープンエンド進化の研究の鍵となる。
850,000プロセッサのCerebras Wafer-Scale Engine(WSE)など、AI/MLハードウェアアクセラレータデバイスの進歩は、進化的問題の範囲を広げようとしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent-based simulation platforms play a key role in enabling fast-to-run evolution experiments that can be precisely controlled and observed in detail. Availability of high-resolution snapshots of lineage ancestries from digital experiments, in particular, is key to investigations of evolvability and open-ended evolution, as well as in providing a validation testbed for bioinformatics method development. Ongoing advances in AI/ML hardware accelerator devices, such as the 850,000-processor Cerebras Wafer-Scale Engine (WSE), are poised to broaden the scope of evolutionary questions that can be investigated in silico. However, constraints in memory capacity and locality characteristic of these systems introduce difficulties in exhaustively tracking phylogenies at runtime. To overcome these challenges, recent work on hereditary stratigraphy algorithms has developed space-efficient genetic markers to facilitate fully decentralized estimation of relatedness among digital organisms. However, in existing work, compute time to reconstruct phylogenies from these genetic markers has proven a limiting factor in achieving large-scale phyloanalyses. Here, we detail an improved trie-building algorithm designed to produce reconstructions equivalent to existing approaches. For modestly-sized 10,000-tip trees, the proposed approach achieves a 300-fold speedup versus existing state-of-the-art. Finally, using 1 billion genome datasets drawn from WSE simulations encompassing 954 trillion replication events, we report a pair of large-scale phylogeny reconstruction trials, achieving end-to-end reconstruction times of 2.6 and 2.9 hours. In substantially improving reconstruction scaling and throughput, presented work establishes a key foundation to enable powerful high-throughput phyloanalysis techniques in large-scale digital evolution experiments.
- Abstract(参考訳): エージェントベースのシミュレーションプラットフォームは、精密に制御され、詳細に観察できる高速な進化実験を可能にする上で重要な役割を担っている。
特にデジタル実験から高精細な系譜のスナップショットが利用可能であることは、進化可能性やオープンエンド進化の研究、およびバイオインフォマティクス法開発のための検証ベッドを提供する上で重要である。
850,000プロセッサのCerebras Wafer-Scale Engine(WSE)など、AI/MLハードウェアアクセラレータデバイスで現在進行中の進歩は、シリコで調べられる進化的問題の範囲を広げようとしている。
しかしながら、これらのシステムのメモリ容量と局所性特性の制約は、実行時の系統の徹底的な追跡に困難をもたらす。
これらの課題を克服するために、最近の遺伝層序アルゴリズムの研究は、デジタル生物間の関係性を完全に分散した推定を容易にするために、空間効率のよい遺伝マーカーを開発した。
しかし、既存の研究では、これらの遺伝マーカーから系統を再構築する計算時間が、大規模な系統解析を達成するのに制限要因であることが証明されている。
本稿では,既存の手法に準ずる再構築を実現するために,改良されたトリエ構築アルゴリズムについて詳述する。
控えめな大きさの1万本の木に対して,提案手法は既存の最先端技術と比較して300倍の高速化を実現している。
最後に、954兆回の複製イベントを含むWSEシミュレーションから得られた10億のゲノムデータセットを用いて、大規模な系統復元試験を2回の報告し、エンドツーエンドの2.6時間と2.9時間の復元を達成した。
大規模なデジタル進化実験において,再構成のスケーリングとスループットを大幅に向上させることで,強力な高スループット系統解析技術を実現するための重要な基盤を確立する。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - A Guide to Tracking Phylogenies in Parallel and Distributed Agent-based Evolution Models [0.0]
エージェントベースモデルを用いたサイリコ研究では、シミュレートされたエージェント間の祖先関係の高品質な記録を収集する機会を提供する。
現存する研究は通常、系統を直接追跡し、進化史の正確な系統学的な記録を生み出している。
ポストホック推定は、生物情報学者が生物間の遺伝的類似性を評価することによって植物学を構築する方法に似ている。
論文 参考訳(メタデータ) (2024-05-16T15:27:51Z) - Trackable Island-model Genetic Algorithms at Wafer Scale [0.0]
本稿では,Cerebras Wafer-Scale Engine(WSE)ハードウェアのためのトラッキング対応非同期島型遺伝的アルゴリズム(GA)フレームワークを提案する。
系統的再構成を検証し,根底にある進化状態の推測に適合することを示す。
これらのベンチマークと検証試験は、高度にスケーラブルな進化計算の強い可能性を反映している。
論文 参考訳(メタデータ) (2024-05-06T16:17:33Z) - Trackable Agent-based Evolution Models at Wafer Scale [0.0]
我々は,85万プロセッサCerebras Wafer Scale Engine(WSE)のエージェントベース進化から系統情報を抽出する問題に焦点をあてる。
We present a asynchronous island-based genetic algorithm (GA) framework for WSE hardware。
本研究は,これらの治験の系統的再構成を検証し,根底にある進化状態の推測に適合することを示す。
論文 参考訳(メタデータ) (2024-04-16T19:24:14Z) - Phylogeny-informed fitness estimation [58.720142291102135]
本研究では, 住民の健康評価を推定するために, フィロジェニーを利用した適合度推定手法を提案する。
以上の結果から, 植物性インフォームドフィットネス推定は, ダウンサンプドレキシケースの欠点を軽減することが示唆された。
この研究は、ランタイム系統解析を利用して進化アルゴリズムを改善するための最初のステップとなる。
論文 参考訳(メタデータ) (2023-06-06T19:05:01Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。