論文の概要: GateKeeper-GPU: Fast and Accurate Pre-Alignment Filtering in Short Read
Mapping
- arxiv url: http://arxiv.org/abs/2103.14978v1
- Date: Sat, 27 Mar 2021 20:01:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:33:51.545660
- Title: GateKeeper-GPU: Fast and Accurate Pre-Alignment Filtering in Short Read
Mapping
- Title(参考訳): GateKeeper-GPU:ショートリードマッピングにおける高速かつ高精度な事前アライメントフィルタ
- Authors: Z\"ulal Bing\"ol, Mohammed Alser, Ozcan Ozturk, Can Alkan
- Abstract要約: GateKeeper-GPUはシーケンスアライメントのための高速で正確な事前調整フィルタである。
多数のGPUスレッドを使用して、多数のシーケンスペアを迅速かつ同時に検査します。
GateKeeper-GPUはシーケンスアライメントを最大2.9倍に高速化し、包括的な読み取りマッパーのエンドツーエンド実行時間に最大1.4倍のスピードアップを提供する。
- 参考スコア(独自算出の注目度): 0.2867517731896504
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At the last step of short read mapping, the candidate locations of the reads
on the reference genome are verified to compute their differences from the
corresponding reference segments using sequence alignment algorithms.
Calculating the similarities and differences between two sequences is still
computationally expensive since approximate string matching techniques
traditionally inherit dynamic programming algorithms with quadratic time and
space complexity. We introduce GateKeeper-GPU, a fast and accurate
pre-alignment filter that efficiently reduces the need for expensive sequence
alignment. GateKeeper-GPU provides two main contributions: first, improving the
filtering accuracy of GateKeeper(state-of-the-art lightweight pre-alignment
filter), second, exploiting the massive parallelism provided by the large
number of GPU threads of modern GPUs to examine numerous sequence pairs rapidly
and concurrently. GateKeeper-GPU accelerates the sequence alignment by up to
2.9x and provides up to 1.4x speedup to the end-to-end execution time of a
comprehensive read mapper (mrFAST). GateKeeper-GPU is available at
https://github.com/BilkentCompGen/GateKeeper-GPU
- Abstract(参考訳): ショートリードマッピングの最終段階において、参照ゲノム上の読み取りの候補位置を検証し、シーケンスアライメントアルゴリズムを用いて対応する参照セグメントとの差を計算する。
近似文字列マッチング技術は伝統的に2次時間と空間の複雑さを持つ動的プログラミングアルゴリズムを継承するので、2つのシーケンス間の類似性や相違の計算は依然として計算コストがかかる。
高速かつ高精度な事前調整フィルタであるgatekeeper-gpuを導入することで,コストのかかるシーケンスアライメントを効率的に削減できる。
第一に、gatekeeper(最先端の軽量事前調整フィルタ)のフィルタリング精度の向上、第二に、最新のgpuの多数のgpuスレッドが提供する大規模な並列性を利用して、多数のシーケンスペアを迅速かつ同時的に検査する。
GateKeeper-GPUはシーケンスアライメントを最大2.9倍に高速化し、包括的な読み取りマッパー(mrFAST)のエンドツーエンド実行時間に最大1.4倍のスピードアップを提供する。
GateKeeper-GPUはhttps://github.com/BilkentCompGen/GateKeeper-GPUで利用可能
関連論文リスト
- Implementation and Analysis of GPU Algorithms for Vecchia Approximation [0.8057006406834466]
Vecchia Approximationは計算複雑性を減らすために広く使われており、恥ずかしい並列アルゴリズムで計算することができる。
Vecchia Approximationのためにマルチコアソフトウェアが開発されたが、グラフィックス処理ユニット(GPU)上で動作するように設計されたソフトウェアは不足している。
我々の新しい手法は他の2つより優れており、GpGpU Rパッケージに表示されます。
論文 参考訳(メタデータ) (2024-07-03T01:24:44Z) - Minuet: Accelerating 3D Sparse Convolutions on GPUs [9.54287796030519]
スパース・コンボリューション(SC)は、本質的にスパースである3Dポイント・クラウドの処理に広く用いられている。
本研究では,従来の最先端のSCエンジンの欠点を分析し,最新のGPUに適した新しいメモリ効率のSCエンジンであるMinuetを提案する。
私たちの評価では、エンド・ツー・エンドのクラウド・ネットワークの実行に対して平均1.74時間(最大22.22時間)で、Minuetは以前のSCエンジンよりも大幅にパフォーマンスが向上している。
論文 参考訳(メタデータ) (2023-12-01T05:09:02Z) - High Performance Computing Applied to Logistic Regression: A CPU and GPU
Implementation Comparison [0.0]
汎用GPUによるロジスティック回帰(LR)の並列バージョンを提案する。
我々の実装は、X. Zouらによって提案された並列なグラディエントDescent Logistic Regressionアルゴリズムの直接変換である。
本手法は,画像認識,スパム検出,不正検出などのリアルタイム予測に特に有用である。
論文 参考訳(メタデータ) (2023-08-19T14:49:37Z) - PLSSVM: A (multi-)GPGPU-accelerated Least Squares Support Vector Machine [68.8204255655161]
Support Vector Machines (SVM) は機械学習で広く使われている。
しかし、現代的で最適化された実装でさえ、最先端ハードウェア上の大きな非自明な高密度データセットにはうまくスケールしない。
PLSSVMはLVMのドロップイン代替として使用できる。
論文 参考訳(メタデータ) (2022-02-25T13:24:23Z) - Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous
Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。
本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2021-10-13T20:58:15Z) - RTGPU: Real-Time GPU Scheduling of Hard Deadline Parallel Tasks with
Fine-Grain Utilization [5.02836935036198]
本論文では,複数のGPUアプリケーションの実行をリアルタイムにスケジュール可能なRTGPUを提案する。
提案手法は,従来の作業に比べてスケジューリング性に優れ,複数のGPUアプリケーションに厳しい期限をリアルタイムに保証する。
論文 参考訳(メタデータ) (2021-01-25T22:34:06Z) - GPU-Accelerated Primal Learning for Extremely Fast Large-Scale
Classification [10.66048003460524]
ロジスティック回帰や線形サポートベクターマシン(SVM)分類などのL2正規化原始問題を解く最も効率的な方法の1つは、広く使われている信頼領域ニュートンアルゴリズムであるTRONである。
我々は、GPU最適化の法則を用いて、異なる損失と特徴表現に対するTRONトレーニング時間を劇的に短縮できることを示した。
論文 参考訳(メタデータ) (2020-08-08T03:40:27Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical
Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。
驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文 参考訳(メタデータ) (2020-04-16T16:20:53Z) - Parallelising the Queries in Bucket Brigade Quantum RAM [69.43216268165402]
量子アルゴリズムは、しばしばデータベースのような方法で格納された情報にアクセスするために量子RAM(QRAM)を使用する。
本稿では,Clifford+Tゲートの並列性を利用して,効率的なクエリ時間を大幅に短縮する手法を提案する。
理論的には、フォールトトレラントバケットの量子RAMクエリは古典的なRAMの速度とほぼ一致する。
論文 参考訳(メタデータ) (2020-02-21T14:50:03Z) - Efficient Video Semantic Segmentation with Labels Propagation and
Refinement [138.55845680523908]
本稿では,ハイブリッドGPU/CPUを用いた高精細ビデオのリアルタイムセマンティックセマンティックセマンティック化の問題に取り組む。
i) CPU上では、非常に高速な光フロー法であり、ビデオの時間的側面を利用して、あるフレームから次のフレームへ意味情報を伝達するために使用される。
高解像度フレーム(2048 x 1024)を持つ一般的なCityscapesデータセットでは、単一のGPUとCPU上で80から1000Hzの動作ポイントが提案されている。
論文 参考訳(メタデータ) (2019-12-26T11:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。