論文の概要: TorchGWAS : GPU-accelerated GWAS for thousands of quantitative phenotypes
- arxiv url: http://arxiv.org/abs/2604.21095v1
- Date: Wed, 22 Apr 2026 21:31:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.184327
- Title: TorchGWAS : GPU-accelerated GWAS for thousands of quantitative phenotypes
- Title(参考訳): TorchGWAS : 数千の定量的表現型のためのGPU加速型GWAS
- Authors: Xingzhong Zhao, Ziqian Xie, Islam, Sheikh Muhammad Saiful, Tian Xia, Chen, Cheng, Degui Zhi,
- Abstract要約: 本稿では,ハードウェアアクセラレーションによる大規模表現型パネルの協調テストフレームワークTorchGWASを提案する。
TorchGWASは1つのNVIDIA A100 GPU上で10分で2,048の表現型と20,480の表現型を20分で完了した。
- 参考スコア(独自算出の注目度): 19.657916421435107
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Motivation: Modern bioinformatics workflows, particularly in imaging and representation learning, can generate thousands to tens of thousands of quantitative phenotypes from a single cohort. In such settings, running genome-wide association analyses trait by trait rapidly becomes a computational bottleneck. While established GWAS tools are highly effective for individual traits, they are not optimized for phenotype-rich screening workflows in which the same genotype matrix is reused across a large phenotype panel. Results: We present TorchGWAS, a framework for high-throughput association testing of large phenotype panels through hardware acceleration. The current public release provides stable Python and command-line workflows for linear GWAS and multivariate phenotype screening, supports NumPy, PLINK, and BGEN genotype inputs, aligns phenotype and covariate tables by sample identifier, and performs covariate adjustment internally. In a benchmark with 8.9 million markers and 23,000 samples, fastGWA required approximately 100 second per phenotype on an AMD EPYC 7763 64-core CPU, whereas TorchGWAS completed 2,048 phenotypes in 10 minute and 20,480 phenotypes in 20 minutes on a single NVIDIA A100 GPU, corresponding to an approximately 300- to 1700-fold increase in phenotype throughput. TorchGWAS therefore makes large-scale GWAS screening practical in phenotype-rich settings where thousands of quantitative traits must be evaluated efficiently. Availability and implementation: TorchGWAS is implemented in Python and distributed as a documented source repository at https://github.com/ZhiGroup/TorchGWAS. The current release provides a command-line interface, packaged source code, tutorials, benchmark scripts, and example workflows.
- Abstract(参考訳): モチベーション: 現代のバイオインフォマティクスのワークフロー、特にイメージングと表現学習は、単一のコホートから数千から数万の量的表現型を生成することができる。
このような環境では、形質によるゲノムワイド関連解析特性の実行が急速に計算ボトルネックとなる。
確立されたGWASツールは個々の特性に対して非常に効果的であるが、同じ遺伝子型マトリックスが大きな表現型パネルで再利用される表現型豊富なスクリーニングワークフローには最適化されていない。
結果: ハードウェアアクセラレーションによる大規模表現型パネルの高スループットアソシエーションテストのためのTorchGWASを提案する。
現在のパブリックリリースは、線形GWASと多変量表現型スクリーニングのための安定したPythonとコマンドラインワークフローを提供し、NumPy、PLINK、BGENジェノタイプ入力をサポートし、サンプル識別子で表現型と共変量テーブルを調整し、内部で共変量調整を行う。
890万のマーカーと23,000のサンプルを持つベンチマークでは、fastGWAはAMD EPYC 7763 64コアCPUで約100秒、TorchGWASは10分で2,048の表現型を完了し、20,480の表現型を1つのNVIDIA A100 GPUで20分で完了した。
したがって、TorchGWASは、数千の量的特性を効率的に評価しなければならない表現型リッチな環境で、大規模なGWASスクリーニングを実践する。
可用性と実装: TorchGWASはPythonで実装され、https://github.com/ZhiGroup/TorchGWASでドキュメント化されたソースリポジトリとして配布されている。
現在のリリースでは、コマンドラインインターフェース、パッケージ化されたソースコード、チュートリアル、ベンチマークスクリプト、サンプルワークフローが提供されている。
関連論文リスト
- Diffusion-Based Cross-Modal Feature Extraction for Multi-Label Classification [7.9670666100347765]
textitDiff-Featは、画像とテキストのための事前訓練された拡散変換器モデルから中間的特徴を抽出するフレームワークである。
我々は,視覚タスクにおいて,拡散過程に沿った最も識別性の高い中間特徴が中間ステップで発生し,トランスフォーマーの中間ブロックに位置することを観察した。
言語タスクでは、最高の機能はノイズのないステップで発生し、最も深いブロックに位置する。
論文 参考訳(メタデータ) (2025-09-19T03:13:58Z) - STEP: A Unified Spiking Transformer Evaluation Platform for Fair and Reproducible Benchmarking [5.660272448194108]
スパイキングトランスフォーマーは、スパイキングニューラルネットワークの効率と自己注意の表現力を組み合わせるための有望なアーキテクチャとして登場した。
分類,セグメンテーション,検出など,幅広いタスクをサポートするスパイキングトランスフォーマー用の統一ベンチマークフレームワークを提案する。
本研究では, スパイク空間, ビット幅, メモリアクセスを考慮したエネルギー推定モデルを提案する。
論文 参考訳(メタデータ) (2025-05-16T11:50:14Z) - Systems and Algorithms for Convolutional Multi-Hybrid Language Models at Scale [68.6602625868888]
本稿では,2つの簡単な観測に基づいて,畳み込み型マルチハイブリッドアーキテクチャを提案する。
ハイブリッドモデルのオペレータは、インコンテキストリコール、マルチトークンリコール、圧縮などのトークン操作タスクにカスタマイズできる。
我々は、最適化されたトランスフォーマーの1.2倍から2.9倍、以前の世代のハイブリッドの1.1倍から1.4倍の速さでエンドツーエンドを訓練する。
論文 参考訳(メタデータ) (2025-02-25T19:47:20Z) - G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - Fast Polypharmacy Side Effect Prediction Using Tensor Factorisation [2.631060597686179]
テンソル因子化モデルにより,多剤副作用予測における最先端性能が達成できることを実証する。
ベストモデル (SimplE) は, 963側効果に対して0.978 AUROC, 0.971 AUPRC, 1.000 AP@50の中央値を得た。
論文 参考訳(メタデータ) (2024-04-17T13:32:05Z) - Tackling the dimensions in imaging genetics with CLUB-PLS [4.829285448503734]
Cluster-Bootstrap PLS (CLUB-PLS) は、両方のドメインで単一入力機能に対して堅牢な統計を提供する。
CLUB-PLSは、英国バイオバンクの被験者33,000名を対象に、表面積と皮質厚の遺伝的基盤を調査した。
論文 参考訳(メタデータ) (2023-09-13T23:27:45Z) - Could Giant Pretrained Image Models Extract Universal Representations? [94.97056702288317]
本稿では,多種多様なコンピュータビジョンタスクに適用した凍結事前学習モデルについて述べる。
私たちの研究は、この凍結した設定にどのような事前学習タスクが最適か、凍結した設定を様々な下流タスクに柔軟にする方法、より大きなモデルサイズの影響について、質問に答えています。
論文 参考訳(メタデータ) (2022-11-03T17:57:10Z) - Accelerating Training and Inference of Graph Neural Networks with Fast
Sampling and Pipelining [58.10436813430554]
グラフニューラルネットワーク(GNN)のミニバッチトレーニングには、多くの計算とデータ移動が必要である。
我々は,分散マルチGPU環境において,近傍サンプリングを用いたミニバッチトレーニングを行うことを支持する。
本稿では,これらのボトルネックを緩和する一連の改良点について述べる。
また,サンプリングによる推論を支援する実験分析を行い,試験精度が実質的に損なわれていないことを示す。
論文 参考訳(メタデータ) (2021-10-16T02:41:35Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。