論文の概要: OMB-Py: Python Micro-Benchmarks for Evaluating Performance of MPI
Libraries on HPC Systems
- arxiv url: http://arxiv.org/abs/2110.10659v1
- Date: Wed, 20 Oct 2021 16:59:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 16:27:01.404300
- Title: OMB-Py: Python Micro-Benchmarks for Evaluating Performance of MPI
Libraries on HPC Systems
- Title(参考訳): OMB-Py: HPCシステム上でのMPIライブラリの性能評価のためのPythonマイクロベンチマーク
- Authors: Nawras Alnaasan, Arpan Jain, Aamir Shafi, Hari Subramoni, and
Dhabaleswar K Panda
- Abstract要約: OMB-Pyは並列Pythonアプリケーションのための最初の通信ベンチマークスイートである。
OMB-Pyは様々なポイント・ツー・ポイントと集合的な通信ベンチマークテストから構成される。
逐次実行と比較して,224CPUコア上での最大106倍の高速化を報告した。
- 参考スコア(独自算出の注目度): 1.066106854070245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Python has become a dominant programming language for emerging areas like
Machine Learning (ML), Deep Learning (DL), and Data Science (DS). An attractive
feature of Python is that it provides easy-to-use programming interface while
allowing library developers to enhance performance of their applications by
harnessing the computing power offered by High Performance Computing (HPC)
platforms. Efficient communication is key to scaling applications on parallel
systems, which is typically enabled by the Message Passing Interface (MPI)
standard and compliant libraries on HPC hardware. mpi4py is a Python-based
communication library that provides an MPI-like interface for Python
applications allowing application developers to utilize parallel processing
elements including GPUs. However, there is currently no benchmark suite to
evaluate communication performance of mpi4py -- and Python MPI codes in general
-- on modern HPC systems. In order to bridge this gap, we propose OMB-Py --
Python extensions to the open-source OSU Micro-Benchmark (OMB) suite -- aimed
to evaluate communication performance of MPI-based parallel applications in
Python. To the best of our knowledge, OMB-Py is the first communication
benchmark suite for parallel Python applications. OMB-Py consists of a variety
of point-to-point and collective communication benchmark tests that are
implemented for a range of popular Python libraries including NumPy, CuPy,
Numba, and PyCUDA. We also provide Python implementation for several
distributed ML algorithms as benchmarks to understand the potential gain in
performance for ML/DL workloads. Our evaluation reveals that mpi4py introduces
a small overhead when compared to native MPI libraries. We also evaluate the
ML/DL workloads and report up to 106x speedup on 224 CPU cores compared to
sequential execution. We plan to publicly release OMB-Py to benefit Python HPC
community.
- Abstract(参考訳): Pythonは機械学習(ML)、ディープラーニング(DL)、データサイエンス(DS)といった新興分野において支配的なプログラミング言語となっている。
Pythonの魅力的な特徴は、ライブラリ開発者がハイパフォーマンスコンピューティング(HPC)プラットフォームが提供するコンピューティングパワーを利用することで、アプリケーションのパフォーマンスを向上させると同時に、使いやすいプログラミングインターフェイスを提供することである。
効率的な通信は並列システム上のアプリケーションのスケーリングの鍵であり、通常はMPI(Message Passing Interface)標準とHPCハードウェア上の準拠ライブラリによって実現される。
mpi4pyはPythonベースの通信ライブラリで、Pythonアプリケーション向けのMPIライクなインターフェースを提供する。
しかし、現在のHPCシステムでは、mpi4py -- およびPython MPIコード全般の通信性能を評価するベンチマークスイートは存在しない。
このギャップを埋めるため、我々はオープンソースのOSU Micro-Benchmark (OMB) スイートへのOMB-Py-Python拡張を提案し、PythonにおけるMPIベースの並列アプリケーションの通信性能を評価することを目的とした。
私たちの知る限りでは、OMB-Pyは並列Pythonアプリケーションのための最初の通信ベンチマークスイートです。
OMB-Pyは、NumPy、CuPy、Numba、PyCUDAなど、人気のあるPythonライブラリ向けに実装されている様々なポイントツーポイントおよび集合的な通信ベンチマークテストで構成されている。
また、ML/DLワークロードのパフォーマンス向上の可能性を理解するためのベンチマークとして、複数の分散MLアルゴリズムに対するPython実装も提供します。
評価の結果,mpi4pyはネイティブMPIライブラリに比べてオーバーヘッドが小さいことがわかった。
また、ml/dlワークロードを評価し、224cpuコアの最大106倍の高速化をシーケンシャル実行と比較した。
我々はPython HPCコミュニティに利益をもたらすため、OMB-Pyを一般公開する予定です。
関連論文リスト
- CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.7413285637879]
CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文 参考訳(メタデータ) (2024-08-23T11:43:00Z) - PyMarian: Fast Neural Machine Translation and Evaluation in Python [11.291502854418098]
シーケンス・ツー・シーケンス・モデルのための C++ ベースのトレーニングおよび推論ツールキットである Marian NMT に Python インタフェースを記述した。
このインターフェースにより、Marianでトレーニングされたモデルが、Pythonで利用可能なリッチで幅広いツールに接続できるようになる。
論文 参考訳(メタデータ) (2024-08-15T01:41:21Z) - DyPyBench: A Benchmark of Executable Python Software [18.129031749321058]
我々は、Pythonプロジェクトの最初のベンチマークであるDyPyBenchを紹介します。
ベンチマークには、さまざまなアプリケーションドメインから50の人気のあるオープンソースプロジェクトが含まれており、合計681万行のPythonコードと30万のテストケースが含まれている。
我々は、DyPyBenchが他の動的解析の基礎を提供し、Pythonコードの実行時の振る舞いを研究することを想定する。
論文 参考訳(メタデータ) (2024-03-01T13:53:15Z) - Advising OpenMP Parallelization via a Graph-Based Approach with
Transformers [2.393682571484038]
我々は,OpenMPのプラグマと共有メモリ属性を並列コードで検出し,予測する,OMPifyと呼ばれる新しい手法を提案する。
OMPifyは、ソースコードのグラフベースの表現を利用するTransformerベースのモデルに基づいている。
以上の結果から,OMPifyは汎用および人気の高いChatGPTやPragFormerモデルなど,既存のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-16T16:56:10Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - QParallel: Explicit Parallelism for Programming Quantum Computers [62.10004571940546]
並列量子プログラミングのための言語拡張を提案する。
QParallelは、現在の量子プログラミング言語における並列性に関する曖昧さを取り除く。
並列化によって最も利益を上げるサブルーチンを識別し,並列領域の配置にプログラマを誘導するツールを提案する。
論文 参考訳(メタデータ) (2022-10-07T16:35:16Z) - Scikit-dimension: a Python package for intrinsic dimension estimation [58.8599521537]
この技術ノートは、固有次元推定のためのオープンソースのPythonパッケージであるtextttscikit-dimensionを紹介している。
textttscikit-dimensionパッケージは、Scikit-learnアプリケーションプログラミングインターフェイスに基づいて、既知のID推定子のほとんどを均一に実装する。
パッケージを簡潔に記述し、実生活と合成データにおけるID推定手法の大規模(500以上のデータセット)ベンチマークでその使用を実証する。
論文 参考訳(メタデータ) (2021-09-06T16:46:38Z) - Extending Python for Quantum-Classical Computing via Quantum
Just-in-Time Compilation [78.8942067357231]
Pythonは、その柔軟性、ユーザビリティ、可読性、開発者の生産性を重視することで有名な人気のあるプログラミング言語です。
量子ジャスト・イン・タイム・コンパイルのための堅牢なC++インフラストラクチャを通じて、異種量子古典計算を可能にするPythonの言語拡張を提案する。
論文 参考訳(メタデータ) (2021-05-10T21:11:21Z) - Python Workflows on HPC Systems [2.1485350418225244]
計算集約型機械学習とデータ分析手法の最近の成功と広範な応用により、HPCシステムにおけるPythonプログラミング言語の使用が促進されている。
Pythonはユーザに対して多くの利点を提供しているが、マルチユーザ環境や並列プログラミングに重点を置いて設計されていない。
本稿では,HPCクラスタ上でのPythonの使用によって引き起こされる重要な問題を分析し,適切な回避策をスケッチする。
論文 参考訳(メタデータ) (2020-12-01T09:51:12Z) - OPFython: A Python-Inspired Optimum-Path Forest Classifier [68.8204255655161]
本稿では,OPFythonと表記されるPythonベースのOptimum-Path Forestフレームワークを提案する。
OPFythonはPythonベースのライブラリなので、C言語よりもフレンドリーな環境とプロトタイピングの作業スペースを提供する。
論文 参考訳(メタデータ) (2020-01-28T15:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。