論文の概要: Accelerated Quality-Diversity for Robotics through Massive Parallelism
- arxiv url: http://arxiv.org/abs/2202.01258v1
- Date: Wed, 2 Feb 2022 19:44:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-04 13:50:29.959290
- Title: Accelerated Quality-Diversity for Robotics through Massive Parallelism
- Title(参考訳): 大規模並列処理によるロボットの品質変化の加速
- Authors: Bryan Lim, Maxime Allard, Luca Grillotti, Antoine Cully
- Abstract要約: 政策評価はすでにQDアルゴリズムの高速化に並行して行われているが、単一のマシンでしか機能しない。
最近のアクセラレーター上で動作するシミュレータの進歩により、単一のGPU/TPU上で数千の評価を並列に行うことができる。
QDアルゴリズムは理想的な候補であり,対話型時間スケールで大規模並列処理を実行できることを示す。
- 参考スコア(独自算出の注目度): 4.260312058817663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quality-Diversity (QD) algorithms are a well-known approach to generate large
collections of diverse and high-quality policies. However, QD algorithms are
also known to be data-inefficient, requiring large amounts of computational
resources and are slow when used in practice for robotics tasks. Policy
evaluations are already commonly performed in parallel to speed up QD
algorithms but have limited capabilities on a single machine as most physics
simulators run on CPUs. With recent advances in simulators that run on
accelerators, thousands of evaluations can performed in parallel on single
GPU/TPU. In this paper, we present QDax, an implementation of MAP-Elites which
leverages massive parallelism on accelerators to make QD algorithms more
accessible. We first demonstrate the improvements on the number of evaluations
per second that parallelism using accelerated simulators can offer. More
importantly, we show that QD algorithms are ideal candidates and can scale with
massive parallelism to be run at interactive timescales. The increase in
parallelism does not significantly affect the performance of QD algorithms,
while reducing experiment runtimes by two factors of magnitudes, turning days
of computation into minutes. These results show that QD can now benefit from
hardware acceleration, which contributed significantly to the bloom of deep
learning.
- Abstract(参考訳): 品質多様性(QD)アルゴリズムは、多種多様な高品質なポリシーを大量に集めるためのよく知られたアプローチである。
しかし、QDアルゴリズムはデータ非効率であることが知られており、大量の計算資源が必要であり、実際にロボット工学のタスクに使用されると遅くなる。
ポリシー評価はすでにQDアルゴリズムの高速化に並行して実施されているが、ほとんどの物理シミュレータがCPU上で動作するため、単一のマシンでしか機能しない。
最近のアクセラレーター上で動作するシミュレータの進歩により、単一のGPU/TPU上で数千の評価を並列に行うことができる。
本稿では,加速器の大規模並列性を利用してqdアルゴリズムをより使いやすくするmap-elitesの実装であるqdaxを提案する。
まず,加速シミュレータによる並列化による1秒あたりの評価数の改善について述べる。
さらに重要なことは、QDアルゴリズムが理想的な候補であり、対話的な時間スケールで大規模並列性でスケールできることである。
並列性の増加はQDアルゴリズムの性能に大きく影響しないが、実験の実行時間を2つの要因で削減し、計算時間を数分に短縮する。
これらの結果から,QDはハードウェアアクセラレーションの恩恵を受けることができ,ディープラーニングの普及に大きく寄与した。
関連論文リスト
- Lazy Qubit Reordering for Accelerating Parallel State-Vector-based Quantum Circuit Simulation [0.0]
量子回路シミュレーションのための2つの量子演算スケジューリング手法を提案する。
提案手法は、qubitリオーダーによる全対全通信を削減する。
本稿では,変分量子固有解法(VQE)シミュレーションにおける2つの主要な手順に適したこれらの手法を開発した。
論文 参考訳(メタデータ) (2024-10-05T18:20:37Z) - Benchmarking Edge AI Platforms for High-Performance ML Inference [0.0]
エッジコンピューティングは、通信遅延を減らし、リアルタイム処理を可能にする能力から、高性能で異質なSystem-on-Chipソリューションの興隆を促進している。
現在のアプローチでは、現代的なハードウェアをスケールダウンすることが多いが、ニューラルネットワークワークロードのパフォーマンス特性は、大きく異なる場合がある。
我々は、CPUのみ、CPU/GPU、CPU/NPU統合ソリューション間で、様々な線形代数およびニューラルネットワーク推論タスクのレイテンシとスループットを比較した。
論文 参考訳(メタデータ) (2024-09-23T08:27:27Z) - Automatic Task Parallelization of Dataflow Graphs in ML/DL models [0.0]
本稿では,MLデータフローグラフに固有の並列パスを利用する線形クラスタリング手法を提案する。
我々はONNX形式で入力MLモデルから可読かつ実行可能な並列Pytorch+Pythonコードを生成する。
いくつかのMLグラフの予備結果は、シリアル実行よりも1.9$times$スピードアップである。
論文 参考訳(メタデータ) (2023-08-22T04:54:30Z) - Performance and Energy Consumption of Parallel Machine Learning
Algorithms [0.0]
機械学習モデルは、様々な現実世界のアプリケーションで顕著な成功を収めた。
機械学習のモデルトレーニングには、大規模データセットと複数のイテレーションが必要である。
トレーニングアルゴリズムの並列化は、トレーニングのプロセスを高速化するための一般的な戦略である。
論文 参考訳(メタデータ) (2023-05-01T13:04:39Z) - PARTIME: Scalable and Parallel Processing Over Time with Deep Neural
Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。
PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。
オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文 参考訳(メタデータ) (2022-10-17T14:49:14Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - Resource Allocation in Multi-armed Bandit Exploration: Overcoming
Sublinear Scaling with Adaptive Parallelism [107.48538091418412]
腕の引っ張りに様々な量の資源を割り当てることができる分割可能な資源にアクセス可能な場合,マルチアームの帯状地における探索について検討する。
特に、分散コンピューティングリソースの割り当てに重点を置いており、プル毎により多くのリソースを割り当てることで、結果をより早く得ることができます。
論文 参考訳(メタデータ) (2020-10-31T18:19:29Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。
私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。
これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:21:20Z) - Accelerating Feedforward Computation via Parallel Nonlinear Equation
Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。
本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。
提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文 参考訳(メタデータ) (2020-02-10T10:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。