Fugu-MT 論文翻訳(概要): Accelerated Quality-Diversity for Robotics through Massive Parallelism

論文の概要: Accelerated Quality-Diversity for Robotics through Massive Parallelism

arxiv url: http://arxiv.org/abs/2202.01258v1
Date: Wed, 2 Feb 2022 19:44:17 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-04 13:50:29.959290
Title: Accelerated Quality-Diversity for Robotics through Massive Parallelism
Title（参考訳）: 大規模並列処理によるロボットの品質変化の加速
Authors: Bryan Lim, Maxime Allard, Luca Grillotti, Antoine Cully
Abstract要約: 政策評価はすでにQDアルゴリズムの高速化に並行して行われているが、単一のマシンでしか機能しない。最近のアクセラレーター上で動作するシミュレータの進歩により、単一のGPU/TPU上で数千の評価を並列に行うことができる。 QDアルゴリズムは理想的な候補であり,対話型時間スケールで大規模並列処理を実行できることを示す。
参考スコア（独自算出の注目度）: 4.260312058817663
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Quality-Diversity (QD) algorithms are a well-known approach to generate large collections of diverse and high-quality policies. However, QD algorithms are also known to be data-inefficient, requiring large amounts of computational resources and are slow when used in practice for robotics tasks. Policy evaluations are already commonly performed in parallel to speed up QD algorithms but have limited capabilities on a single machine as most physics simulators run on CPUs. With recent advances in simulators that run on accelerators, thousands of evaluations can performed in parallel on single GPU/TPU. In this paper, we present QDax, an implementation of MAP-Elites which leverages massive parallelism on accelerators to make QD algorithms more accessible. We first demonstrate the improvements on the number of evaluations per second that parallelism using accelerated simulators can offer. More importantly, we show that QD algorithms are ideal candidates and can scale with massive parallelism to be run at interactive timescales. The increase in parallelism does not significantly affect the performance of QD algorithms, while reducing experiment runtimes by two factors of magnitudes, turning days of computation into minutes. These results show that QD can now benefit from hardware acceleration, which contributed significantly to the bloom of deep learning.
Abstract（参考訳）: 品質多様性(QD)アルゴリズムは、多種多様な高品質なポリシーを大量に集めるためのよく知られたアプローチである。しかし、QDアルゴリズムはデータ非効率であることが知られており、大量の計算資源が必要であり、実際にロボット工学のタスクに使用されると遅くなる。ポリシー評価はすでにQDアルゴリズムの高速化に並行して実施されているが、ほとんどの物理シミュレータがCPU上で動作するため、単一のマシンでしか機能しない。最近のアクセラレーター上で動作するシミュレータの進歩により、単一のGPU/TPU上で数千の評価を並列に行うことができる。本稿では,加速器の大規模並列性を利用してqdアルゴリズムをより使いやすくするmap-elitesの実装であるqdaxを提案する。まず,加速シミュレータによる並列化による1秒あたりの評価数の改善について述べる。さらに重要なことは、QDアルゴリズムが理想的な候補であり、対話的な時間スケールで大規模並列性でスケールできることである。並列性の増加はQDアルゴリズムの性能に大きく影響しないが、実験の実行時間を2つの要因で削減し、計算時間を数分に短縮する。これらの結果から,QDはハードウェアアクセラレーションの恩恵を受けることができ,ディープラーニングの普及に大きく寄与した。

関連論文リスト

Q-Sylvan: A Parallel Decision Diagram Package for Quantum Computing [0.0]
並列エッジ値DDの効率的な実装を提案する。我々はこれらのDDを用いて量子回路のシミュレーションと等価チェックという2つのユースケースを実装している。我々のツールであるQ-Sylvanは、大規模インスタンス上での最先端の量子DDツールMQT DDSIMと競合するシングルコア性能を示す。
論文参考訳（メタデータ） (2025-08-01T10:48:52Z)
LuGo: an Enhanced Quantum Phase Estimation Implementation [2.45000454920926]
本稿では,量子位相推定の性能向上を目的とした新しいフレームワーク,LuGoを紹介する。 LuGoは計算効率とハードウェア要件の両方で大幅に改善されている。これらの利点により、LuGoはより効率的なQPEの実装の道を開いた。
論文参考訳（メタデータ） (2025-03-19T17:19:24Z)
Pushing the Boundary of Quantum Advantage in Hard Combinatorial Optimization with Probabilistic Computers [0.4969640751053581]
我々は、pコンピュータがハード最適化問題の解法において最先端の量子アニールを超越できることを示す。これらのアルゴリズムは、成熟した半導体技術のおかげで、現代のハードウェアで容易に実装可能であることを示す。この結果から,pコンピュータをスケーラブルでエネルギー効率のよいハードウェアとして,実用的な量子優位性を実現することができた。
論文参考訳（メタデータ） (2025-03-13T12:24:13Z)
Parallelizing the stabilizer formalism for quantum machine learning applications [0.4749824105387292]
提案されたPythonの実装は、現在のシミュレータであるQiskitよりも高速で、4ビット60,2Kゲートの場合には4.23倍である。その結果,現在のシミュレータであるQiskitよりも高速で,4量子ビット,60,2Kゲートの4.23倍の高速化を実現している。
論文参考訳（メタデータ） (2025-02-15T06:10:07Z)
Lazy Qubit Reordering for Accelerating Parallel State-Vector-based Quantum Circuit Simulation [0.0]
量子回路シミュレーションのための2つの量子演算スケジューリング手法を提案する。提案手法は、qubitリオーダーによる全対全通信を削減する。本稿では,変分量子固有解法(VQE)シミュレーションにおける2つの主要な手順に適したこれらの手法を開発した。
論文参考訳（メタデータ） (2024-10-05T18:20:37Z)
Benchmarking Edge AI Platforms for High-Performance ML Inference [0.0]
エッジコンピューティングは、通信遅延を減らし、リアルタイム処理を可能にする能力から、高性能で異質なSystem-on-Chipソリューションの興隆を促進している。現在のアプローチでは、現代的なハードウェアをスケールダウンすることが多いが、ニューラルネットワークワークロードのパフォーマンス特性は、大きく異なる場合がある。我々は、CPUのみ、CPU/GPU、CPU/NPU統合ソリューション間で、様々な線形代数およびニューラルネットワーク推論タスクのレイテンシとスループットを比較した。
論文参考訳（メタデータ） (2024-09-23T08:27:27Z)
Automatic Task Parallelization of Dataflow Graphs in ML/DL models [0.0]
本稿では,MLデータフローグラフに固有の並列パスを利用する線形クラスタリング手法を提案する。我々はONNX形式で入力MLモデルから可読かつ実行可能な並列Pytorch+Pythonコードを生成する。いくつかのMLグラフの予備結果は、シリアル実行よりも1.9$times$スピードアップである。
論文参考訳（メタデータ） (2023-08-22T04:54:30Z)
Performance and Energy Consumption of Parallel Machine Learning Algorithms [0.0]
機械学習モデルは、様々な現実世界のアプリケーションで顕著な成功を収めた。機械学習のモデルトレーニングには、大規模データセットと複数のイテレーションが必要である。トレーニングアルゴリズムの並列化は、トレーニングのプロセスを高速化するための一般的な戦略である。
論文参考訳（メタデータ） (2023-05-01T13:04:39Z)
PARTIME: Scalable and Parallel Processing Over Time with Deep Neural Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。 PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文参考訳（メタデータ） (2022-10-17T14:49:14Z)
Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文参考訳（メタデータ） (2022-07-09T09:14:12Z)
Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for 5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文参考訳（メタデータ） (2022-01-13T15:20:45Z)
Resource Allocation in Multi-armed Bandit Exploration: Overcoming Sublinear Scaling with Adaptive Parallelism [107.48538091418412]
腕の引っ張りに様々な量の資源を割り当てることができる分割可能な資源にアクセス可能な場合,マルチアームの帯状地における探索について検討する。特に、分散コンピューティングリソースの割り当てに重点を置いており、プル毎により多くのリソースを割り当てることで、結果をより早く得ることができます。
論文参考訳（メタデータ） (2020-10-31T18:19:29Z)
Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文参考訳（メタデータ） (2020-06-18T08:16:25Z)
Heterogeneous CPU+GPU Stochastic Gradient Descent Algorithms [1.3249453757295084]
ヘテロジニアスCPU+GPUアーキテクチャの深層学習のためのトレーニングアルゴリズムについて検討する。私たちの2倍の目標 -- 収束率と資源利用を同時に最大化する -- は、この問題を難しくします。これらのアルゴリズムの実装は,複数の実データセットよりも高速な収束と資源利用の両立を実現していることを示す。
論文参考訳（メタデータ） (2020-04-19T05:21:20Z)
Accelerating Feedforward Computation via Parallel Nonlinear Equation Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文参考訳（メタデータ） (2020-02-10T10:11:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。