論文の概要: QDax: A Library for Quality-Diversity and Population-based Algorithms
with Hardware Acceleration
- arxiv url: http://arxiv.org/abs/2308.03665v1
- Date: Mon, 7 Aug 2023 15:29:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 13:04:08.658322
- Title: QDax: A Library for Quality-Diversity and Population-based Algorithms
with Hardware Acceleration
- Title(参考訳): QDax: ハードウェアアクセラレーションによる品質多様性と人口ベースアルゴリズムのためのライブラリ
- Authors: Felix Chalumeau, Bryan Lim, Raphael Boige, Maxime Allard, Luca
Grillotti, Manon Flageat, Valentin Mac\'e, Arthur Flajolet, Thomas Pierrot,
Antoine Cully
- Abstract要約: QDaxはオープンソースのライブラリで、JaxのQuality-Diversity (QD)最適化アルゴリズムの合理化とモジュラーAPIを備えている。
このライブラリは、ブラックボックス最適化から継続的制御まで、最適化目的の汎用ツールとして機能する。
- 参考スコア(独自算出の注目度): 3.8494302715990845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: QDax is an open-source library with a streamlined and modular API for
Quality-Diversity (QD) optimization algorithms in Jax. The library serves as a
versatile tool for optimization purposes, ranging from black-box optimization
to continuous control. QDax offers implementations of popular QD,
Neuroevolution, and Reinforcement Learning (RL) algorithms, supported by
various examples. All the implementations can be just-in-time compiled with
Jax, facilitating efficient execution across multiple accelerators, including
GPUs and TPUs. These implementations effectively demonstrate the framework's
flexibility and user-friendliness, easing experimentation for research
purposes. Furthermore, the library is thoroughly documented and tested with
95\% coverage.
- Abstract(参考訳): QDaxはオープンソースのライブラリで、JaxのQuality-Diversity (QD)最適化アルゴリズムの合理化とモジュラーAPIを備えている。
このライブラリは、ブラックボックス最適化から連続制御まで、最適化目的の汎用ツールとして機能する。
QDaxは、一般的なQD、Neuroevolution、Reinforcement Learning (RL)アルゴリズムの実装を提供し、様々な例でサポートされている。
すべての実装はjaxでジャスト・イン・タイムでコンパイルでき、gpuやtpusを含む複数のアクセラレータで効率的な実行が容易になる。
これらの実装は、フレームワークの柔軟性とユーザフレンドリを効果的に実証し、研究目的の実験を容易にする。
さらに、ライブラリはドキュメント化され、95%のカバレッジでテストされる。
関連論文リスト
- CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning [14.580628884001593]
CoverLibは、ライブラリに経験分類器ペアを反復的に追加する。
未発見領域を効果的にカバーする機能に基づいて、次のエクスペリエンスを選択する。
それは、問題領域に対する高速な計画と高い成功率の両方を達成する。
論文 参考訳(メタデータ) (2024-05-05T15:27:05Z) - JaxUED: A simple and useable UED library in Jax [1.5821811088000381]
本稿では,最新のUnsupervised Environment Design (UED) アルゴリズムの依存性を最小限に抑えるオープンソースライブラリであるJaxUEDを紹介する。
cleanRLにインスパイアされた我々は、高速で、明確で、理解しやすく、容易に変更可能な実装を提供し、UEDの研究を加速することを目的としている。
論文 参考訳(メタデータ) (2024-03-19T18:40:50Z) - XuanCe: A Comprehensive and Unified Deep Reinforcement Learning Library [18.603206638756056]
XuanCeは総合的に統合された深層強化学習(DRL)ライブラリである。
XuanCeは40以上の古典DRLとマルチエージェントDRLアルゴリズムを含む幅広い機能を提供している。
XuanCeはオープンソースで、https://agi-brain.com/agi-brain/xuance.gitでアクセスできる。
論文 参考訳(メタデータ) (2023-12-25T14:45:39Z) - JaxMARL: Multi-Agent RL Environments in JAX [107.7560737385902]
我々は、使いやすさとGPU有効性を組み合わせた最初のオープンソースコードベースであるJaxMARLを紹介します。
私たちの実験によると、JAXベースのトレーニングパイプラインの実行は、既存のアプローチよりも最大で12500倍高速です。
また、人気のあるStarCraft Multi-Agent Challengeのベクトル化、単純化されたバージョンであるSMAXを紹介し、ベンチマークする。
論文 参考訳(メタデータ) (2023-11-16T18:58:43Z) - LibAUC: A Deep Learning Library for X-Risk Optimization [43.32145407575245]
本稿では,LibAUC という賞を受賞したディープラーニングライブラリについて紹介する。
LibAUCは、Xリスクと呼ばれるリスク関数のファミリーを最適化するための最先端のアルゴリズムを実装している。
論文 参考訳(メタデータ) (2023-06-05T17:43:46Z) - Improving and Benchmarking Offline Reinforcement Learning Algorithms [87.67996706673674]
この作業は、低レベルの選択とデータセットによって引き起こされるギャップを埋めることを目的としている。
3つの代表アルゴリズムを用いて20の実装選択を実証的に検討する。
CRR+とCQL+の2つの変種がD4RL上で新たな最先端を実現している。
論文 参考訳(メタデータ) (2023-06-01T17:58:46Z) - JaxPruner: A concise library for sparsity research [46.153423603424]
JaxPrunerはスパースニューラルネットワーク研究のためのオープンソースライブラリである。
メモリとレイテンシのオーバーヘッドを最小限に抑えながら、一般的なプルーニングとスパーストレーニングアルゴリズムを実装している。
論文 参考訳(メタデータ) (2023-04-27T10:45:30Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。