論文の概要: Going faster to see further: GPU-accelerated value iteration and
simulation for perishable inventory control using JAX
- arxiv url: http://arxiv.org/abs/2303.10672v1
- Date: Sun, 19 Mar 2023 14:20:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 17:54:05.231142
- Title: Going faster to see further: GPU-accelerated value iteration and
simulation for perishable inventory control using JAX
- Title(参考訳): もっと早く見る: JAX を使用した在庫管理のための GPU アクセラレーション値の反復とシミュレーション
- Authors: Joseph Farrington, Kezhi Li, Wai Keong Wong, Martin Utley
- Abstract要約: 我々はPythonライブラリJAXを使って、ハイレベルなAPIで基礎となるMarkov決定プロセスの反復とシミュレータを実装しています。
提案手法は,従来は実現不可能あるいは現実的と考えられていた設定に値反復の使用を拡張できる。
我々は、複数の候補ポリシーパラメータの並列評価を可能にするJAXのシミュレーション最適化を用いて、最適補充ポリシーの性能をポリシーと比較した。
- 参考スコア(独自算出の注目度): 5.856836693166898
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Value iteration can find the optimal replenishment policy for a perishable
inventory problem, but is computationally demanding due to the large state
spaces that are required to represent the age profile of stock. The parallel
processing capabilities of modern GPUs can reduce the wall time required to run
value iteration by updating many states simultaneously. The adoption of
GPU-accelerated approaches has been limited in operational research relative to
other fields like machine learning, in which new software frameworks have made
GPU programming widely accessible. We used the Python library JAX to implement
value iteration and simulators of the underlying Markov decision processes in a
high-level API, and relied on this library's function transformations and
compiler to efficiently utilize GPU hardware. Our method can extend use of
value iteration to settings that were previously considered infeasible or
impractical. We demonstrate this on example scenarios from three recent studies
which include problems with over 16 million states and additional problem
features, such as substitution between products, that increase computational
complexity. We compare the performance of the optimal replenishment policies to
heuristic policies, fitted using simulation optimization in JAX which allowed
the parallel evaluation of multiple candidate policy parameters on thousands of
simulated years. The heuristic policies gave a maximum optimality gap of 2.49%.
Our general approach may be applicable to a wide range of problems in
operational research that would benefit from large-scale parallel computation
on consumer-grade GPU hardware.
- Abstract(参考訳): 価値反復は在庫問題に対する最適補充ポリシーを見つけることができるが、在庫の年齢分布を表すために必要とされる大きな状態空間のために計算的に要求される。
現代のgpuの並列処理能力は、複数の状態を同時に更新することで、値の反復を実行するのに必要な壁時間を削減することができる。
GPUを加速するアプローチの採用は、新しいソフトウェアフレームワークがGPUプログラミングを広く利用できるようにする機械学習のような他の分野と比較して、運用研究において制限されている。
我々はPythonライブラリのJAXを使って、基礎となるMarkov決定プロセスの値イテレーションとシミュレータをハイレベルAPIで実装し、このライブラリの機能変換とコンパイラを使ってGPUハードウェアを効率的に活用しました。
提案手法は,従来は実現不可能あるいは現実的と考えられていた設定に値反復の使用を拡張できる。
我々は,1600万以上の状態を持つ問題や,計算複雑性を増大させる製品間の置換などの追加的な問題機能を含む,最近の3つの研究の例でこれを実証する。
本研究では, JAX におけるシミュレーション最適化を用いて, 何千年もの模擬年数における複数の候補政策パラメータの並列評価を可能にした。
ヒューリスティックな政策は最大最適性差を2.49%とした。
我々の一般的なアプローチは、消費者向けgpuハードウェア上での大規模並列計算の恩恵を受ける運用研究の幅広い問題に適用できるかもしれない。
関連論文リスト
- Deep Optimizer States: Towards Scalable Training of Transformer Models Using Interleaved Offloading [2.8231000588510757]
トランスフォーマーと大規模言語モデル(LLM)は、すべてのドメインで急速に採用されている。
変圧器の訓練は非常に高価で、しばしば記憶壁にぶつかる」
本稿では,LLMをCPUまたはGPU上で更新フェーズをスケジュールしたサブグループに分割する手法を提案する。
論文 参考訳(メタデータ) (2024-10-26T00:43:59Z) - Implementation and Analysis of GPU Algorithms for Vecchia Approximation [0.8057006406834466]
Vecchia Approximationは計算複雑性を減らすために広く使われており、恥ずかしい並列アルゴリズムで計算することができる。
Vecchia Approximationのためにマルチコアソフトウェアが開発されたが、グラフィックス処理ユニット(GPU)上で動作するように設計されたソフトウェアは不足している。
我々の新しい手法は他の2つより優れており、GpGpU Rパッケージに表示されます。
論文 参考訳(メタデータ) (2024-07-03T01:24:44Z) - JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.343918678781]
我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。
我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。
また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文 参考訳(メタデータ) (2023-11-16T18:58:43Z) - High Performance Computing Applied to Logistic Regression: A CPU and GPU
Implementation Comparison [0.0]
汎用GPUによるロジスティック回帰(LR)の並列バージョンを提案する。
我々の実装は、X. Zouらによって提案された並列なグラディエントDescent Logistic Regressionアルゴリズムの直接変換である。
本手法は,画像認識,スパム検出,不正検出などのリアルタイム予測に特に有用である。
論文 参考訳(メタデータ) (2023-08-19T14:49:37Z) - Local object crop collision network for efficient simulation of
non-convex objects in GPU-based simulators [6.33790920152602]
我々のゴールは、非ネットワークオブジェクトの大規模シミュレーションのための効率的な接触検出アルゴリズムを開発することである。
補足材料の品質と量にのみ依存するCDのためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2023-04-19T06:09:12Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - Towards making the most of NLP-based device mapping optimization for
OpenCL kernels [5.6596607119831575]
我々は、加速されたOpenCLカーネルのための最適なデバイス選択(CPUまたはGPU)の問題に取り組むCummins et al.、すなわちDeeptuneの開発を拡張した。
ソースコードの文脈情報を拡張した4つの異なるモデルを提案する。
実験の結果,提案手法はCumminsらの手法を上回り,予測精度を最大4%向上させることがわかった。
論文 参考訳(メタデータ) (2022-08-30T10:20:55Z) - Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous
Multi-GPU Servers [65.60007071024629]
本稿では,Adaptive SGDが4つの最先端ソリューションよりも精度が高いことを示す。
本稿では,Adaptive SGDが時間と精度で4つの最先端ソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2021-10-13T20:58:15Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical
Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。
驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文 参考訳(メタデータ) (2020-04-16T16:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。