論文の概要: Efficient Hyperparameter Optimization for Physics-based Character
Animation
- arxiv url: http://arxiv.org/abs/2104.12365v1
- Date: Mon, 26 Apr 2021 06:46:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 01:31:06.357869
- Title: Efficient Hyperparameter Optimization for Physics-based Character
Animation
- Title(参考訳): 物理系キャラクタアニメーションのための高効率ハイパーパラメータ最適化
- Authors: Zeshi Yang and Zhiqi Yin
- Abstract要約: 本稿では,DRLに基づく文字制御システムの高パラメータ最適化のための,新しいカリキュラムベースのマルチフィデリティベイズ最適化フレームワーク(CMFBO)を提案する。
提案アルゴリズムは,DeepMimicの著者がリリースした設定と比較して,少なくとも5倍の効率向上が得られることを示す。
- 参考スコア(独自算出の注目度): 1.2183405753834562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physics-based character animation has seen significant advances in recent
years with the adoption of Deep Reinforcement Learning (DRL). However,
DRL-based learning methods are usually computationally expensive and their
performance crucially depends on the choice of hyperparameters. Tuning
hyperparameters for these methods often requires repetitive training of control
policies, which is even more computationally prohibitive. In this work, we
propose a novel Curriculum-based Multi-Fidelity Bayesian Optimization framework
(CMFBO) for efficient hyperparameter optimization of DRL-based character
control systems. Using curriculum-based task difficulty as fidelity criterion,
our method improves searching efficiency by gradually pruning search space
through evaluation on easier motor skill tasks. We evaluate our method on two
physics-based character control tasks: character morphology optimization and
hyperparameter tuning of DeepMimic. Our algorithm significantly outperforms
state-of-the-art hyperparameter optimization methods applicable for
physics-based character animation. In particular, we show that hyperparameters
optimized through our algorithm result in at least 5x efficiency gain comparing
to author-released settings in DeepMimic.
- Abstract(参考訳): 近年,Deep Reinforcement Learning (DRL) の導入により,物理ベースのキャラクターアニメーションが大きな進歩を遂げている。
しかし、DRLベースの学習法は通常計算コストが高く、その性能はハイパーパラメータの選択に大きく依存する。
これらの方法に対するハイパーパラメータのチューニングには、制御ポリシーの反復的なトレーニングがしばしば必要となる。
本研究では,DRLに基づく文字制御システムの高パラメータ最適化を効率的に行うために,カリキュラムベースのマルチフィデリティベイズ最適化フレームワーク(CMFBO)を提案する。
本手法は,カリキュラムベースの課題難易度を忠実度基準として,より簡単な運動スキルタスクの評価を通じて,探索空間を徐々に刈り取ることにより探索効率を向上させる。
本手法は,deepmimicのキャラクタリモルフォロジー最適化とハイパーパラメータチューニングの2つの物理ベースのキャラクタ制御タスクについて評価する。
本アルゴリズムは,物理ベースのキャラクタアニメーションに適用できる最先端のハイパーパラメータ最適化手法を著しく上回っている。
特に,アルゴリズムによって最適化されたハイパーパラメータは,DeepMimicの作者リリース設定と比較して,少なくとも5倍の効率向上が得られることを示す。
関連論文リスト
- Combining Automated Optimisation of Hyperparameters and Reward Shape [7.407166175374958]
本稿では,ハイパーパラメータと報酬関数を組み合わせた最適化手法を提案する。
近似ポリシー最適化とソフト・アクター・クリティカルを用いた広範囲な実験を行った。
以上の結果から,統合最適化は環境の半分のベースライン性能よりも有意に向上し,他の環境との競争性能も向上することが示された。
論文 参考訳(メタデータ) (2024-06-26T12:23:54Z) - PriorBand: Practical Hyperparameter Optimization in the Age of Deep
Learning [49.92394599459274]
我々は,Deep Learning(DL)パイプラインに適したHPOアルゴリズムであるPresideBandを提案する。
各種のDLベンチマークでその堅牢性を示し、情報的専門家のインプットと、専門家の信条の低さに対してその利得を示す。
論文 参考訳(メタデータ) (2023-06-21T16:26:14Z) - AutoRL Hyperparameter Landscapes [69.15927869840918]
強化学習(Reinforcement Learning, RL)は印象的な結果を生み出すことができるが、その使用はハイパーパラメータがパフォーマンスに与える影響によって制限されている。
我々は,これらのハイパーパラメータの景観を1つの時間だけではなく,複数の時間内に構築し,解析する手法を提案する。
これは、ハイパーパラメータがトレーニング中に動的に調整されるべきであるという理論を支持し、ランドスケープ解析によって得られるAutoRL問題に関するさらなる洞察の可能性を示している。
論文 参考訳(メタデータ) (2023-04-05T12:14:41Z) - A Framework for History-Aware Hyperparameter Optimisation in
Reinforcement Learning [8.659973888018781]
強化学習(RL)システムは、システムの性能に影響を与える一連の初期条件に依存する。
これらのトレードオフを軽減するため,複雑なイベント処理と時間モデルの統合に基づくフレームワークを提案する。
提案手法を,RLの変種であるDQNを用いた5Gモバイル通信ケーススタディで検証した。
論文 参考訳(メタデータ) (2023-03-09T11:30:40Z) - AUTOMATA: Gradient Based Data Subset Selection for Compute-Efficient
Hyper-parameter Tuning [72.54359545547904]
ハイパーパラメータチューニングのための勾配に基づくサブセット選択フレームワークを提案する。
ハイパーパラメータチューニングに勾配ベースのデータサブセットを用いることで、3$times$-30$times$のターンアラウンド時間とスピードアップが大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-03-15T19:25:01Z) - Automatic tuning of hyper-parameters of reinforcement learning
algorithms using Bayesian optimization with behavioral cloning [0.0]
強化学習(RL)では、学習エージェントが収集したデータの情報内容は多くのハイパーパラメータの設定に依存する。
本研究では,ベイズ最適化を用いた自律的ハイパーパラメータ設定手法を提案する。
実験は、他の手作業による調整や最適化ベースのアプローチと比較して、有望な結果を示している。
論文 参考訳(メタデータ) (2021-12-15T13:10:44Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z) - On the Importance of Hyperparameter Optimization for Model-based
Reinforcement Learning [27.36718899899319]
モデルベース強化学習(MBRL)はデータ効率のよい制御を学習するための有望なフレームワークである。
MBRLは通常、新しい問題やドメインに適用する前に、重要な人間の専門知識が必要です。
論文 参考訳(メタデータ) (2021-02-26T18:57:47Z) - Optimizing Large-Scale Hyperparameters via Automated Learning Algorithm [97.66038345864095]
ゼロ階超勾配(HOZOG)を用いた新しいハイパーパラメータ最適化法を提案する。
具体的には、A型制約最適化問題として、まずハイパーパラメータ最適化を定式化する。
次に、平均ゼロ階超勾配を用いてハイパーパラメータを更新する。
論文 参考訳(メタデータ) (2021-02-17T21:03:05Z) - Online hyperparameter optimization by real-time recurrent learning [57.01871583756586]
ニューラルネットワーク(rnn)におけるハイパーパラメータ最適化とパラメータ学習の類似性を活用した。
RNNのための学習済みのオンライン学習アルゴリズムのファミリーを適応させ、ハイパーパラメータとネットワークパラメータを同時に調整します。
この手順は、通常の方法に比べて、ウォールクロック時間のほんの少しで、体系的に一般化性能が向上する。
論文 参考訳(メタデータ) (2021-02-15T19:36:18Z) - Automatic Hyper-Parameter Optimization Based on Mapping Discovery from
Data to Hyper-Parameters [3.37314595161109]
本稿では,データから対応するハイパーパラメータへのマッピングに基づく,効率的な自動パラメータ最適化手法を提案する。
提案手法は最先端のアポラッチを著しく上回ることを示す。
論文 参考訳(メタデータ) (2020-03-03T19:26:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。