論文の概要: Assessing Evolutionary Terrain Generation Methods for Curriculum
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2203.15172v1
- Date: Tue, 29 Mar 2022 01:26:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-20 09:37:53.163863
- Title: Assessing Evolutionary Terrain Generation Methods for Curriculum
Reinforcement Learning
- Title(参考訳): カリキュラム強化学習のための進化的地形生成手法の評価
- Authors: David Howard, Josh Kannemeyer, Davide Dolcetti, Humphrey Munn and
Nicole Robinson
- Abstract要約: CPPN と GAN の2つの間接符号化との比較を行った。
生成した地形メッシュから直接メトリクスを計算するMAP-Elites特徴記述子の影響を評価する。
結果は,カリキュラム学習における利用を通知するジェネレータ間の重要な違いを解説し,コミュニティの獲得に有用な特徴記述器を提示する。
- 参考スコア(独自算出の注目度): 3.1971316044104254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Curriculum learning allows complex tasks to be mastered via incremental
progression over `stepping stone' goals towards a final desired behaviour.
Typical implementations learn locomotion policies for challenging environments
through gradual complexification of a terrain mesh generated through a
parameterised noise function. To date, researchers have predominantly generated
terrains from a limited range of noise functions, and the effect of the
generator on the learning process is underrepresented in the literature. We
compare popular noise-based terrain generators to two indirect encodings, CPPN
and GAN. To allow direct comparison between both direct and indirect
representations, we assess the impact of a range of representation-agnostic
MAP-Elites feature descriptors that compute metrics directly from the generated
terrain meshes. Next, performance and coverage are assessed when training a
humanoid robot in a physics simulator using the PPO algorithm. Results describe
key differences between the generators that inform their use in curriculum
learning, and present a range of useful feature descriptors for uptake by the
community.
- Abstract(参考訳): カリキュラム学習(Curriculum learning)は,最終的な望ましい行動に向けて,‘石を突き刺す’という目標を段階的に進めることで,複雑なタスクをマスター可能にする。
典型的な実装では、パラメータ化されたノイズ関数によって生成された地形メッシュの段階的複雑化を通じて、困難な環境に対する移動ポリシーを学ぶ。
現在まで、研究者は限られた騒音関数から地形を主に生成しており、学習過程に対する発電機の効果は文献で過小評価されている。
CPPN と GAN の2つの間接符号化との比較を行った。
直接表現と間接表現の両方を直接比較するために,生成した地形メッシュから直接メトリクスを計算する,表現非依存なmap-elites特徴記述子の影響を評価する。
次に、PPOアルゴリズムを用いて物理シミュレーターでヒューマノイドロボットを訓練する際に、性能とカバレッジを評価する。
結果は,カリキュラム学習における利用を通知するジェネレータ間の重要な違いを解説し,コミュニティの獲得に有用な特徴記述器を提示する。
関連論文リスト
- Simulating Articulatory Trajectories with Phonological Feature Interpolation [15.482738311360972]
擬似運動コマンドと音節軌跡の前方マッピングについて検討する。
2つの音韻的特徴集合は、それぞれ生成的および調音的音韻論に基づいて、音素的ターゲットシーケンスを符号化するために使用される。
本研究の目的は, 生体運動のダイナミクスを理解することにある。
論文 参考訳(メタデータ) (2024-08-08T10:51:16Z) - DIDA: Denoised Imitation Learning based on Domain Adaptation [28.36684781402964]
ノイズのあるデータから学習するためには、模倣者が必要とされるLND(Learning from Noisy Demonstrations)の問題に焦点を当てる。
本稿では、雑音レベルと専門知識レベルを区別する2つの識別器を設計する、ドメイン適応(DIDA)に基づくDenoized Imitation Learningを提案する。
MuJoCoの実験結果は、DIDAが様々な種類のノイズを持つデモから挑戦的な模倣タスクをうまく処理できることを示した。
論文 参考訳(メタデータ) (2024-04-04T11:29:05Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Language-guided Robot Grasping: CLIP-based Referring Grasp Synthesis in
Clutter [14.489086924126253]
本研究は, 乱雑な場面において, 自然言語で参照される物体のつかみポーズを予測する, つかみ合成を参照する作業に焦点をあてる。
既存のアプローチでは、参照対象をまずセグメント化し、適切な把握を提案し、自然屋内シーンの複雑さを捉えないプライベートデータセットやシミュレータで評価される。
本稿では,CLIPの視覚的接地機能を利用して,画像とテキストのペアから直接合成を学習する新しいエンド・ツー・エンド・モデル(CROG)を提案する。
論文 参考訳(メタデータ) (2023-11-09T22:55:10Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Few-Shot Audio-Visual Learning of Environment Acoustics [89.16560042178523]
室内インパルス応答 (RIR) 関数は、周囲の物理的環境がリスナーが聴く音をどう変換するかをキャプチャする。
我々は、空間で観測された画像とエコーのスパースセットに基づいて、RIRを推測する方法を探る。
3次元環境のための最先端オーディオ視覚シミュレータを用いた実験において,本手法が任意のRIRを生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-08T16:38:24Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Treatment Learning Causal Transformer for Noisy Image Classification [62.639851972495094]
本研究では,この2値情報「ノイズの存在」を画像分類タスクに組み込んで予測精度を向上させる。
因果的変動推定から動機付け,雑音画像分類のための頑健な特徴表現を潜在生成モデルを用いて推定するトランスフォーマーに基づくアーキテクチャを提案する。
また、パフォーマンスベンチマークのための幅広いノイズ要素を取り入れた、新しいノイズの多い画像データセットも作成する。
論文 参考訳(メタデータ) (2022-03-29T13:07:53Z) - Composable Learning with Sparse Kernel Representations [110.19179439773578]
再生カーネルヒルベルト空間におけるスパース非パラメトリック制御系を学習するための強化学習アルゴリズムを提案する。
正規化アドバンテージ関数を通じてステートアクション関数の構造を付与することにより、このアプローチのサンプル複雑さを改善します。
2次元環境下を走行しながらレーザースキャナーを搭載したロボットの複数シミュレーションにおける障害物回避政策の学習に関するアルゴリズムの性能を実証する。
論文 参考訳(メタデータ) (2021-03-26T13:58:23Z) - Generating Human-Like Movement: A Comparison Between Two Approaches
Based on Environmental Features [4.511923587827301]
環境特性に基づいて人間のような軌道を生成するための2つの新しいアルゴリズムが提示されている。
人間の類似性は、最終生成軌道を現実的なものと判断する人間の専門家によってテストされている。
予め定義した基準により,実際の軌道に近い軌道を生成するにもかかわらず,特徴ベースA*アルゴリズムは,アトラクションベースA*アルゴリズムと比較して時間効率が低いことを示す。
論文 参考訳(メタデータ) (2020-12-11T16:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。