論文の概要: Improving Generalization in Game Agents with Data Augmentation in
Imitation Learning
- arxiv url: http://arxiv.org/abs/2309.12815v2
- Date: Thu, 21 Dec 2023 08:30:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-22 18:21:27.490941
- Title: Improving Generalization in Game Agents with Data Augmentation in
Imitation Learning
- Title(参考訳): 模倣学習におけるデータ強化によるゲームエージェントの一般化改善
- Authors: Derek Yadgaroff, Alessandro Sestini, Konrad Tollmar, Ayca Ozcelikkale,
Linus Gissl\'en
- Abstract要約: 一般化は、関連するが目に見えないシナリオでうまく機能する能力である。
アルゴリズムがトレーニング分布外の有意義な行動を取る必要があるため、模倣学習エージェントには一般化が難しい。
教師あり学習におけるデータ強化の成功に触発されて、トレーニングデータを強化し、データセット内の状態と行動の分布が実際の状態-行動分布をより良く表現できるようにします。
- 参考スコア(独自算出の注目度): 44.46885696362671
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning is an effective approach for training game-playing agents
and, consequently, for efficient game production. However, generalization - the
ability to perform well in related but unseen scenarios - is an essential
requirement that remains an unsolved challenge for game AI. Generalization is
difficult for imitation learning agents because it requires the algorithm to
take meaningful actions outside of the training distribution. In this paper we
propose a solution to this challenge. Inspired by the success of data
augmentation in supervised learning, we augment the training data so the
distribution of states and actions in the dataset better represents the real
state-action distribution. This study evaluates methods for combining and
applying data augmentations to observations, to improve generalization of
imitation learning agents. It also provides a performance benchmark of these
augmentations across several 3D environments. These results demonstrate that
data augmentation is a promising framework for improving generalization in
imitation learning agents.
- Abstract(参考訳): 模倣学習は、ゲームプレイングエージェントを訓練し、その結果、効率的なゲーム生産のための効果的なアプローチである。
しかし、一般化 - 関連するが見えないシナリオでうまく機能する能力 - は、ゲームAIにとって未解決の課題である。
アルゴリズムがトレーニング分布外の有意義な行動を取る必要があるため、模倣学習エージェントには一般化が難しい。
本稿では,この問題に対する解決策を提案する。
教師あり学習におけるデータ強化の成功に触発されて、トレーニングデータを拡張し、データセット内の状態と行動の分布が実際の状態-行動分布をより良く表現できるようにします。
本研究は, 模倣学習エージェントの一般化を改善するため, データの強化を観察に応用する方法を評価・評価する。
また、複数の3D環境にまたがるこれらの拡張のパフォーマンスベンチマークも提供する。
これらの結果は、データ拡張が模倣学習エージェントの一般化を改善するための有望なフレームワークであることを示している。
関連論文リスト
- A Recipe for Unbounded Data Augmentation in Visual Reinforcement Learning [12.889687274108248]
Q-learningアルゴリズムは、視覚的な観察からトレーニングされた時に、不安定さを過度に調整し、訓練する傾向がある。
そこで本研究では,より広範に拡張可能な一般化されたレシピであるSADAを提案する。
提案手法は,RLエージェントのトレーニング安定性と一般化を,多種多様な拡張セットで大幅に向上させる。
論文 参考訳(メタデータ) (2024-05-27T17:58:23Z) - Boosting Model Resilience via Implicit Adversarial Data Augmentation [20.768174896574916]
本稿では, 対向性および対向性摂動分布を組み込むことにより, 試料の深い特性を増大させることを提案する。
そして、この拡張過程が代理損失関数の最適化に近似することを理論的に明らかにする。
我々は4つの共通のバイアス付き学習シナリオにまたがって広範な実験を行う。
論文 参考訳(メタデータ) (2024-04-25T03:22:48Z) - Understanding when Dynamics-Invariant Data Augmentations Benefit Model-Free Reinforcement Learning Updates [3.5253513747455303]
我々は、観察された学習改善に寄与するデータ拡張(DA)の一般的な側面を同定する。
本研究では,動的不変データ拡張機能を持つスパース逆タスクに着目した。
論文 参考訳(メタデータ) (2023-10-26T21:28:50Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Adversarial Auto-Augment with Label Preservation: A Representation
Learning Principle Guided Approach [95.74102207187545]
本研究では,事前自由な自律的データ拡張の目的が表現学習の原則から導出可能であることを示す。
そこで我々は,既存の手法にシームレスに最適化し,シームレスに統合できる目的に対して,実用的なサロゲートを提案する。
論文 参考訳(メタデータ) (2022-11-02T02:02:51Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。