論文の概要: Visual Encoders for Data-Efficient Imitation Learning in Modern Video
Games
- arxiv url: http://arxiv.org/abs/2312.02312v1
- Date: Mon, 4 Dec 2023 19:52:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-12-06 17:35:53.885373
- Title: Visual Encoders for Data-Efficient Imitation Learning in Modern Video
Games
- Title(参考訳): 現代のビデオゲームにおけるデータ効率のよい模倣学習のためのビジュアルエンコーダ
- Authors: Lukas Sch\"afer, Logan Jones, Anssi Kanervisto, Yuhan Cao, Tabish
Rashid, Raluca Georgescu, Dave Bignell, Siddhartha Sen, Andrea Trevi\~no
Gavito, Sam Devlin
- Abstract要約: 現代のゲームにおけるトレーニングエージェントに向けたアタリゲームを超えることは、研究コミュニティの大部分にとって違法に高価である。
大規模ビジョンモデルの研究、開発、オープンリリースの最近の進歩は、コミュニティ全体でこれらのコストの一部を償却する可能性がある。
本稿では, Minecraft, Minecraft Dungeons および Counter-Strike: Global Offensive の典型的な, タスク固有のエンドツーエンドトレーニングアプローチと比較して, 公開可能なビジュアルエンコーダを用いた模倣学習の体系的研究を行う。
- 参考スコア(独自算出の注目度): 13.241655571625822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video games have served as useful benchmarks for the decision making
community, but going beyond Atari games towards training agents in modern games
has been prohibitively expensive for the vast majority of the research
community. Recent progress in the research, development and open release of
large vision models has the potential to amortize some of these costs across
the community. However, it is currently unclear which of these models have
learnt representations that retain information critical for sequential decision
making. Towards enabling wider participation in the research of gameplaying
agents in modern games, we present a systematic study of imitation learning
with publicly available visual encoders compared to the typical, task-specific,
end-to-end training approach in Minecraft, Minecraft Dungeons and
Counter-Strike: Global Offensive.
- Abstract(参考訳): ビデオゲームは意思決定コミュニティにとって有用なベンチマークとなっているが、現代のゲームにおけるトレーニングエージェントへのAtariゲームを超えることは、研究コミュニティの大部分にとって違法に高価である。
大規模ビジョンモデルの研究・開発・公開の最近の進歩は、コミュニティ全体でこうしたコストの一部を償却する可能性がある。
しかし、どのモデルが逐次意思決定に重要な情報を保持する表現を学習しているかは、現時点では不明である。
現代ゲームにおけるゲームプレイングエージェントの研究への広範な参加の実現に向けて、Minecraft, Minecraft Dungeons, Counter-Strike: Global Offensiveの典型的なタスク固有のエンドツーエンドトレーニングアプローチと比較して、公開可能なビジュアルエンコーダを用いた模倣学習の体系的研究を提案する。
関連論文リスト
- Playing Non-Embedded Card-Based Games with Reinforcement Learning [18.971623378904503]
本稿では,RTSゲームClash Royaleにおいて,リアルタイムな自律型ゲームプレイを実現するために,非埋め込み型オフライン強化学習トレーニング戦略を提案する。
我々は、最先端のオブジェクト検出と光学的文字認識モデルを用いて特徴を抽出する。
提案手法により,リアルタイム画像取得,認識機能融合,意思決定,モバイルデバイスの制御が可能となり,組込みAI相手を倒すことに成功した。
論文 参考訳(メタデータ) (2025-04-07T07:26:02Z) - Across-Game Engagement Modelling via Few-Shot Learning [1.7969777786551424]
ドメインの一般化には、さまざまなドメインにわたるハイパフォーマンスを維持するAIモデルを学ぶことが含まれる。
ビデオゲームは、ユーザー体験の分析にユニークな課題と機会を提供する。
本稿では,ユーザエクスペリエンスの汎用ドメインに依存しないモデリングをいくつかのドメイン固有タスクとゲーム依存タスクに分解するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-19T16:21:21Z) - Serious Games in Digital Gaming: A Comprehensive Review of Applications,
Game Engines and Advancements [55.2480439325792]
近年,ユーザを同時に教育し,楽しませる能力によって,真剣なゲームの人気が高まっている。
本稿では,様々なタイプのデジタルゲームの概要を概観し,真剣なゲームジャンルに展開する。
ゲーム開発業界で最も広く使われているゲームエンジンを提示し、Unityのゲームマシンの利点を拡張する。
論文 参考訳(メタデータ) (2023-11-03T09:17:09Z) - Towards General Game Representations: Decomposing Games Pixels into
Content and Style [2.570570340104555]
ゲームのピクセル表現を学習することは、複数の下流タスクにまたがる人工知能の恩恵を受けることができる。
本稿では,コンピュータビジョンエンコーダの汎用化について検討する。
我々は、ゲームジャンルに基づく事前学習されたビジョントランスフォーマーエンコーダと分解技術を用いて、個別のコンテンツとスタイルの埋め込みを得る。
論文 参考訳(メタデータ) (2023-07-20T17:53:04Z) - Technical Challenges of Deploying Reinforcement Learning Agents for Game
Testing in AAA Games [58.720142291102135]
本稿では,既存の自動ゲームテストソリューションに,スクリプト型ボットをベースとして,実験的な強化学習システムを追加する取り組みについて述べる。
ゲーム制作において強化学習を活用するためのユースケースを示し、ゲームのために同じ旅をしたいと思う人なら誰でも遭遇する最大の時間をカバーしています。
我々は、機械学習、特にゲーム生産において効果的なツールである強化学習を作るのに価値があり、必要であると考えるいくつかの研究指針を提案する。
論文 参考訳(メタデータ) (2023-07-19T18:19:23Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online
Videos [16.858980871368175]
我々は、半自明な模倣学習を通じて、インターネット規模の事前学習パラダイムをシーケンシャルな決定領域に拡張する。
この動作先行はゼロショット機能を有しておらず、模倣学習と強化学習の両方で微調整可能であることを示す。
多くのタスクにおいて、私たちのモデルは人間レベルのパフォーマンスを示しており、ダイアモンドツールを作れるコンピュータエージェントを最初に報告しています。
論文 参考訳(メタデータ) (2022-06-23T16:01:11Z) - Playful Interactions for Representation Learning [82.59215739257104]
本稿では,下流タスクの視覚的表現を学習するために,遊び心のあるインタラクションを自己指導的に利用することを提案する。
19の多様な環境で2時間の遊び心のあるデータを収集し、自己予測学習を用いて視覚的表現を抽出する。
我々の表現は、標準的な行動クローニングよりも一般化され、必要なデモの半数しか必要とせず、同様の性能を達成できる。
論文 参考訳(メタデータ) (2021-07-19T17:54:48Z) - Unsupervised Visual Representation Learning by Tracking Patches in Video [88.56860674483752]
本研究では,コンピュータビジョンシステムのプロキシタスクとしてトラッキングを用いて視覚表現を学習することを提案する。
子どもたちがプレイするキャッチゲームをベースに、視覚表現を学ぶ3D-CNNモデルのためのキャッチ・ザ・パッチ(CtP)ゲームを設計します。
論文 参考訳(メタデータ) (2021-05-06T09:46:42Z) - Designing a mobile game to generate player data -- lessons learned [2.695466667982714]
同様のプロジェクトのガイダンスを使わずにモバイルゲームを開発した。
ゲームバランシングとシステムシミュレーションの研究は、実験的なケーススタディを必要とした。
RPGの制作において、我々は研究目的で効果的なアマチュアゲーム開発について一連の教訓を学んだ。
論文 参考訳(メタデータ) (2021-01-18T16:16:58Z) - Deep Learning Techniques for Super-Resolution in Video Games [91.3755431537592]
コンピュータ科学者はグラフィカル処理ハードウェアの性能を改善する新しい方法を開発する必要がある。
ビデオ超解像のための深層学習技術は、計算コストの大部分を相殺しながら、高品質なグラフィックスを持つことができる。
論文 参考訳(メタデータ) (2020-12-17T18:22:05Z) - DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games [137.86426963572214]
Deep CrawlはiOSとAndroid用の完全にプレイ可能なRogueライクなプロトタイプで、すべてのエージェントがDeep Reinforcement Learning (DRL)を使用してトレーニングされたポリシーネットワークによって制御される。
本研究の目的は、近年のDRLの進歩が、ビデオゲームにおける非プレイヤーキャラクターに対する説得力のある行動モデルの開発に有効であるかどうかを理解することである。
論文 参考訳(メタデータ) (2020-12-03T13:53:29Z) - Generating Gameplay-Relevant Art Assets with Transfer Learning [0.8164433158925593]
本稿では,ゲームプレイの関連性に基づいて,新たなゲームビジュアルを修正・生成するCVAEシステムを提案する。
実験結果から,トランスファーラーニングアプローチを採用することで,見えないデータに対する視覚的品質と安定性が向上する可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-04T20:58:40Z) - "It's Unwieldy and It Takes a Lot of Time." Challenges and Opportunities
for Creating Agents in Commercial Games [20.63320049616144]
対戦相手、ノンプレイヤーキャラクター、チームメイトなどのゲームエージェントは、現代の多くのゲームにおいてプレイヤーの経験の中心となっている。
ゲーム産業で使用されるAI技術の展望がより広く機械学習(ML)を採用するように進化するにつれて、研究コミュニティは数十年にわたって業界内で栽培されているベストプラクティスからエージェントを作成することを学ぶことが不可欠である。
AAAスタジオ、インディースタジオ、産業研究所の17人のゲームエージェントクリエーターに、彼らがプロフェッショナル文学で経験した課題についてインタビューした。
論文 参考訳(メタデータ) (2020-09-01T16:21:19Z) - Benchmarking End-to-End Behavioural Cloning on Video Games [5.863352129133669]
我々は,2010年以降の6ゲームを含む12のビデオゲームにおける行動クローンの一般適用性について検討した。
以上の結果から,これらのエージェントは生演奏では人間と一致しないが,基本力学やルールを学習できることがわかった。
また、データの質や、人間からのデータの記録が、人間の反射によって、状態-作用ミスマッチの対象になっていることを実証する。
論文 参考訳(メタデータ) (2020-04-02T13:31:51Z) - Disentangling Controllable Object through Video Prediction Improves
Visual Reinforcement Learning [82.25034245150582]
多くの視覚に基づく強化学習問題において、エージェントは視野内の可動物体を制御する。
制御可能なオブジェクトを観測信号から切り離すためのエンドツーエンド学習フレームワークを提案する。
不整合表現は、RLがエージェントに追加の観察チャネルとして有用であることが示されている。
論文 参考訳(メタデータ) (2020-02-21T05:43:34Z) - Neural MMO v1.3: A Massively Multiagent Game Environment for Training
and Evaluating Neural Networks [48.5733173329785]
本稿では,MMOにインスパイアされたマルチエージェントゲーム環境であるNeural MMOを紹介する。
分散インフラストラクチャとゲームIOという,AI研究のためのマルチエージェントシステムエンジニアリングにおける,より一般的な2つの課題について論じる。
論文 参考訳(メタデータ) (2020-01-31T18:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。