論文の概要: Using reinforcement learning to design an AI assistantfor a satisfying
co-op experience
- arxiv url: http://arxiv.org/abs/2105.03414v1
- Date: Fri, 7 May 2021 17:44:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 12:19:27.817332
- Title: Using reinforcement learning to design an AI assistantfor a satisfying
co-op experience
- Title(参考訳): 強化学習を使ってAIアシスタントを設計し、満足なコオプ体験を実現する
- Authors: Ajay Krishnan, Niranj Jyothish, Xun Jia
- Abstract要約: シングルプレイヤーゲームSpace Invaders用のインテリジェントアシスタントプレーヤーを設計した。
エージェントの動作は強化学習技術を用いて設計された。
AI駆動のコンピュータプレーヤーが満足のいく協調体験を提供できるという仮説を検証する。
- 参考スコア(独自算出の注目度): 1.7360163137925997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this project, we designed an intelligent assistant player for the
single-player game Space Invaders with the aim to provide a satisfying co-op
experience. The agent behaviour was designed using reinforcement learning
techniques and evaluated based on several criteria. We validate the hypothesis
that an AI-driven computer player can provide a satisfying co-op experience.
- Abstract(参考訳): 本プロジェクトでは,単一プレイヤーゲームであるSpace Invadersの知的アシスタントプレイヤーを設計し,良好なコオプ体験を実現することを目的とした。
エージェントの動作は強化学習技術を用いて設計され、いくつかの基準に基づいて評価された。
我々は、AI駆動のコンピュータプレイヤーが満足なコオプ体験を提供できるという仮説を検証する。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - CCPT: Automatic Gameplay Testing and Validation with
Curiosity-Conditioned Proximal Trajectories [65.35714948506032]
Curiosity-Conditioned Proximal Trajectories (CCPT)法は、好奇心と模倣学習を組み合わせてエージェントを訓練して探索する。
CCPTが複雑な環境を探索し、ゲームプレイの問題を発見し、その過程におけるデザインの監視を行い、それらをゲームデザイナーに直接認識し、強調する方法について説明する。
論文 参考訳(メタデータ) (2022-02-21T09:08:33Z) - Any-Play: An Intrinsic Augmentation for Zero-Shot Coordination [0.4153433779716327]
我々は、協調型AIを評価するための代替基準を定式化し、この基準を「アルゴリズム間クロスプレイ(inter-algorithm cross-play)」と呼ぶ。
このパラダイムでは,Other-Play や Off-Belief Learning といった,最先端の協調型AIアルゴリズムが低性能であることを示す。
本稿では,Any-Play学習のアルゴリズムをアルゴリズム間クロスプレイ設定に一般化するために,Any-Play学習の拡張を提案する。
論文 参考訳(メタデータ) (2022-01-28T21:43:58Z) - Applying supervised and reinforcement learning methods to create
neural-network-based agents for playing StarCraft II [0.0]
本稿では,汎用的な教師付き強化学習でトレーニングしたStarCraft IIのフル2プレーヤマッチングを実現するニューラルネットワークアーキテクチャを提案する。
本実装では,ゲーム内スクリプトボットと比較して,非自明な性能を実現している。
論文 参考訳(メタデータ) (2021-09-26T20:08:10Z) - Design-Driven Requirements for Computationally Co-Creative Game AI
Design Tools [6.719205507619887]
ゲームAIデザイナの目標やそのようなツールに対する期待を分類し分析する参加型デザイン研究を提案する。
我々は,ゲームAI設計と共同創造ツールの設計との深いつながりと,今後の共同創造ツールの研究・開発への示唆を明らかにする。
論文 参考訳(メタデータ) (2021-07-29T04:14:53Z) - Policy Fusion for Adaptive and Customizable Reinforcement Learning
Agents [137.86426963572214]
異なる行動政策を結合して有意義な「融合」政策を得る方法を示す。
事前学習されたポリシーを組み合わせるための4つの異なるポリシー融合手法を提案する。
これらの手法がゲーム制作や設計に実際どのように役立つのか,実例とユースケースをいくつか紹介する。
論文 参考訳(メタデータ) (2021-04-21T16:08:44Z) - Explainability via Responsibility [0.9645196221785693]
本稿では,特定のトレーニングインスタンスをユーザに提供する,説明可能な人工知能へのアプローチを提案する。
我々は、AIエージェントの動作の説明を人間のユーザに提供する能力を近似することで、このアプローチを評価する。
論文 参考訳(メタデータ) (2020-10-04T20:41:03Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。