論文の概要: Rinascimento: using event-value functions for playing Splendor
- arxiv url: http://arxiv.org/abs/2006.05894v1
- Date: Wed, 10 Jun 2020 15:28:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:31:36.182365
- Title: Rinascimento: using event-value functions for playing Splendor
- Title(参考訳): Rinascimento: Splendorの再生にイベント値関数を使用する
- Authors: Ivan Bravi and Simon Lucas
- Abstract要約: 本稿では,イベントログに基づく新しい手法を提案する。
ゲーム状態は、その機能の1つが変更されるたびにイベントをトリガーする。
実験によると、このような手法はポイント報酬の不足を軽減し、AIのパフォーマンスを向上させることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of games research, Artificial General Intelligence algorithms
often use score as main reward signal for learning or playing actions. However
this has shown its severe limitations when the point rewards are very rare or
absent until the end of the game. This paper proposes a new approach based on
event logging: the game state triggers an event every time one of its features
changes. These events are processed by an Event-value Function (EF) that
assigns a value to a single action or a sequence. The experiments have shown
that such approach can mitigate the problem of scarce point rewards and improve
the AI performance. Furthermore this represents a step forward in controlling
the strategy adopted by the artificial agent, by describing a much richer and
controllable behavioural space through the EF. Tuned EF are able to neatly
synthesise the relevance of the events in the game. Agents using an EF show
more robust when playing games with several opponents.
- Abstract(参考訳): ゲーム研究の領域では、人工知能アルゴリズムはしばしばスコアを学習やプレイのための主要な報酬信号として利用する。
しかし、ポイント報酬がゲーム終了まで非常に稀または欠落している場合、これは厳しい制限を示している。
本稿では,イベントログに基づく新しいアプローチを提案する。ゲーム状態は,その機能変更の度にイベントをトリガーする。
これらのイベントは、単一のアクションやシーケンスに値を割り当てるイベント値関数(EF)によって処理される。
実験の結果、このような手法はポイント報酬の不足を軽減し、AIのパフォーマンスを向上させることができることがわかった。
さらにこれは、EFを通じてよりリッチで制御可能な行動空間を記述することによって、人工エージェントが採用する戦略を制御するための一歩である。
チューニングされたEFは、ゲーム内のイベントの関連性をきちんと合成することができる。
EFを使用するエージェントは、複数の対戦相手とゲームをする際により堅牢である。
関連論文リスト
- Reward Shaping for Improved Learning in Real-time Strategy Game Play [0.3347089492811693]
適切な設計の報酬形成機能により、プレイヤーのパフォーマンスを大幅に向上させることができることを示す。
本研究は,海中キャプチャー・ザ・フラッグゲームのための模擬環境下での報酬形成機能を検証した。
論文 参考訳(メタデータ) (2023-11-27T21:56:18Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Off-Beat Multi-Agent Reinforcement Learning [62.833358249873704]
オフビート動作が一般的環境におけるモデルフリーマルチエージェント強化学習(MARL)について検討した。
モデルレスMARLアルゴリズムのための新しいエピソードメモリLeGEMを提案する。
我々は,Stag-Hunter Game,Quarry Game,Afforestation Game,StarCraft IIマイクロマネジメントタスクなど,オフビートアクションを伴うさまざまなマルチエージェントシナリオ上でLeGEMを評価する。
論文 参考訳(メタデータ) (2022-05-27T02:21:04Z) - Rinascimento: searching the behaviour space of Splendor [0.0]
本研究の目的は,ゲーム内の行動空間(BSpace)を一般手法を用いてマッピングすることである。
特に、イベント値関数の使用は、古典的なスコアベースの報酬信号に基づくエージェントと比較して、BSpaceのカバレッジが著しく改善されている。
論文 参考訳(メタデータ) (2021-06-15T18:46:57Z) - On the Power of Refined Skat Selection [1.3706331473063877]
Skatは魅力的なカードゲームで、現代のAIシステムの本質的な課題の多くを示しています。
洗練されたskat評価機能に基づくハードエキスパートルールとスコアリング関数を提案する。
実験では、精巧なskat pingアルゴリズムがボットの演奏性能に与える影響を強調した。
論文 参考訳(メタデータ) (2021-04-07T08:54:58Z) - Collaborative Agent Gameplay in the Pandemic Board Game [3.223284371460913]
Pandemicは、すべてのプレイヤーがゲームの進行中に発生する出来事によって引き起こされる課題を克服するために調整する模範的な共同ボードゲームです。
本稿では,すべてのプレイヤーの行動を制御し,この高度に進化した環境において勝つ確率と負けるリスクをバランスさせる人工エージェントを提案する。
提案アルゴリズムは,様々な難易度を持つ異なるゲームにおいて,より一貫した勝利戦略を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-03-21T13:18:20Z) - Disturbing Reinforcement Learning Agents with Corrupted Rewards [62.997667081978825]
強化学習アルゴリズムに対する報酬の摂動に基づく異なる攻撃戦略の効果を分析します。
敵対的な報酬をスムーズに作成することは学習者を誤解させることができ、低探査確率値を使用すると、学習した政策は報酬を腐敗させるのがより堅牢であることを示しています。
論文 参考訳(メタデータ) (2021-02-12T15:53:48Z) - An Empirical Study on the Generalization Power of Neural Representations
Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。
提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文 参考訳(メタデータ) (2021-01-31T10:30:48Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。