Fugu-MT 論文翻訳(概要): Dominion: A New Frontier for AI Research

論文の概要: Dominion: A New Frontier for AI Research

arxiv url: http://arxiv.org/abs/2405.06846v1
Date: Fri, 10 May 2024 23:03:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-14 19:44:41.647587
Title: Dominion: A New Frontier for AI Research
Title（参考訳）: Dominion: AI研究の新たなフロンティア
Authors: Danny Halawi, Aron Sarmasi, Siena Saltzen, Joshua McCoy,
Abstract要約: 本稿では,次世代の強化学習アルゴリズムのベンチマークとして,テーブルトップゲームDominionが適している特性について論じる。また、経験豊富なプレイヤーがプレイする2000,000以上のDominionのゲームコレクションであるDominion Onlineデータセットも提示する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In recent years, machine learning approaches have made dramatic advances, reaching superhuman performance in Go, Atari, and poker variants. These games, and others before them, have served not only as a testbed but have also helped to push the boundaries of AI research. Continuing this tradition, we examine the tabletop game Dominion and discuss the properties that make it well-suited to serve as a benchmark for the next generation of reinforcement learning (RL) algorithms. We also present the Dominion Online Dataset, a collection of over 2,000,000 games of Dominion played by experienced players on the Dominion Online webserver. Finally, we introduce an RL baseline bot that uses existing techniques to beat common heuristic-based bots, and shows competitive performance against the previously strongest bot, Provincial.
Abstract（参考訳）: 近年、機械学習のアプローチは劇的な進歩を遂げ、Go、Atari、ポーカーの変種で超人的パフォーマンスを達成した。これらのゲームやそれ以前のゲームは、テストベッドとしてだけでなく、AI研究の境界を押し進めるのにも役立っている。この伝統を継続して、テーブルトップゲームであるDominionを検証し、次世代強化学習(RL)アルゴリズムのベンチマークとして機能するのに適した性質について論じる。また、Dominion Online Webサーバ上で経験豊富なプレイヤーがプレイする2000,000以上のDominionのゲームコレクションであるDominion Online Datasetを提示する。最後に,従来の手法を駆使して一般的なヒューリスティックなボットを倒し,これまで最強だったProvincialと競合する性能を示すRLベースラインボットを紹介する。

関連論文リスト

Human-Level Competitive Pokémon via Scalable Offline Reinforcement Learning with Transformers [24.201490513370523]
コンペティティブ・ポクモン・シングルズ (Competitive Pok'emon Singles, CPS) は、プレイヤーが不完全な情報に基づいて相手を悪用することを学ぶ人気戦略ゲームである。観察者の3人称視点から保存したログからエージェントの1人称視点を再構築するパイプラインを開発する。このデータセットは、入力軌跡のみに基づいて相手に適応するように、大規模なシーケンスモデルをトレーニングするブラックボックスアプローチを可能にする。
論文参考訳（メタデータ） (2025-04-06T07:35:15Z)
DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。 AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文参考訳（メタデータ） (2023-12-05T08:07:32Z)
AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文参考訳（メタデータ） (2023-09-04T00:20:06Z)
Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文参考訳（メタデータ） (2022-11-07T18:43:25Z)
DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文参考訳（メタデータ） (2022-10-31T06:29:08Z)
Mastering the Game of No-Press Diplomacy via Human-Regularized Reinforcement Learning and Planning [95.78031053296513]
ノープレス外交(No-press Diplomacy)は、協力と競争の両方を含む複雑な戦略ゲームである。我々は、人間の模倣学習ポリシーに対する報酬最大化ポリシーを規則化する、DiL-piKLと呼ばれる計画アルゴリズムを導入する。 RL-DiL-piKLと呼ばれる自己再生強化学習アルゴリズムに拡張可能であることを示す。
論文参考訳（メタデータ） (2022-10-11T14:47:35Z)
Mastering Terra Mystica: Applying Self-Play to Multi-agent Cooperative Board Games [0.0]
本稿では,Terra Mysticaの複雑な戦略ゲームを解くための複数のアルゴリズムを探索し,比較する。これらのブレークスルーをTMの新しい状態表現に適用し、人間のプレイヤーに匹敵するAIを作ることを目指しています。最後に、複数のベースラインと典型的な人間のスコアを比較して、この手法の成功と欠点について議論する。
論文参考訳（メタデータ） (2021-02-21T07:53:34Z)
Reinforcement Learning Agents for Ubisoft's Roller Champions [0.26249027950824505]
楕円形のスケート場でプレイする3v3コンペティティブマルチプレイヤースポーツゲーム「Ubisoft's Roller Champions」のRLシステムを紹介します。私たちのシステムは,ゲームプレイの変更に伴って新しいモデルをトレーニングするために1～4日を要し,アジャイルで迅速な開発に追随するように設計されています。我々はAIが高度な協調戦略を開発し、ボーナスとしてゲームのバランスをとるのに役立つことを観察する。
論文参考訳（メタデータ） (2020-12-10T23:53:15Z)
Supervised Learning Achieves Human-Level Performance in MOBA Games: A Case Study of Honor of Kings [37.534249771219926]
オンラインバトルアリーナ(MOBA)ゲームにおける人間レベルのパフォーマンスを実現する,教師付き学習ベース人工知能(AI)プログラムであるJueWu-SLを提案する。我々は,MOBAゲームプレイのマクロストラテジーとマイクロマネジメントを,教師付きとエンドツーエンドの方法でニューラルネットワークに統合する。現在最も人気のあるMOBAであるHonor of KingsでテストされているAIは、標準的な5v5ゲームにおいて、ハイキングプレイヤーのレベルで競争力を発揮しています。
論文参考訳（メタデータ） (2020-11-25T08:45:55Z)
AI and Wargaming [7.946510318969309]
我々は、ウォーガーミングのレンズを通して、現在の最先端技術についてレビューする。第一に、ウォーゲームと通常のAIテストベッドを区別する機能は何か、そして第二に、最近のAIの進歩が、これらのウォーゲーム固有の機能に最も適しているのかを問う。
論文参考訳（メタデータ） (2020-09-18T16:39:54Z)
TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文参考訳（メタデータ） (2020-09-18T09:13:56Z)
Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。 Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文参考訳（メタデータ） (2020-03-30T16:18:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。