論文の概要: OLIVAW: Mastering Othello with neither Humans nor a Penny
- arxiv url: http://arxiv.org/abs/2103.17228v1
- Date: Wed, 31 Mar 2021 17:21:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 14:46:17.288972
- Title: OLIVAW: Mastering Othello with neither Humans nor a Penny
- Title(参考訳): olivaw: 人間もペニーもなしでオセロをマスターする
- Authors: Antonio Norelli and Alessandro Panconesi
- Abstract要約: 我々は、有名なAlphaGoシリーズの設計原則を取り入れたAIオセロプレーヤーであるOLIVAWを紹介する。
OLIVAWの背景にある主な動機は、非自明なボードゲームにおいて例外的な能力を得ることだったが、その輝かしい前任者のコストのほんのわずかしかかからなかった。
- 参考スコア(独自算出の注目度): 80.20911018131848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce OLIVAW, an AI Othello player adopting the design principles of
the famous AlphaGo series. The main motivation behind OLIVAW was to attain
exceptional competence in a non-trivial board game, but at a tiny fraction of
the cost of its illustrious predecessors. In this paper we show how OLIVAW
successfully met this challenge.
- Abstract(参考訳): 我々は、有名なAlphaGoシリーズの設計原則を取り入れたAIオセロプレーヤーであるOLIVAWを紹介する。
OLIVAWの背景にある主な動機は、非自明なボードゲームにおいて例外的な能力を獲得することであったが、その輝かしい前任者のコストのごくわずかであった。
本稿では,OLIVAWがこの課題にどう対処したかを示す。
関連論文リスト
- Dominion: A New Frontier for AI Research [0.0]
本稿では,次世代の強化学習アルゴリズムのベンチマークとして,テーブルトップゲームDominionが適している特性について論じる。
また、経験豊富なプレイヤーがプレイする2000,000以上のDominionのゲームコレクションであるDominion Onlineデータセットも提示する。
論文 参考訳(メタデータ) (2024-05-10T23:03:02Z) - Othello is Solved [0.0]
オセロは世界で最も複雑で人気のあるゲームの一つである。
約10オクテデシリオン(10から58番目のパワー)のゲーム記録と10オクティリオン(10から28番目のパワー)のゲームポジションを持つ。
Othelloは現在解決されている。
論文 参考訳(メタデータ) (2023-10-30T09:48:50Z) - Exploration with Principles for Diverse AI Supervision [88.61687950039662]
次世代の予測を用いた大規模トランスフォーマーのトレーニングは、AIの画期的な進歩を生み出した。
この生成AIアプローチは印象的な結果をもたらしたが、人間の監督に大きく依存している。
この人間の監視への強い依存は、AIイノベーションの進歩に重大なハードルをもたらす。
本稿では,高品質なトレーニングデータを自律的に生成することを目的とした,探索型AI(EAI)という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:03:39Z) - AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。
我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文 参考訳(メタデータ) (2023-09-04T00:20:06Z) - Online Learning in Stackelberg Games with an Omniscient Follower [83.42564921330896]
オンライン学習の課題を2人のプレイヤーによる分散協調型Stackelbergゲームで検討する。
各ラウンドで、まずリーダーが行動を起こし、次にリーダーの動きを観察した後に行動を起こすフォロワーが続く。
報酬構造によっては、全能なフォロワーの存在が、サンプルの複雑さを大きく変える可能性があることを示す。
論文 参考訳(メタデータ) (2023-01-27T03:35:10Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - BYOL-Explore: Exploration by Bootstrapped Prediction [49.221173336814225]
BYOL-Exploreは、視覚的に複雑な環境で好奇心を駆使した探索のための概念的には単純だが一般的なアプローチである。
BYOL-Explore は DM-HARD-8 において有効であることを示す。
論文 参考訳(メタデータ) (2022-06-16T17:36:15Z) - AI and Ethics -- Operationalising Responsible AI [13.781989627894813]
AIに対する公的な信頼の構築と維持が、成功と持続可能なイノベーションの鍵であると認識されている。
この章では、倫理的AI原則の運用に関する課題について論じ、高いレベルの倫理的AI原則をカバーする統合的な見解を提示している。
論文 参考訳(メタデータ) (2021-05-19T00:55:40Z) - Supervised Learning Achieves Human-Level Performance in MOBA Games: A
Case Study of Honor of Kings [37.534249771219926]
オンラインバトルアリーナ(MOBA)ゲームにおける人間レベルのパフォーマンスを実現する,教師付き学習ベース人工知能(AI)プログラムであるJueWu-SLを提案する。
我々は,MOBAゲームプレイのマクロストラテジーとマイクロマネジメントを,教師付きとエンドツーエンドの方法でニューラルネットワークに統合する。
現在最も人気のあるMOBAであるHonor of KingsでテストされているAIは、標準的な5v5ゲームにおいて、ハイキングプレイヤーのレベルで競争力を発揮しています。
論文 参考訳(メタデータ) (2020-11-25T08:45:55Z) - Online Learning in Unknown Markov Games [55.07327246187741]
未知のマルコフゲームでオンライン学習を学ぶ。
後方視における最良の反応に対するサブ線形後悔の達成は統計的に困難であることを示す。
サブ線形$tildemathcalO(K2/3)$ regretを$K$のエピソード後に達成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-28T14:52:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。