論文の概要: Efficient Reasoning in Regular Boardgames
- arxiv url: http://arxiv.org/abs/2006.08295v1
- Date: Mon, 15 Jun 2020 11:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 04:28:03.608801
- Title: Efficient Reasoning in Regular Boardgames
- Title(参考訳): ボードゲームにおける効率的な推論
- Authors: Jakub Kowalski, Rados{\l}aw Miernik, Maksymilian Mika, Wojciech
Pawlik, Jakub Sutowicz, Marek Szyku{\l}a, Andrzej Tkaczyk
- Abstract要約: 本稿では,通常のボードゲーム(RBG)言語における推論の技術的側面について述べる。
RBGは知識推論、分析、生成、学習、ゲームのための一般化されたアルゴリズムの開発を支援する研究ツールとして機能する。
- 参考スコア(独自算出の注目度): 2.909363382704072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the technical side of reasoning in Regular Boardgames (RBG)
language -- a universal General Game Playing (GGP) formalism for the class of
finite deterministic games with perfect information, encoding rules in the form
of regular expressions. RBG serves as a research tool that aims to aid in the
development of generalized algorithms for knowledge inference, analysis,
generation, learning, and playing games. In all these tasks, both generality
and efficiency are important.
In the first part, this paper describes optimizations used by the RBG
compiler. The impact of these optimizations ranges from 1.7 to even 33-fold
efficiency improvement when measuring the number of possible game playouts per
second. Then, we perform an in-depth efficiency comparison with three other
modern GGP systems (GDL, Ludii, Ai Ai). We also include our own highly
optimized game-specific reasoners to provide a point of reference of the
maximum speed. Our experiments show that RBG is currently the fastest among the
abstract general game playing languages, and its efficiency can be competitive
to common interface-based systems that rely on handcrafted game-specific
implementations. Finally, we discuss some issues and methodology of computing
benchmarks like this.
- Abstract(参考訳): 本稿では,正規表現の形式で規則を符号化する有限決定性ゲームクラスに対する汎用ゲームプレイング(GGP)形式であるRBG言語における推論の技術的側面について述べる。
RBGは知識推論、分析、生成、学習、ゲームのための一般化されたアルゴリズムの開発を支援する研究ツールとして機能する。
これらすべてのタスクにおいて、一般性と効率性の両方が重要である。
第一部では、rbgコンパイラが使用する最適化について述べる。
これらの最適化の影響は、1秒あたりのプレイアウト数を測定する際に1.7から33倍の効率改善まで様々である。
そして、他の3つのggpシステム(gdl、ludii、ai ai)との詳細な効率比較を行う。
我々はまた、最大速度の基準を提供するために、高度に最適化されたゲーム固有の推論器も含んでいます。
実験の結果,RBGは現在,抽象的な汎用ゲーム言語の中で最速であり,その効率性は手作りゲーム固有の実装に依存する一般的なインタフェースベースシステムと競合することがわかった。
最後に,このような計算ベンチマークの問題点と方法論について論じる。
関連論文リスト
- Fast and Knowledge-Free Deep Learning for General Game Playing (Student
Abstract) [1.9750759888062657]
我々は,AlphaZeroモデルを汎用ゲームプレイング(GGP)に適用する手法を開発した。
データセット生成は、セルフプレイの代わりにMCTSを使用しており、バリューネットワークのみを使用し、アテンション層が畳み込み層を置き換える。
論文 参考訳(メタデータ) (2023-12-21T18:44:19Z) - SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文 参考訳(メタデータ) (2023-05-24T18:14:35Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Kernelized Multiplicative Weights for 0/1-Polyhedral Games: Bridging the
Gap Between Learning in Extensive-Form and Normal-Form Games [76.21916750766277]
カーネルトリックを用いて,最適乗算重み更新(OMWU)アルゴリズムをゲームツリーサイズ毎のリニア時間でEFGの正規形等価値にシミュレート可能であることを示す。
特に、KoMWUは、最終点収束を同時に保証する最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-01T06:28:51Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Spatial State-Action Features for General Games [5.849736173068868]
汎用ゲームのための空間状態対応機能の設計と効率的な実装を定式化する。
これらは、局所的な状態の変数にマッチするかどうかに基づいて、アクションをインセンティブまたは非インセンティブ化するようにトレーニングできるパターンである。
任意の機能セットに対して,アクティブな機能を評価するための効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-17T13:34:04Z) - Revisiting Game Representations: The Hidden Costs of Efficiency in
Sequential Decision-making Algorithms [0.6749750044497732]
不完全な情報の下でのシーケンシャルな意思決定アルゴリズムの進歩は、大きなゲームで顕著な成功を収めている。
これらのアルゴリズムは伝統的に広義のゲーム形式を用いてゲームを形式化する。
プレイヤー固有の情報状態木に基づく特殊表現の使用が,一般的な回避策であることを示す。
論文 参考訳(メタデータ) (2021-12-20T22:34:19Z) - Optimised Playout Implementations for the Ludii General Game System [8.344476599818828]
Ludiiの汎用ゲームシステムは、最適化された実装が適用可能であるか否かにかかわらず、ゲーム記述言語におけるゲームの記述に基づいて自動的に推論することができる。
実験的な評価では、標準実装よりも大きなスピードアップを示し、中央値はルディイの5.08倍の速さで145以上の異なるゲームを実行した。
論文 参考訳(メタデータ) (2021-11-04T12:59:53Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Learning Dynamic Belief Graphs to Generalize on Text-Based Games [55.59741414135887]
テキストベースのゲームをプレイするには、自然言語処理とシーケンシャルな意思決定のスキルが必要である。
本研究では,原文からエンドツーエンドに学習したグラフ構造化表現を用いて,エージェントがテキストベースのゲームでどのように計画・一般化できるかを検討する。
論文 参考訳(メタデータ) (2020-02-21T04:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。