論文の概要: Deep Synoptic Monte Carlo Planning in Reconnaissance Blind Chess
- arxiv url: http://arxiv.org/abs/2110.01810v1
- Date: Tue, 5 Oct 2021 03:58:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 14:23:21.253537
- Title: Deep Synoptic Monte Carlo Planning in Reconnaissance Blind Chess
- Title(参考訳): リコネッサンス・ブラインドチェスにおける深いシナプスモンテカルロ計画
- Authors: Gregory Clark (Google)
- Abstract要約: 本稿では,大容量不完全情報ゲームのためのDeep Synoptic Monte Carlo Planning(DSMCP)を紹介する。
アルゴリズムは、未重み付き粒子フィルタで信念状態を構築し、信念状態から始まるプレイアウトを計画する。
このアルゴリズムは、情報状態の新たな抽象化である「シナプス」を推論することで不確実性を説明できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces deep synoptic Monte Carlo planning (DSMCP) for large
imperfect information games. The algorithm constructs a belief state with an
unweighted particle filter and plans via playouts that start at samples drawn
from the belief state. The algorithm accounts for uncertainty by performing
inference on "synopses," a novel stochastic abstraction of information states.
DSMCP is the basis of the program Penumbra, which won the official 2020
reconnaissance blind chess competition versus 33 other programs. This paper
also evaluates algorithm variants that incorporate caution, paranoia, and a
novel bandit algorithm. Furthermore, it audits the synopsis features used in
Penumbra with per-bit saliency statistics.
- Abstract(参考訳): 本稿では,大規模情報ゲームのためのdsmcp(deep synoptic monte carlo planning)を提案する。
アルゴリズムは、無重み付き粒子フィルタで信念状態を構築し、信念状態から引き出されたサンプルから始まるプレイアウトを計画する。
このアルゴリズムは、情報状態の新しい確率的抽象化である「シナプス」を推論することで不確実性を説明できる。
DSMCPはPenumbraプログラムの基礎であり、2020年、33のプログラムに対して公式のブラインドチェス大会で優勝した。
本稿では,注意,パラノイア,新しいバンディットアルゴリズムを組み込んだアルゴリズムの変種について評価する。
さらに、penumbraで使用されているsynopsis機能と、ビット毎のsaliency統計を監査する。
関連論文リスト
- A Mirror Descent-Based Algorithm for Corruption-Tolerant Distributed Gradient Descent [57.64826450787237]
本研究では, 分散勾配降下アルゴリズムの挙動を, 敵対的腐敗の有無で解析する方法を示す。
汚職耐性の分散最適化アルゴリズムを設計するために、(怠慢な)ミラー降下からアイデアをどう使うかを示す。
MNISTデータセットの線形回帰、サポートベクトル分類、ソフトマックス分類に基づく実験は、我々の理論的知見を裏付けるものである。
論文 参考訳(メタデータ) (2024-07-19T08:29:12Z) - Contrastive Sparse Autoencoders for Interpreting Planning of Chess-Playing Agents [0.0]
本研究では,一対のゲームトラジェクトリを研究するために,CSAE(Sparse Autoencoder)を提案する。
CSAEを用いて,チェスエージェントの計画に意味のある概念を抽出し,解釈することができる。
論文 参考訳(メタデータ) (2024-06-06T12:57:31Z) - State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewards [18.0878149546412]
本論文は,前回腕を抜いた時から経過したラウンド数に依存する包帯の回復設定について考察する。
本稿では, ラウンドを状態として扱う状態分離SARSA(State-Separate SARSA)アルゴリズムという, この設定に適した新しい強化学習法を提案する。
論文 参考訳(メタデータ) (2024-03-18T07:14:21Z) - Sketch and shift: a robust decoder for compressive clustering [17.627195350266796]
圧縮学習は、大規模学習のメモリフットプリントを大幅に削減する、新たなアプローチである。
CL-OMPRよりも大幅に改善された代替デコーダを提案する。
提案アルゴリズムは,従来より10倍小さいMNISTデータセットのスケッチからクラスタリング情報を抽出することができる。
論文 参考訳(メタデータ) (2023-12-15T16:53:55Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Real-time AdaBoost cascade face tracker based on likelihood map and
optical flow [59.17685450892182]
著者らは、光学フロー情報をヴィオラ・ジョーンズ検出アルゴリズムの修正版に組み込む新しい顔追跡手法を提案する。
元のアルゴリズムでは、前のフレームからの情報が考慮されないため、検出は静的である。
提案したトラッカーは、各ウィンドウが通過する分類段階の数に関する情報を保存する。
論文 参考訳(メタデータ) (2022-10-25T10:15:07Z) - Content Popularity Prediction Based on Quantized Federated Bayesian
Learning in Fog Radio Access Networks [76.16527095195893]
キャッシュ可能なフォグラジオアクセスネットワーク(F-RAN)におけるコンテンツ人気予測問題について検討する。
そこで本研究では,コンテンツ要求パターンをモデル化するためのガウス過程に基づく回帰器を提案する。
我々はベイズ学習を利用してモデルパラメータを訓練する。
論文 参考訳(メタデータ) (2022-06-23T03:05:12Z) - Determining Chess Game State From an Image [19.06796946564999]
本稿では,既存のモデルよりも桁違いに大きい3次元モデルから合成した新しいデータセットについて述べる。
従来のコンピュータビジョン技術とディープラーニングを組み合わせた新しいエンドツーエンドチェス認識システムを紹介します。
記述されたシステムでは,テストセット上での誤差率は0.23%であり,現状の28倍である。
論文 参考訳(メタデータ) (2021-04-30T13:02:13Z) - Probabilistic Sequential Shrinking: A Best Arm Identification Algorithm
for Stochastic Bandits with Corruptions [91.8283876874947]
我々は,T段の固定予算設定において,敵対的腐敗を伴う連続的包帯に対する最適な腕識別(BAI)問題を考察した。
我々は, 汚職の量に依存しない新しいランダム化アルゴリズム, Probabilistic Shrinking($u$) (PSS($u$)) を設計する。
CPS が十分に大きいとき、BAI 確率を$Trightarrow infty$ として達成できるアルゴリズムは存在しない。
論文 参考訳(メタデータ) (2020-10-15T17:34:26Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。