論文の概要: XQSV: A Structurally Variable Network to Imitate Human Play in Xiangqi
- arxiv url: http://arxiv.org/abs/2407.04678v1
- Date: Fri, 5 Jul 2024 17:43:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 12:31:56.275748
- Title: XQSV: A Structurally Variable Network to Imitate Human Play in Xiangqi
- Title(参考訳): XQSV:Xiangqiにおける人間の遊びを省略する構造可変ネットワーク
- Authors: Chenliang Zhou,
- Abstract要約: 我々はXiangqi Structurely Variable (XQSV)と呼ばれる革新的なディープラーニングアーキテクチャを導入する。
XQSVは、Xiangqi(中国チェス)における人間のプレイヤーの行動パターンをエミュレートするように設計されている。
予測精度は約40%に達し、その性能は訓練されたエロ範囲内でピークに達する。
- 参考スコア(独自算出の注目度): 0.4195815757060372
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we introduce an innovative deep learning architecture, termed Xiangqi Structurally Variable (XQSV), designed to emulate the behavioral patterns of human players in Xiangqi, or Chinese Chess. The unique attribute of XQSV is its capacity to alter its structural configuration dynamically, optimizing performance for the task based on the particular subset of data on which it is trained. We have incorporated several design improvements to significantly enhance the network's predictive accuracy, including a local illegal move filter, an Elo range partitioning, a sequential one-dimensional input, and a simulation of imperfect memory capacity. Empirical evaluations reveal that XQSV attains a predictive accuracy of approximately 40%, with its performance peaking within the trained Elo range. This indicates the model's success in mimicking the play behavior of individuals within that specific range. A three-terminal Turing Test was employed to demonstrate that the XQSV model imitates human behavior more accurately than conventional Xiangqi engines, rendering it indistinguishable from actual human opponents. Given the inherent nondeterminism in human gameplay, we propose two supplementary relaxed evaluation metrics. To our knowledge, XQSV represents the first model to mimic Xiangqi players.
- Abstract(参考訳): 本稿では、Xiangqi Structurely Variable (XQSV)と呼ばれる革新的なディープラーニングアーキテクチャを導入し、Xiangqi(中国チェス)における人間のプレイヤーの行動パターンをエミュレートする。
XQSVのユニークな特性は、その構造構成を動的に変更し、トレーニングされたデータの特定のサブセットに基づいてタスクのパフォーマンスを最適化する能力である。
我々は,ローカルな不正移動フィルタ,エロレンジ分割,逐次的な1次元入力,不完全なメモリ容量のシミュレーションなど,ネットワークの予測精度を大幅に向上させる設計上の改良を取り入れた。
実験的な評価により、XQSVは予測精度が約40%に達し、その性能は訓練されたエロ範囲内でピークに達することが判明した。
このことは、モデルが特定の範囲内での個人の遊び行動の模倣に成功したことを示している。
XQSVモデルは従来のXiangqiエンジンよりも正確に人間の行動を模倣し、実際の人間と区別できないことを示した。
人間のゲームプレイに固有の非決定性を考えると,2つの補足的緩和評価指標を提案する。
我々の知る限り、XQSVはXiangqiプレーヤーを模倣する最初のモデルである。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - X-HRNet: Towards Lightweight Human Pose Estimation with Spatially
Unidimensional Self-Attention [63.64944381130373]
特に, 主ポーズ推定法は, 2次元単一ピークヒートマップを用いて人間の関節を推定する。
本稿では,空間的一次元自己認識(SUSA)という軽量で強力な代替手段を,ポイントワイズ(1×1)の畳み込みに導入する。
我々のSUSAは、ポイントワイド(1x1)畳み込みの計算複雑性を、精度を犠牲にすることなく96%削減する。
論文 参考訳(メタデータ) (2023-10-12T05:33:25Z) - AlignDiff: Aligning Diverse Human Preferences via Behavior-Customisable
Diffusion Model [69.12623428463573]
AlignDiffは、人間の好みを定量化し、抽象性をカバーし、拡散計画をガイドする新しいフレームワークである。
ユーザがカスタマイズした動作と正確に一致し、効率的に切り替えることができます。
選好マッチング,スイッチング,カバーにおいて,他のベースラインに比べて優れた性能を示す。
論文 参考訳(メタデータ) (2023-10-03T13:53:08Z) - JiangJun: Mastering Xiangqi by Tackling Non-Transitivity in Two-Player
Zero-Sum Games [15.500508239382583]
本論文は,チェスや将具に匹敵するゲームツリーに匹敵する,中国の伝統的なボードゲームであるXiangqiに焦点を当てる。
我々は,モンテカルロ木探索 (MCTS) と政策空間応答オラクル (PSRO) の革新的な組み合わせであるジアンジュンアルゴリズムを導入し,ナッシュ均衡を近似した。
WeChatのミニプログラムを用いてアルゴリズムを実証的に評価し、人間プレイヤーに対する99.41%の勝利率でマスターレベルを達成する。
論文 参考訳(メタデータ) (2023-08-09T05:48:58Z) - Evolutionary quantum feature selection [0.0]
本研究では,量子回路進化(QCE)アルゴリズムを用いた量子特徴選択法(EQFS)を提案する。
提案手法は,浅部深度回路を用いてスパース確率分布を生成するQCEのユニークな機能を利用する。
計算実験により、EQFSは特徴数の2次スケーリングと良い特徴の組み合わせを識別できることを示した。
論文 参考訳(メタデータ) (2023-03-13T14:01:37Z) - Improving Bidding and Playing Strategies in the Trick-Taking game Wizard
using Deep Q-Networks [0.0]
別々の入札・プレイフェーズを持つトリックテイクゲームWizardは、2つのインターリーブされた部分的に観測可能なマルコフ決定プロセス(POMDP)によってモデル化される。
ディープQネットワークワークス(DQN)は、非定常環境の課題に対処できる自己改善エージェントの強化に使用される。
訓練されたDQNエージェントは、ランダムなベースラインと規則に基づく非対称性の両方を残して、自己プレイの66%から87%の精度を達成する。
論文 参考訳(メタデータ) (2022-05-27T08:59:42Z) - SQ-VAE: Variational Bayes on Discrete Representation with Self-annealed
Stochastic Quantization [13.075574481614478]
ベクトル量子化変分オートエンコーダ(VQ-VAE)の注目すべき問題は、学習された離散表現がコードブックの全容量のごく一部しか使用していないことである。
本稿では,新しい量子化法と量子化法により,標準VAEを拡張した新しいトレーニング手法を提案する。
実験の結果,SQ-VAEはコモンズを使わずにコードブックの利用を改善することがわかった。
論文 参考訳(メタデータ) (2022-05-16T09:49:37Z) - Counterfactual Samples Synthesizing and Training for Robust Visual
Question Answering [59.20766562530209]
VQAモデルは、トレーニングセットにおける表面的な言語的相関をキャプチャする傾向にある。
近年のVQA研究は、ターゲットとなるVQAモデルのトレーニングを規則化する補助的な質問専用モデルを導入している。
本稿では,新しいモデル非依存型対実サンプル合成訓練(CSST)戦略を提案する。
論文 参考訳(メタデータ) (2021-10-03T14:31:46Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Towards Explainable Exploratory Landscape Analysis: Extreme Feature
Selection for Classifying BBOB Functions [4.932130498861987]
驚くほど少数の機能(多くの場合4つ未満)が、98%の精度を達成するのに十分であることを示している。
分類精度は、いくつかのインスタンスがトレーニングやテストに関わっている設定に変換されることを示す。
論文 参考訳(メタデータ) (2021-02-01T10:04:28Z) - Robust Person Re-Identification through Contextual Mutual Boosting [77.1976737965566]
本研究では,歩行者の局地化を目的としたコンテキスト相互ブースティングネットワーク(CMBN)を提案する。
歩行者をローカライズし、文脈情報と統計的推測を効果的に活用することで特徴を再検討する。
ベンチマークの実験は、最先端のアーキテクチャと比較してアーキテクチャの優位性を示している。
論文 参考訳(メタデータ) (2020-09-16T06:33:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。