論文の概要: Checkmating One, by Using Many: Combining Mixture of Experts with MCTS to Improve in Chess
- arxiv url: http://arxiv.org/abs/2401.16852v3
- Date: Tue, 17 Jun 2025 15:05:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 19:48:47.194286
- Title: Checkmating One, by Using Many: Combining Mixture of Experts with MCTS to Improve in Chess
- Title(参考訳): 専門家とMCTSの混在によるチェスの改善
- Authors: Felix Helfenstein, Johannes Czech, Jannis Blüml, Max Eisel, Kristian Kersting,
- Abstract要約: ゲームフェーズに基づいて戦略を動的に適応するモジュール型フレームワークであるM2CTSを紹介する。
各フェーズでトレーニングされた特殊なニューラルネットワークを通じて決定をルーティングすることで、M2CTSは計算効率と演奏強度の両方を改善する。
チェスの実験では、M2CTSは標準の単一モデルベースラインよりも最大+122 Eloを達成する。
- 参考スコア(独自算出の注目度): 17.101742121345648
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In games like chess, strategy evolves dramatically across distinct phases - the opening, middlegame, and endgame each demand different forms of reasoning and decision-making. Yet, many modern chess engines rely on a single neural network to play the entire game uniformly, often missing opportunities to specialize. In this work, we introduce M2CTS, a modular framework that combines Mixture of Experts with Monte Carlo Tree Search to adapt strategy dynamically based on game phase. We explore three different methods for training the neural networks: Separated Learning, Staged Learning, and Weighted Learning. By routing decisions through specialized neural networks trained for each phase, M2CTS improves both computational efficiency and playing strength. In experiments on chess, M2CTS achieves up to +122 Elo over standard single-model baselines and shows promising generalization to multi-agent domains such as Pommerman. These results highlight how modular, phase-aware systems can better align with the structured nature of games and move us closer to human-like behavior in dividing a problem into many smaller units.
- Abstract(参考訳): チェスのようなゲームでは、戦略は異なるフェーズ – オープニング、ミドルゲーム、エンドゲーム – にわたって劇的に進化する。
しかし、現代のチェスエンジンの多くは、ゲーム全体を均一にプレイするために単一のニューラルネットワークに依存しており、しばしば専門化の機会を欠いている。
本研究では,M2CTSを導入する。M2CTSは,M2CTSとMonte Carlo Tree Searchを組み合わせたモジュール型フレームワークで,ゲームフェーズに基づいて動的に戦略を適応する。
ニューラルネットワークのトレーニングには,分離学習,段階学習,重み付き学習という,3つの異なる方法を検討する。
各フェーズでトレーニングされた特殊なニューラルネットワークを通じて決定をルーティングすることで、M2CTSは計算効率と演奏強度の両方を改善する。
チェスの実験では、M2CTSは標準の単一モデルベースラインよりも最大+122 Eloを実現し、ポンマーマンのようなマルチエージェントドメインへの有望な一般化を示す。
これらの結果は、モジュラーでフェーズ対応のシステムが、ゲームの構造化された性質とよりよく一致し、問題を小さなユニットに分割するときに、人間のような振る舞いに近づきつつあることを強調している。
関連論文リスト
- High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。
具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。
2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-09-10T08:04:11Z) - Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.85448576746373]
本稿では,モデルのパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。
提案手法の有効性を3つの最先端MoEアーキテクチャを用いて検証する。
評価の結果,本手法は自然言語タスクにおいて,他のモデルプルーニング手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-07-12T17:25:02Z) - Noise-powered Multi-modal Knowledge Graph Representation Framework [52.95468915728721]
マルチモーダル・プレトレーニングの台頭は、統合されたマルチモーダル知識グラフ表現学習フレームワークの必要性を強調している。
モードレベルのノイズマスキングを備えたトランスフォーマーアーキテクチャを用いた新しいSNAG手法を提案する。
提案手法は10個のデータセットにまたがってSOTA性能を実現し,その汎用性を実証する。
論文 参考訳(メタデータ) (2024-03-11T15:48:43Z) - Personalizing Federated Learning with Over-the-Air Computations [84.8089761800994]
フェデレートされたエッジ学習は、プライバシー保護の方法で無線ネットワークのエッジにインテリジェンスをデプロイする、有望な技術である。
このような設定の下で、複数のクライアントは、エッジサーバの調整の下でグローバルジェネリックモデルを協調的にトレーニングする。
本稿では,アナログオーバー・ザ・エア計算を用いて通信ボトルネックに対処する分散トレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-24T08:41:19Z) - An Expectation-Maximization Perspective on Federated Learning [75.67515842938299]
フェデレーション学習は、データをデバイス上でプライベートにしながら、複数のクライアントにわたるモデルの分散トレーニングを記述する。
本稿では,サーバがクライアント固有のモデルパラメータに対して事前分布のパラメータを提供する階層的潜在変数モデルとして,サーバが設定したフェデレーション学習プロセスについて考察する。
我々は,単純なガウス先行とよく知られた期待最大化(EM)アルゴリズムのハードバージョンを用いて,そのようなモデルの学習は,フェデレーション学習環境における最も一般的なアルゴリズムであるFedAvgに対応することを示す。
論文 参考訳(メタデータ) (2021-11-19T12:58:59Z) - An Approach for Combining Multimodal Fusion and Neural Architecture
Search Applied to Knowledge Tracing [6.540879944736641]
本稿では,マルチモーダル融合とニューラルアーキテクチャ探索を組み合わせた逐次モデルに基づく最適化手法を提案する。
得られたモデルが優れた性能を達成できることを示す2つの公開実データに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2021-11-08T13:43:46Z) - Mixture of ELM based experts with trainable gating network [2.320417845168326]
本研究では,専門家の混在に基づくアンサンブル学習手法を提案する。
MEの構造は、ベースエキスパートとゲーティングネットワークとして多層パーセプトロン(MLP)から構成される。
提案手法では,訓練可能なゲーティングネットワークを用いて専門家の出力を集約する。
論文 参考訳(メタデータ) (2021-05-25T07:13:35Z) - Model-Based Machine Learning for Communications [110.47840878388453]
モデルベースのアルゴリズムと機械学習をハイレベルな視点で組み合わせるための既存の戦略を見直します。
通信受信機の基本的なタスクの一つであるシンボル検出に注目する。
論文 参考訳(メタデータ) (2021-01-12T19:55:34Z) - Nested Mixture of Experts: Cooperative and Competitive Learning of
Hybrid Dynamical System [2.055949720959582]
ハイブリッド力学系を表現・学習するためのNMOE(Nested Mixed Expert)を提案する。
NMOEは、バイアス分散トレードオフを最適化しながら、ホワイトボックスモデルとブラックボックスモデルを組み合わせる。
NMOEは、アソシエイトの専門家を協調的または競争的に訓練することにより、様々な種類の事前知識を統合するための構造化された方法を提供する。
論文 参考訳(メタデータ) (2020-11-20T19:36:45Z) - Reinforcement Learning for Variable Selection in a Branch and Bound
Algorithm [0.10499611180329801]
現実世界のインスタンスのパターンを活用して、与えられた問題に最適化された新しいブランチ戦略をスクラッチから学習します。
本稿では,この課題に特化して設計された新しい強化学習手法であるFMSTSを提案する。
論文 参考訳(メタデータ) (2020-05-20T13:15:48Z) - Unpaired Multi-modal Segmentation via Knowledge Distillation [77.39798870702174]
本稿では,不対向画像分割のための新しい学習手法を提案する。
提案手法では,CTおよびMRI間での畳み込みカーネルの共有により,ネットワークパラメータを多用する。
我々は2つの多クラスセグメンテーション問題に対するアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2020-01-06T20:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。