論文の概要: Strongly Solving $7 \times 6$ Connect-Four on Consumer Grade Hardware
- arxiv url: http://arxiv.org/abs/2507.05267v1
- Date: Tue, 01 Jul 2025 09:33:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.163794
- Title: Strongly Solving $7 \times 6$ Connect-Four on Consumer Grade Hardware
- Title(参考訳): 7ドル(約7,800円)の「コネクテッドファーム」を消費者製品に強固に解決
- Authors: Markus Böck,
- Abstract要約: 本稿では,二項決定図に基づく記号探索法を再検討し,強力な解を求める。
128GBのメインメモリを持つ単一のCPUコア上で、47時間で89.6GBの大型ルックアップテーブルを作成できたのです。
この勝敗評価に加えて、オープンソースアーティファクトにアルファベータ検索を組み込んで、最も早い勝敗または最も遅い損失を達成する動きを見つけます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While the game Connect-Four has been solved mathematically and the best move can be effectively computed with search based methods, a strong solution in the form of a look-up table was believed to be infeasible. In this paper, we revisit a symbolic search method based on binary decision diagrams to produce strong solutions. With our efficient implementation we were able to produce a 89.6 GB large look-up table in 47 hours on a single CPU core with 128 GB main memory for the standard $7 \times 6$ board size. In addition to this win-draw-loss evaluation, we include an alpha-beta search in our open source artifact to find the move which achieves the fastest win or slowest loss.
- Abstract(参考訳): Connect-Four というゲームは数学的に解き、検索ベースの手法で最良の動きを効果的に計算できるが、ルックアップテーブルの形の強い解は実現不可能であると信じられていた。
本稿では,二項決定図に基づく記号探索法を再検討し,強力な解を求める。
効率的な実装により、128GBのメインメモリを持つ1つのCPUコア上で、89.6GBの大規模なルックアップテーブルを47時間で作成することができました。
この勝敗評価に加えて、オープンソースアーティファクトにアルファベータ検索を組み込んで、最も早い勝敗または最も遅い損失を達成する動きを見つけます。
関連論文リスト
- A*-Thought: Efficient Reasoning via Bidirectional Compression for Low-Resource Settings [64.36404136352287]
A*-Thoughtは、最も本質的な思考を識別し、分離するために設計された効率的なツリー検索ベースの統合フレームワークである。
LRMの推論過程を探索木として定式化し、各ノードは巨大な推論空間における推論スパンを表す。
低予算でQwQ-32Bを2.39$times$で改善し、高予算で出力トークンの長さを50%近く削減できる。
論文 参考訳(メタデータ) (2025-05-30T12:58:34Z) - A Machine Learning Approach That Beats Large Rubik's Cubes [32.8176720435354]
本稿では,非常に大きなグラフ上でのパスフィニング問題に対する,機械学習に基づく新しいアプローチを提案する。
4x4x4 と 5x5x5 のルービック立方体に対する解を見つけることで、その効率性を実証する。
論文 参考訳(メタデータ) (2025-02-18T20:22:38Z) - HashAttention: Semantic Sparsity for Faster Inference [95.31739930718116]
本稿では,HashAttention,framing pivotal token Identificationを推薦問題として紹介する。
トークン1個あたり32ビットの補助メモリしか必要とせず、最小品質の損失を最小限に抑えられるため、最大16タイムで使用されるトークンを削減できる。
A100 GPUでは、HashAttentionを組み込むことで、GPT-FASTで4.3times$、FlashDecodeで2.54times$、GPT-FASTで最大3.12times$高スループットを実現している。
論文 参考訳(メタデータ) (2024-12-19T02:34:15Z) - Set-Based Retrograde Analysis: Precomputing the Solution to 24-card Bridge Double Dummy Deals [11.732829185059801]
逆行解析はゲーム終了時の状態を解くためにゲームプレイングプログラムで使用される。
我々は,同じゲーム値を持つ状態の集合を演算することで,同じ結果が得られるセログレード解析を導入する。
論文 参考訳(メタデータ) (2024-11-13T23:43:01Z) - Navigating the Labyrinth: Evaluating and Enhancing LLMs' Ability to Reason About Search Problems [59.72548591120689]
我々は,11種類の検索問題を含む新しいベンチマークであるSearchBenchを紹介する。
もっとも先進的なLCMでさえ、これらの問題をエンドツーエンドのテキストで解決することができないことを示す。
LLMにその問題を解決するコードを生成するように指示することは助けになるが、GPT4のパフォーマンスは11.7%向上した。
論文 参考訳(メタデータ) (2024-06-18T00:44:58Z) - Efficient Solution of Point-Line Absolute Pose [52.775981113238046]
点や線である可能性のある特徴間の3D--2D対応に基づくポーズ推定の特定の問題を再検討する。
得られた解法は数値的に安定かつ高速であることを示す。
論文 参考訳(メタデータ) (2024-04-25T12:09:16Z) - On Solving the Rubik's Cube with Domain-Independent Planners Using
Standard Representations [7.470087627607195]
本稿では,人気のあるPDDL言語における最初のルービックキューブ表現について述べる。
1つの比較実験で、DeepCubeAは様々な複雑さを持つ全ての問題を解き、78.5%しか最適計画ではないことがわかった。
我々の研究は、表現的選択と計画最適性の間のトレードオフに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-07-25T14:52:23Z) - Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement [50.62461749446111]
Self-Polish(SP)は、与えられた問題を徐々に洗練し、より理解しやすく解けるように誘導することによって、モデルの推論を促進する新しい方法である。
SPは、CoTのような答え/推論サイドの他のすべてのプロンプトメソッドであり、最先端の技術とのシームレスな統合を可能にし、さらなる改善を可能にします。
論文 参考訳(メタデータ) (2023-05-23T19:58:30Z) - Matrix Multiplication: Verifying Strong Uniquely Solvable Puzzles [0.5801044612920816]
我々は、一意に解けるパズル(強いUSP)と呼ばれる物体を探索する
我々は、幅$k le 5$の強いUSPの最大サイズに関する厳密な境界を作り、従来の作業よりも大きい小さな幅のパズルを構築し、$k le 12$の強いUSPサイズの上限を改善する。
論文 参考訳(メタデータ) (2022-12-30T23:53:51Z) - Spending Thinking Time Wisely: Accelerating MCTS with Virtual Expansions [89.89612827542972]
本稿では,モンテカルロ木探索 (MCTS) の変種を提案する。
9倍のGoボードゲームとAtariゲームの性能と計算結果を評価した。
実験の結果,提案手法は,平均検索時間50%以下で,元の検索アルゴリズムに匹敵する性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-10-23T06:39:20Z) - Multi-objective Recurrent Neural Networks Optimization for the Edge -- a
Quantization-based Approach [2.1987431057890467]
本稿では,Multi-Objective Hardware-Aware Quantization (MOHAQ)法を紹介する。
本研究では,検索空間内でのみ選択された解を学習し,ビーコンとして利用し,他の解に対する再学習の効果を知るための「ビーコンベース検索」という検索手法を提案する。
論文 参考訳(メタデータ) (2021-08-02T22:09:12Z) - Self-Supervision is All You Need for Solving Rubik's Cube [0.0]
この研究は、ルービックキューブで表される、あらかじめ定義されたゴールで問題を解決するためのシンプルで効率的なディープラーニング手法を導入する。
このような問題に対して、目標状態から分岐するランダムスクランブル上でディープニューラルネットワークをトレーニングすることは、ほぼ最適解を達成するのに十分であることを示す。
論文 参考訳(メタデータ) (2021-06-06T15:38:50Z) - Prioritized Architecture Sampling with Monto-Carlo Tree Search [54.72096546595955]
ワンショットニューラルアーキテクチャサーチ(NAS)法は,検索空間全体を1つのネットワークとして考えることにより,検索コストを大幅に削減する。
本稿では,モンテカルロ木(MCT)をモデルとした探索空間を用いたモンテカルロ木探索(MCTS)に基づくサンプリング戦略について紹介する。
公平な比較のために、CIFAR-10で評価されたマクロ検索空間、すなわちNAS-Bench-MacroのオープンソースNASベンチマークを構築する。
論文 参考訳(メタデータ) (2021-03-22T15:09:29Z) - Towards Improving the Consistency, Efficiency, and Flexibility of
Differentiable Neural Architecture Search [84.4140192638394]
最も微分可能なニューラルアーキテクチャ探索法は、探索用のスーパーネットを構築し、そのサブグラフとしてターゲットネットを導出する。
本稿では,エンジンセルとトランジットセルからなるEnTranNASを紹介する。
また,検索処理の高速化を図るため,メモリや計算コストの削減も図っている。
論文 参考訳(メタデータ) (2021-01-27T12:16:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。