論文の概要: Learning a Prior for Monte Carlo Search by Replaying Solutions to
Combinatorial Problems
- arxiv url: http://arxiv.org/abs/2401.10431v1
- Date: Fri, 19 Jan 2024 00:22:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 17:21:30.854542
- Title: Learning a Prior for Monte Carlo Search by Replaying Solutions to
Combinatorial Problems
- Title(参考訳): 組合せ問題に対する解の再生によるモンテカルロ探索の事前学習
- Authors: Tristan Cazenave
- Abstract要約: 本稿では,前者を自動的に計算する手法を提案する。
これは、プレイアウト時に計算コストを伴わない単純で一般的な方法である。
この方法は、ラテンスクエアコンプリート、カクロ、逆RNAフォールディングの3つの難しい問題に適用される。
- 参考スコア(独自算出の注目度): 4.561007128508218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monte Carlo Search gives excellent results in multiple difficult
combinatorial problems. Using a prior to perform non uniform playouts during
the search improves a lot the results compared to uniform playouts. Handmade
heuristics tailored to the combinatorial problem are often used as priors. We
propose a method to automatically compute a prior. It uses statistics on solved
problems. It is a simple and general method that incurs no computational cost
at playout time and that brings large performance gains. The method is applied
to three difficult combinatorial problems: Latin Square Completion, Kakuro, and
Inverse RNA Folding.
- Abstract(参考訳): モンテカルロ探索は、複数の難しい組合せ問題に優れた結果を与える。
検索中に前者が非一様プレイアウトを行うと、一様プレイアウトに比べて多くの結果が改善される。
組み合わせ問題に適した手作りヒューリスティックは、しばしば先行として使用される。
本稿では,事前計算を自動的に行う手法を提案する。
解決された問題の統計を利用する。
これは、プレイアウト時に計算コストを伴わず、大きなパフォーマンス向上をもたらす単純で一般的な方法である。
この方法は、ラテンスクエアコンプリート、カクロ、逆RNAフォールディングの3つの難しい組み合わせ問題に適用される。
関連論文リスト
- Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - AlphaMapleSAT: An MCTS-based Cube-and-Conquer SAT Solver for Hard
Combinatorial Problems [13.450216199781671]
本稿では,新しいモンテカルロ木探索法であるAlphaMapleSATを紹介する。
対照的に、我々の重要な革新は、演能的に駆動されるMCTSベースのルックアヘッドキューブ技術であり、効率的な立方体を見つけるためにより深い探索を行う。
論文 参考訳(メタデータ) (2024-01-24T19:37:10Z) - Solving a Class of Non-Convex Minimax Optimization in Federated Learning [84.98927714326908]
ミニマックス問題は、機械学習のトレーニングから大規模学習まで、機械学習アプリケーション全体にわたって発生する。
本稿では,非ミニマックス問題 (emphi) に対するアルゴリズムのクラスを提案し,複雑性を$varepsilon-6)$に減らした。
我々は、FedSGDA-Mが$O(kappa2-3)$と$O(kappa2-3)$の最もよく知られた通信量を持つことを示す。
論文 参考訳(メタデータ) (2023-10-05T15:48:41Z) - An AlphaZero-Inspired Approach to Solving Search Problems [63.24965775030674]
探索問題を解くためにAlphaZeroで使用される手法と手法を適応する。
本稿では,簡単な解法と自己還元という観点から表現できる可能性について述べる。
また,探索問題に適応したモンテカルロ木探索法についても述べる。
論文 参考訳(メタデータ) (2022-07-02T23:39:45Z) - Learning Best Combination for Efficient N:M Sparsity [75.34103761423803]
N:M学習は自然に有限コレクション内で最高の組み合わせを求める問題として特徴づけられる。
学習の最良の組み合わせ (LBC) は, 様々なネットワークにおいて, 市販のN:Mスポーサリティ手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-06-14T07:51:31Z) - The Machine Learning for Combinatorial Optimization Competition (ML4CO):
Results and Insights [59.93939636422896]
ML4COは、キーコンポーネントを置き換えることで最先端の最適化問題を解決することを目的としている。
このコンペティションでは、最高の実現可能なソリューションを見つけること、最も厳密な最適性証明書を生成すること、適切なルーティング設定を提供すること、という3つの課題があった。
論文 参考訳(メタデータ) (2022-03-04T17:06:00Z) - SOLO: Search Online, Learn Offline for Combinatorial Optimization
Problems [4.777801093677586]
我々は,機械スケジューリングやルーティング,割当てといった実世界のアプリケーションで問題を研究する。
RL(Reinforcement Learning)とプランニングを組み合わせた手法を提案する。
この方法は、オフラインでも、オンラインでも、問題のコンポーネントが事前に分かっておらず、むしろ意思決定プロセス中に現れるような、問題の変種にも等しく適用することができる。
論文 参考訳(メタデータ) (2021-04-04T17:12:24Z) - Zero Training Overhead Portfolios for Learning to Solve Combinatorial
Problems [21.411742165753456]
ZTopは、シンプルなが効果的なモデル選択と、問題を解決するための学習のためのアンサンブル機構である。
ZToppingは、ZTopアンサンブル戦略と与えられたディープラーニングアプローチを用いて、現在最先端のディープラーニングアプローチの性能を大幅に向上させる方法を示している。
論文 参考訳(メタデータ) (2021-02-05T05:23:26Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Exploring search space trees using an adapted version of Monte Carlo
tree search for combinatorial optimization problems [0.6882042556551609]
このアプローチでは,問題インスタンスの探索空間木を探索するアルゴリズムを用いる。
このアルゴリズムはモンテカルロ木探索(Monte Carlo tree search)をベースとしている。
論文 参考訳(メタデータ) (2020-10-22T08:33:58Z) - Curriculum learning for multilevel budgeted combinatorial problems [7.804994311050265]
マルチレベル最適化問題はそれらの一般化であり、複数のプレイヤーが逐次決定を下す状況を含んでいる。
グラフ上のゼロサムゲームにおいて、2人のプレイヤーが関与する多段階の予算問題を解決するための価値ベース手法を考案する。
我々のフレームワークは単純なカリキュラムに基づいており、もしエージェントが$B$までの予算を持つインスタンスの価値を見積もる方法を知っているなら、可能なすべての余剰状態の方向に関係なく、予算が$B+1$のインスタンスを時間内に解決することができる。
論文 参考訳(メタデータ) (2020-07-07T01:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。