論文の概要: Blending Dynamic Programming with Monte Carlo Simulation for Bounding
the Running Time of Evolutionary Algorithms
- arxiv url: http://arxiv.org/abs/2102.11461v1
- Date: Tue, 23 Feb 2021 02:23:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 03:48:15.424684
- Title: Blending Dynamic Programming with Monte Carlo Simulation for Bounding
the Running Time of Evolutionary Algorithms
- Title(参考訳): 進化アルゴリズムの実行時間制限のためのモンテカルロシミュレーションと動的プログラミングのブレンド
- Authors: Kirill Antonov, Maxim Buzdalov, Arina Buzdalova, Carola Doerr
- Abstract要約: 本稿では,最適な実行時間と最適パラメータ選択から逸脱した場合の後悔値を算出する動的プログラミング手法を提案する。
筆者らのハイブリッド型モンテカルロ動的プログラミング手法をジャンプ関数に適用し,パラメータ制御スキームをより深く理解するために得られた境界値をどのように利用できるかを実証する。
- 参考スコア(独自算出の注目度): 0.8258451067861933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the goal to provide absolute lower bounds for the best possible running
times that can be achieved by $(1+\lambda)$-type search heuristics on common
benchmark problems, we recently suggested a dynamic programming approach that
computes optimal expected running times and the regret values inferred when
deviating from the optimal parameter choice.
Our previous work is restricted to problems for which transition
probabilities between different states can be expressed by relatively simple
mathematical expressions. With the goal to cover broader sets of problems, we
suggest in this work an extension of the dynamic programming approach to
settings in which the transition probabilities cannot necessarily be computed
exactly, but in which they can be approximated numerically, up to arbitrary
precision, by Monte Carlo sampling.
We apply our hybrid Monte Carlo dynamic programming approach to a
concatenated jump function and demonstrate how the obtained bounds can be used
to gain a deeper understanding into parameter control schemes.
- Abstract(参考訳): 共通ベンチマーク問題に対する$(1+\lambda)$-type検索ヒューリスティックによって達成可能な最良実行時間に対して絶対下限を提供することを目的として,我々は最近,最適実行時間と最適パラメータ選択から逸脱した場合に推定される後悔値を計算する動的プログラミング手法を提案した。
我々の以前の研究は、異なる状態間の遷移確率が比較的単純な数学的表現で表現できる問題に限定されている。
本研究では、より広い問題集合をカバーすることを目的として、遷移確率を必ずしも正確に計算することはできないが、モンテカルロサンプリングにより任意の精度まで数値的に近似できる設定への動的プログラミングアプローチの拡張を提案する。
ハイブリッドなモンテカルロ動的プログラミング手法を連結ジャンプ関数に適用し,パラメータ制御スキームをより深く理解するために得られた境界をどのように利用できるかを示す。
関連論文リスト
- Global Optimization of Gaussian Process Acquisition Functions Using a Piecewise-Linear Kernel Approximation [2.3342885570554652]
本稿では,プロセスカーネルに対する一括近似と,取得関数に対するMIQP表現を紹介する。
我々は,合成関数,制約付きベンチマーク,ハイパーチューニングタスクに関するフレームワークを実証的に実証した。
論文 参考訳(メタデータ) (2024-10-22T10:56:52Z) - Fast, Scalable, Warm-Start Semidefinite Programming with Spectral
Bundling and Sketching [53.91395791840179]
我々は、大規模なSDPを解くための、証明可能な正確で高速でスケーラブルなアルゴリズムであるUnified Spectral Bundling with Sketching (USBS)を提案する。
USBSは、20億以上の決定変数を持つインスタンス上で、最先端のスケーラブルなSDP解決器よりも500倍のスピードアップを提供する。
論文 参考訳(メタデータ) (2023-12-19T02:27:22Z) - Smoothing Methods for Automatic Differentiation Across Conditional
Branches [0.0]
スムース解釈(SI)は、プログラムの出力とガウス核との畳み込みを近似し、原理的にその出力を滑らかにする。
SIと自動微分(AD)を組み合わせることで、スムーズなプログラムの勾配を効率的に計算する。
本稿では,ADとサンプリングを組み合わせたスムーズなプログラムの勾配を推定することにより,基礎となる仮定を回避する新しいモンテカルロ推定法を提案する。
論文 参考訳(メタデータ) (2023-10-05T15:08:37Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Efficient Global Planning in Large MDPs via Stochastic Primal-Dual
Optimization [12.411844611718958]
提案手法は, 生成モデルに対する多数のクエリの後に, ほぼ最適ポリシーを出力することを示す。
提案手法は計算効率が高く,低次元パラメータベクトルでコンパクトに表現される単一のソフトマックスポリシーを出力する点が大きな利点である。
論文 参考訳(メタデータ) (2022-10-21T15:49:20Z) - Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time
Guarantees [56.848265937921354]
逆強化学習(IRL)は報酬関数と関連する最適ポリシーを回復することを目的としている。
IRLの多くのアルゴリズムは本質的にネスト構造を持つ。
我々は、報酬推定精度を損なわないIRLのための新しいシングルループアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T17:13:45Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Bayesian Sparse learning with preconditioned stochastic gradient MCMC
and its applications [5.660384137948734]
提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束する。
提案アルゴリズムは, 温和な条件下で, 制御可能なバイアスで正しい分布に収束可能であることを示す。
論文 参考訳(メタデータ) (2020-06-29T20:57:20Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z) - Global Optimization of Gaussian processes [52.77024349608834]
少数のデータポイントで学習したガウス過程を訓練した空間定式化を提案する。
このアプローチはまた、より小さく、計算的にもより安価なサブソルバを低いバウンディングに導く。
提案手法の順序の順序による時間収束を,総じて低減する。
論文 参考訳(メタデータ) (2020-05-21T20:59:11Z) - Deep combinatorial optimisation for optimal stopping time problems :
application to swing options pricing [0.0]
ニューラルネットワークと離散確率変数のランダム化を用いた新しい計算制御法を提案し, 最適停止時間問題に適用した。
提案アルゴリズムは、古典的アルゴリズムでは不可能なような、高次元のアメリカンとスイングのオプションを妥当な時間で価格設定することに成功している。
論文 参考訳(メタデータ) (2020-01-30T10:39:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。