論文の概要: Covariance Matrix Adaptation Evolutionary Strategy with Worst-Case
Ranking Approximation for Min--Max Optimization and its Application to
Berthing Control Tasks
- arxiv url: http://arxiv.org/abs/2303.16079v1
- Date: Tue, 28 Mar 2023 15:50:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 14:30:02.667869
- Title: Covariance Matrix Adaptation Evolutionary Strategy with Worst-Case
Ranking Approximation for Min--Max Optimization and its Application to
Berthing Control Tasks
- Title(参考訳): min-max最適化のための最悪ケースランキング近似を用いた共分散行列適応進化戦略とそのバーシング制御タスクへの応用
- Authors: Atsuhiro Miyagi and Yoshiki Miyauchi and Atsuo Maki and Kazuto Fukuchi
and Jun Sakuma and Youhei Akimoto
- Abstract要約: 我々は mathbbX max_y in mathbbYf(x,y)$ の連続 min-max 最適化問題 $min_x を考える。
最悪の対象関数である$F(x) = max_y f(x,y)$を直接最小化する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 19.263468901608785
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this study, we consider a continuous min--max optimization problem
$\min_{x \in \mathbb{X} \max_{y \in \mathbb{Y}}}f(x,y)$ whose objective
function is a black-box. We propose a novel approach to minimize the worst-case
objective function $F(x) = \max_{y} f(x,y)$ directly using a covariance matrix
adaptation evolution strategy (CMA-ES) in which the rankings of solution
candidates are approximated by our proposed worst-case ranking approximation
(WRA) mechanism. We develop two variants of WRA combined with CMA-ES and
approximate gradient ascent as numerical solvers for the inner maximization
problem. Numerical experiments show that our proposed approach outperforms
several existing approaches when the objective function is a smooth strongly
convex--concave function and the interaction between $x$ and $y$ is strong. We
investigate the advantages of the proposed approach for problems where the
objective function is not limited to smooth strongly convex--concave functions.
The effectiveness of the proposed approach is demonstrated in the robust
berthing control problem with uncertainty.ngly convex--concave functions. The
effectiveness of the proposed approach is demonstrated in the robust berthing
control problem with uncertainty.
- Abstract(参考訳): 本研究では,目的関数がブラックボックスである連続min-max最適化問題$\min_{x \in \mathbb{x} \max_{y \in \mathbb{y}}}f(x,y)$を考える。
本稿では,解候補のランク付けをWRA機構によって近似する共分散行列適応進化戦略(CMA-ES)を直接利用して,最悪の対象関数である$F(x) = \max_{y} f(x,y)$を最小化する新しい手法を提案する。
我々は,内部最大化問題に対する数値解法として,cma-esと組み合わせたwraと近似勾配上昇の2つの変種を開発した。
数値実験により,対象関数が滑らかな凸-凹関数であり,$x$と$y$の相互作用が強い場合,提案手法は既存手法よりも優れており,目的関数が滑らかな凸-凹関数に制限されない問題に対する提案手法の利点について検討する。
提案手法の有効性は不確実性を有する頑健なバーシング制御問題において実証される。
提案手法の有効性を不確実性のあるロバストなバーシング制御問題で実証した。
関連論文リスト
- Stochastic Inexact Augmented Lagrangian Method for Nonconvex Expectation
Constrained Optimization [88.0031283949404]
多くの実世界の問題は複雑な非機能的制約を持ち、多くのデータポイントを使用する。
提案手法は,従来最もよく知られた結果で既存手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-12-19T14:48:54Z) - Smoothing Policy Iteration for Zero-sum Markov Games [9.158672246275348]
ゼロサムMGの解法としてスムージングポリシロバストネス(SPI)アルゴリズムを提案する。
特に、対向ポリシーは、作用空間上の効率的なサンプリングを可能にする重み関数として機能する。
また,SPIを関数近似で拡張することにより,Smooth adversarial Actor-critic (SaAC) と呼ばれるモデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-03T14:39:06Z) - Black-Box Min--Max Continuous Optimization Using CMA-ES with Worst-case
Ranking Approximation [22.576922942465142]
一般的なアプローチでは、$x$と$y$を同時に、あるいは交互に更新する。
既存のアプローチは、$f$がリプシッツの滑らかで、最適解を囲む凸凸が強い場合失敗する。
本稿では、共分散行列適応進化戦略を用いて、最悪の対象関数 $F(x)=max_yf(x,y)$ を最小化することを提案する。
論文 参考訳(メタデータ) (2022-04-06T08:03:39Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z) - Coordinate Descent Methods for DC Minimization [12.284934135116515]
差分凸(英: difference-of-Convex、DC)とは、2つの凸関数の差を最小化する問題である。
本稿では,非次元の1次元サブプロブレムを世界規模で提案し,座標の定常点に収束することが保証される。
論文 参考訳(メタデータ) (2021-09-09T12:44:06Z) - Momentum Accelerates the Convergence of Stochastic AUPRC Maximization [80.8226518642952]
高精度リコール曲線(AUPRC)に基づく領域の最適化について検討し,不均衡なタスクに広く利用されている。
我々は、$O (1/epsilon4)$のより優れた反復による、$epsilon$定常解を見つけるための新しい運動量法を開発する。
また,O(1/epsilon4)$と同じ複雑さを持つ適応手法の新たなファミリを設計し,実際により高速な収束を享受する。
論文 参考訳(メタデータ) (2021-07-02T16:21:52Z) - Minimax Optimization with Smooth Algorithmic Adversaries [59.47122537182611]
対戦相手が展開するスムーズなアルゴリズムに対して,Min-playerの新しいアルゴリズムを提案する。
本アルゴリズムは,制限周期のない単調進行を保証し,適切な勾配上昇数を求める。
論文 参考訳(メタデータ) (2021-06-02T22:03:36Z) - Saddle Point Optimization with Approximate Minimization Oracle and its
Application to Robust Berthing Control [7.347989843033034]
本稿では,最小化問題を大まかに解決するオラクルのみに依存するサドル点最適化手法を提案する。
我々は、その収束特性を強い凸-凹問題で解析し、その線形収束性を大域的なmin-maxサドル点へ示す。
1+1)-CMA-ES を最小化オラクル、すなわち Adversarial-CMA-ES として開発した手法の実装は、テスト問題に対する既存のアプローチよりも優れている。
論文 参考訳(メタデータ) (2021-05-25T00:08:47Z) - Bayesian Optimization of Risk Measures [7.799648230758491]
我々は、$rho[F(x, W) ]$ という形の目的関数のベイズ最適化を考える。
目的関数の構造を利用してサンプリング効率を大幅に向上する新しいベイズ最適化アルゴリズム群を提案する。
論文 参考訳(メタデータ) (2020-07-10T18:20:46Z) - A Two-Timescale Framework for Bilevel Optimization: Complexity Analysis
and Application to Actor-Critic [142.1492359556374]
双レベル最適化は、2レベル構造を示す問題のクラスである。
このような二段階問題に対処するための2段階近似(TTSA)アルゴリズムを提案する。
本稿では,TTSAフレームワークの特殊な事例として,2段階の自然なアクター・クリティカルポリシー最適化アルゴリズムが有用であることを示す。
論文 参考訳(メタデータ) (2020-07-10T05:20:02Z) - Convergence of adaptive algorithms for weakly convex constrained
optimization [59.36386973876765]
モローエンベロープの勾配のノルムに対して$mathcaltilde O(t-1/4)$収束率を証明する。
我々の分析では、最小バッチサイズが1ドル、定数が1位と2位のモーメントパラメータが1ドル、そしておそらくスムーズな最適化ドメインで機能する。
論文 参考訳(メタデータ) (2020-06-11T17:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。