論文の概要: Online Optimization and Learning in Uncertain Dynamical Environments
with Performance Guarantees
- arxiv url: http://arxiv.org/abs/2102.09111v1
- Date: Thu, 18 Feb 2021 01:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:22:26.136539
- Title: Online Optimization and Learning in Uncertain Dynamical Environments
with Performance Guarantees
- Title(参考訳): パフォーマンス保証付き不確定な動的環境におけるオンライン最適化と学習
- Authors: Dan Li, Dariush Fooladivanda, Sonia Martinez
- Abstract要約: 未知かつ不確実な動的環境におけるオンライン最適化と学習問題を解決するための新しいフレームワークを提案する。
このフレームワークは、オンラインの決定を定量的に堅牢にしながら、不確実な動的環境を同時に学ぶことができます。
- 参考スコア(独自算出の注目度): 2.729854122688235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new framework to solve online optimization and learning problems
in unknown and uncertain dynamical environments. This framework enables us to
simultaneously learn the uncertain dynamical environment while making online
decisions in a quantifiably robust manner. The main technical approach relies
on the theory of distributional robust optimization that leverages adaptive
probabilistic ambiguity sets. However, as defined, the ambiguity set usually
leads to online intractable problems, and the first part of our work is
directed to find reformulations in the form of online convex problems for two
sub-classes of objective functions. To solve the resulting problems in the
proposed framework, we further introduce an online version of the Nesterov
accelerated-gradient algorithm. We determine how the proposed solution system
achieves a probabilistic regret bound under certain conditions. Two
applications illustrate the applicability of the proposed framework.
- Abstract(参考訳): 未知かつ不確実な動的環境におけるオンライン最適化と学習問題を解決するための新しいフレームワークを提案する。
このフレームワークは、オンラインの決定を定量的に堅牢にしながら、不確実な動的環境を同時に学ぶことができます。
主な技術的アプローチは、適応確率的あいまいさ集合を利用する分布的ロバスト最適化の理論に依存する。
しかし、定義されているように、あいまいさセットは通常、オンラインの難解な問題につながり、私たちの仕事の最初の部分は、客観的関数の2つのサブクラスのためのオンライン凸問題の形で改革を見つけるように指示されています。
提案手法の問題点を解決するため,NesterovAccelered-gradientアルゴリズムのオンライン版をさらに導入する。
提案手法は, ある条件下での確率的後悔をいかに達成するかを決定する。
提案フレームワークの適用性を示す2つのアプリケーションがある。
関連論文リスト
- Predict-Then-Optimize by Proxy: Learning Joint Models of Prediction and
Optimization [59.386153202037086]
Predict-Then-フレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
このアプローチは非効率であり、最適化ステップを通じてバックプロパゲーションのための手作りの、問題固有のルールを必要とする。
本稿では,予測モデルを用いて観測可能な特徴から最適解を直接学習する手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T01:32:06Z) - A Robust Policy Bootstrapping Algorithm for Multi-objective
Reinforcement Learning in Non-stationary Environments [15.794728813746397]
多目的強化学習法は、多目的最適化手法で強化学習パラダイムを融合させる。
これらの方法の大きな欠点の1つは、環境における非定常力学への適応性の欠如である。
本研究では,非定常環境において,凸カバレッジの集合をオンライン的に頑健に進化させることのできる,新しい多目的強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-18T02:15:12Z) - Universal Online Optimization in Dynamic Environments via Uniclass
Prediction [0.0]
動的環境におけるユニバーサルオンライン最適化のための新しい直感的なフレームワークを提案する。
私たちの戦略は、専門家のセットと付随するメタアルゴリズムの構築に依存していません。
これは、一般凸コスト関数に対しても、最先端の動的後悔保証を伴う普遍的アプローチを提案する最初の論文である。
論文 参考訳(メタデータ) (2023-02-13T03:00:45Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Introduction to Online Nonstochastic Control [65.18774760752588]
オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文 参考訳(メタデータ) (2022-11-17T16:12:45Z) - Grid-SiPhyR: An end-to-end learning to optimize framework for
combinatorial problems in power systems [0.0]
SiPhyRは物理インフォームド機械学習フレームワークで、エンドツーエンドの学習で問題解決を最適化する。
クリーンエネルギーシステムの新たなパラダイムにおけるSiPhyRの有効性を実証する。
論文 参考訳(メタデータ) (2022-06-11T16:06:36Z) - Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - Adaptivity and Non-stationarity: Problem-dependent Dynamic Regret for
Online Convex Optimization [93.71361250701075]
本稿では,スムーズさを生かし,問題依存量による動的後悔のT$への依存を補う新しいオンラインアルゴリズムを提案する。
この結果が本質的な難易度に適応するのは, 既往の結果よりも厳密であり, 最悪の場合, 同一の値が保証されるためである。
論文 参考訳(メタデータ) (2021-12-29T02:42:59Z) - A Surrogate Objective Framework for Prediction+Optimization with Soft
Constraints [29.962390392493507]
SPO+や直接最適化のような決定に焦点をあてた予測手法が、このギャップを埋めるために提案されている。
本稿では,実世界の線形および半定値負の二次計画問題に対して,解析的に微分可能な主観的フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-22T17:09:57Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。