Fugu-MT 論文翻訳(概要): Online Optimization and Learning in Uncertain Dynamical Environments with Performance Guarantees

論文の概要: Online Optimization and Learning in Uncertain Dynamical Environments with Performance Guarantees

arxiv url: http://arxiv.org/abs/2102.09111v1
Date: Thu, 18 Feb 2021 01:49:06 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-19 14:22:26.136539
Title: Online Optimization and Learning in Uncertain Dynamical Environments with Performance Guarantees
Title（参考訳）: パフォーマンス保証付き不確定な動的環境におけるオンライン最適化と学習
Authors: Dan Li, Dariush Fooladivanda, Sonia Martinez
Abstract要約: 未知かつ不確実な動的環境におけるオンライン最適化と学習問題を解決するための新しいフレームワークを提案する。このフレームワークは、オンラインの決定を定量的に堅牢にしながら、不確実な動的環境を同時に学ぶことができます。
参考スコア（独自算出の注目度）: 2.729854122688235
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a new framework to solve online optimization and learning problems in unknown and uncertain dynamical environments. This framework enables us to simultaneously learn the uncertain dynamical environment while making online decisions in a quantifiably robust manner. The main technical approach relies on the theory of distributional robust optimization that leverages adaptive probabilistic ambiguity sets. However, as defined, the ambiguity set usually leads to online intractable problems, and the first part of our work is directed to find reformulations in the form of online convex problems for two sub-classes of objective functions. To solve the resulting problems in the proposed framework, we further introduce an online version of the Nesterov accelerated-gradient algorithm. We determine how the proposed solution system achieves a probabilistic regret bound under certain conditions. Two applications illustrate the applicability of the proposed framework.
Abstract（参考訳）: 未知かつ不確実な動的環境におけるオンライン最適化と学習問題を解決するための新しいフレームワークを提案する。このフレームワークは、オンラインの決定を定量的に堅牢にしながら、不確実な動的環境を同時に学ぶことができます。主な技術的アプローチは、適応確率的あいまいさ集合を利用する分布的ロバスト最適化の理論に依存する。しかし、定義されているように、あいまいさセットは通常、オンラインの難解な問題につながり、私たちの仕事の最初の部分は、客観的関数の2つのサブクラスのためのオンライン凸問題の形で改革を見つけるように指示されています。提案手法の問題点を解決するため,NesterovAccelered-gradientアルゴリズムのオンライン版をさらに導入する。提案手法は, ある条件下での確率的後悔をいかに達成するかを決定する。提案フレームワークの適用性を示す2つのアプリケーションがある。

関連論文リスト

A Deep Generative Learning Approach for Two-stage Adaptive Robust Optimization [3.124884279860061]
本稿では,2段階適応型ロバスト最適化のための逆生成を行う解アルゴリズムAGROを紹介する。 AGROは、同時に敵対的かつ現実的な高次元の一致を生成する。我々は、AGROが標準的なカラム・アンド・制約アルゴリズムを最大1.8%のプロダクション・ディストリビューション計画、最大11.6%の電力系統拡張で上回っていることを示す。
論文参考訳（メタデータ） (2024-09-05T17:42:19Z)
Two-Stage ML-Guided Decision Rules for Sequential Decision Making under Uncertainty [55.06411438416805]
SDMU (Sequential Decision Making Under Uncertainty) は、エネルギー、金融、サプライチェーンといった多くの領域において、ユビキタスである。いくつかのSDMUは、自然にマルチステージ問題(MSP)としてモデル化されているが、結果として得られる最適化は、計算の観点からは明らかに困難である。本稿では,2段階の一般決定規則(TS-GDR)を導入し,線形関数を超えて政策空間を一般化する手法を提案する。 TS-GDRの有効性は、TS-LDR(Two-Stage Deep Decision Rules)と呼ばれるディープリカレントニューラルネットワークを用いたインスタンス化によって実証される。
論文参考訳（メタデータ） (2024-05-23T18:19:47Z)
End-to-End Learning for Fair Multiobjective Optimization Under Uncertainty [55.04219793298687]
機械学習における予測-Then-Forecast(PtO)パラダイムは、下流の意思決定品質を最大化することを目的としている。本稿では,PtO法を拡張して,OWA(Nondifferentiable Ordered Weighted Averaging)の目的を最適化する。この結果から,不確実性の下でのOWA関数の最適化とパラメトリック予測を効果的に統合できることが示唆された。
論文参考訳（メタデータ） (2024-02-12T16:33:35Z)
Federated Distributionally Robust Optimization with Non-Convex Objectives: Algorithm and Analysis [24.64654924173679]
Asynchronous Single-looP alternatIve gRadient projEction という非同期分散アルゴリズムを提案する。新しい不確実性集合、すなわち制約付きD-ノルムの不確実性集合は、以前の分布を利用し、強靭性の度合いを柔軟に制御するために開発される。実世界のデータセットに関する実証研究は、提案手法が高速収束を達成できるだけでなく、悪意のある攻撃だけでなく、データに対する堅牢性も維持できることを示した。
論文参考訳（メタデータ） (2023-07-25T01:56:57Z)
Non-Gaussian Uncertainty Minimization Based Control of Stochastic Nonlinear Robotic Systems [9.088960941718]
我々は、不確実性や乱れによる名目状態軌跡からのシステムの状態のずれを最小限に抑える状態フィードバックコントローラを設計する。我々はモーメントと特徴関数を用いて、ロボットシステムの非線形運動モデル全体にわたって不確実性を伝播する。
論文参考訳（メタデータ） (2023-03-02T23:31:32Z)
Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文参考訳（メタデータ） (2023-02-02T16:30:33Z)
Online Statistical Inference in Decision-Making with Matrix Context [5.2071564436846245]
本稿では,適応的に収集したデータを用いて統計的推測を行うオンライン手法を提案する。標準の低ランク推定器は偏りがあり、逐次的には得られない。シーケンシャルな意思決定アルゴリズムにおける既存のアプローチは、低ランク性を考慮しておらず、バイアスもある。
論文参考訳（メタデータ） (2022-12-21T22:03:06Z)
Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文参考訳（メタデータ） (2022-11-14T21:54:31Z)
Distributed Distributionally Robust Optimization with Non-Convex Objectives [24.64654924173679]
Asynchronous Single-looP alternatIve gRadient projEction という非同期分散アルゴリズムを提案する。新しい不確実性集合、すなわち制約付きD-ノルムの不確実性集合は、以前の分布を利用し、強靭性の度合いを柔軟に制御するために開発される。実世界のデータセットに関する実証研究は、提案手法が高速収束を達成できるだけでなく、悪意のある攻撃だけでなく、データに対する堅牢性も維持できることを示した。
論文参考訳（メタデータ） (2022-10-14T07:39:13Z)
Distributed Online Non-convex Optimization with Composite Regret [31.53784277195043]
本稿では,分散オンライン一般損失に対する新たなネットワーク後悔を伴う,新たな複合後悔を提案する。我々の知る限り、オンラインの非線形学習における最初の後悔である。
論文参考訳（メタデータ） (2022-09-21T04:16:33Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。このアプローチは多くの実装と最適化の課題をもたらします。提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文参考訳（メタデータ） (2021-03-18T14:26:26Z)
Resource Allocation via Model-Free Deep Learning in Free Space Optical Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-27T17:38:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。