論文の概要: Decision-Dependent Risk Minimization in Geometrically Decaying Dynamic
Environments
- arxiv url: http://arxiv.org/abs/2204.08281v1
- Date: Fri, 8 Apr 2022 18:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-24 19:53:53.648777
- Title: Decision-Dependent Risk Minimization in Geometrically Decaying Dynamic
Environments
- Title(参考訳): 幾何学的劣化する動的環境における決定依存リスク最小化
- Authors: Mitas Ray, Dmitriy Drusvyatskiy, Maryam Fazel, Lillian J. Ratliff
- Abstract要約: 本稿では,意思決定者の行動に依存するデータ分布の予測損失問題について検討する。
意思決定者が第1次勾配オラクルを持つ情報設定のための新しいアルゴリズムを導入する。
これらのアルゴリズムは、SFparkの動的価格のパイロットスタディから得られた実世界のデータを用いて、半合成の例で評価される。
- 参考スコア(独自算出の注目度): 20.344082468561734
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies the problem of expected loss minimization given a data
distribution that is dependent on the decision-maker's action and evolves
dynamically in time according to a geometric decay process. Novel algorithms
for both the information setting in which the decision-maker has a first order
gradient oracle and the setting in which they have simply a loss function
oracle are introduced. The algorithms operate on the same underlying principle:
the decision-maker repeatedly deploys a fixed decision over the length of an
epoch, thereby allowing the dynamically changing environment to sufficiently
mix before updating the decision. The iteration complexity in each of the
settings is shown to match existing rates for first and zero order stochastic
gradient methods up to logarithmic factors. The algorithms are evaluated on a
"semi-synthetic" example using real world data from the SFpark dynamic pricing
pilot study; it is shown that the announced prices result in an improvement for
the institution's objective (target occupancy), while achieving an overall
reduction in parking rates.
- Abstract(参考訳): 本稿では,意思決定者の行動に依存し,幾何学的崩壊過程に従って動的に進化するデータ分布が与える期待損失最小化の問題について検討する。
意思決定者が一階勾配オラクルを持つ情報設定と、単に損失関数オラクルを持つ設定の両方のための新しいアルゴリズムが導入される。
アルゴリズムは同じ原理で動作し、意思決定者は、決定を更新する前に動的に変化する環境が十分に混ざり合うように、エポックの長さに対して一定の決定を繰り返し展開する。
各設定における繰り返しの複雑さは、対数係数までの一階確率勾配法とゼロ階確率勾配法の既存の速度と一致する。
このアルゴリズムは, SFpark動的価格パイロットスタディから得られた実世界のデータを用いて, 半合成の例で評価され, 発表された価格は, 総合的な駐車率の低下を図りながら, 施設の目的(占領対象)の改善につながることが示された。
関連論文リスト
- A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.67706781191521]
そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。
提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文 参考訳(メタデータ) (2024-09-07T06:37:23Z) - Data-driven rules for multidimensional reflection problems [1.0742675209112622]
反射型制御を伴う可逆拡散に対する多変量特異制御問題について検討する。
与えられた拡散力学に対して、最適な領域が強い星型であると仮定し、ポリトープ近似に基づく勾配降下アルゴリズムを提案し、コスト最小化領域を数値的に決定する。
最後に,制御器に拡散力学が未知な場合のデータ駆動型解について検討する。
論文 参考訳(メタデータ) (2023-11-11T18:36:17Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - A framework for bilevel optimization that enables stochastic and global
variance reduction algorithms [17.12280360174073]
双レベル最適化は、他の関数のarg最小値を含む値関数を最小化する問題である。
本稿では, 内部問題の解, 線形系の解, 主変数を同時に発展させる新しい枠組みを提案する。
我々のフレームワークにおけるSAGAアルゴリズムの適応であるSABAは$O(frac1T)$収束率を持ち、Polyak-Lojasciewicz仮定の下で線形収束を達成することを示した。
論文 参考訳(メタデータ) (2022-01-31T18:17:25Z) - COCO Denoiser: Using Co-Coercivity for Variance Reduction in Stochastic
Convex Optimization [4.970364068620608]
我々は,勾配オラクルによって出力される雑音の推定値を改善するために,凸性およびL平滑性を利用する。
問合せ点の数と近さの増加は、より良い勾配推定に繋がることを示す。
また、SGD、Adam、STRSAGAといった既存のアルゴリズムにCOCOをプラグインすることで、バニラ設定にもCOCOを適用します。
論文 参考訳(メタデータ) (2021-09-07T17:21:09Z) - A Retrospective Approximation Approach for Smooth Stochastic
Optimization [0.2867517731896504]
グラディエント(グラディエント、英: Gradient、SG)とは、最適化(SO)問題をスムーズ(ノンフィクション)な目標値で解くための補足的反復手法である。
論文 参考訳(メタデータ) (2021-03-07T16:29:36Z) - Stochastic Compositional Gradient Descent under Compositional
constraints [13.170519806372075]
目的関数と制約関数が凸であり,関数の合成として表される制約最適化問題について検討する。
この問題は、公平な分類/回帰とキューシステムの設計に生じる。
提案手法は最適かつ実現可能な解をほぼ確実に見つけることが保証されている。
論文 参考訳(メタデータ) (2020-12-17T05:38:37Z) - Activation Relaxation: A Local Dynamical Approximation to
Backpropagation in the Brain [62.997667081978825]
活性化緩和(AR)は、バックプロパゲーション勾配を力学系の平衡点として構成することで動機付けられる。
我々のアルゴリズムは、正しいバックプロパゲーション勾配に迅速かつ堅牢に収束し、単一のタイプの計算単位しか必要とせず、任意の計算グラフで操作できる。
論文 参考訳(メタデータ) (2020-09-11T11:56:34Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Second-Order Guarantees in Centralized, Federated and Decentralized
Nonconvex Optimization [64.26238893241322]
単純なアルゴリズムは、多くの文脈において優れた経験的結果をもたらすことが示されている。
いくつかの研究は、非最適化問題を研究するための厳密な分析的正当化を追求している。
これらの分析における重要な洞察は、摂動が局所的な降下アルゴリズムを許容する上で重要な役割を担っていることである。
論文 参考訳(メタデータ) (2020-03-31T16:54:22Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。