論文の概要: Online Learning under Adversarial Nonlinear Constraints
- arxiv url: http://arxiv.org/abs/2306.03655v1
- Date: Tue, 6 Jun 2023 13:15:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 15:25:00.897451
- Title: Online Learning under Adversarial Nonlinear Constraints
- Title(参考訳): 非線形制約下でのオンライン学習
- Authors: Pavel Kolev, Georg Martius, Michael Muehlebach
- Abstract要約: 本稿では,逆時間変化および非線形制約に対処できるアルゴリズムを提案する。
CVV-Proは、実現可能な集合が徐々に時間変化しているにもかかわらず、1/sqrtT$で実現可能な集合に収束する。
プレイヤーが共有制約を受ける2人プレイヤゲームにおいて,我々のアルゴリズムを実証的に評価する。
- 参考スコア(独自算出の注目度): 23.94388837322502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many applications, learning systems are required to process continuous
non-stationary data streams. We study this problem in an online learning
framework and propose an algorithm that can deal with adversarial time-varying
and nonlinear constraints. As we show in our work, the algorithm called
Constraint Violation Velocity Projection (CVV-Pro) achieves $\sqrt{T}$ regret
and converges to the feasible set at a rate of $1/\sqrt{T}$, despite the fact
that the feasible set is slowly time-varying and a priori unknown to the
learner. CVV-Pro only relies on local sparse linear approximations of the
feasible set and therefore avoids optimizing over the entire set at each
iteration, which is in sharp contrast to projected gradients or Frank-Wolfe
methods. We also empirically evaluate our algorithm on two-player games, where
the players are subjected to a shared constraint.
- Abstract(参考訳): 多くのアプリケーションでは、学習システムは連続的な非定常データストリームを処理する必要がある。
本稿では,この問題をオンライン学習フレームワークで研究し,逆時間的制約や非線形制約に対処できるアルゴリズムを提案する。
我々の研究で示したように、Constraint Violation Velocity Projection (CVV-Pro) と呼ばれるアルゴリズムは、学習者にとって徐々に時間変化し、先行性がないにもかかわらず、後悔し、実現可能なセットに1/\sqrt{T}$で収束する。
CVV-Proは、実現可能な集合の局所スパース線型近似にのみ依存するため、各反復における集合全体の最適化を回避し、射影勾配やフランク=ウルフ法とは対照的である。
また,プレイヤーが共有制約を受ける2プレイヤーゲームにおいて,アルゴリズムを経験的に評価する。
関連論文リスト
- Near-Optimal Solutions of Constrained Learning Problems [85.48853063302764]
機械学習システムでは、振る舞いを縮小する必要性がますます顕在化している。
これは、双対ロバスト性変数を満たすモデルの開発に向けた最近の進歩によって証明されている。
この結果から, 豊富なパラメトリゼーションは非次元的, 有限な学習問題を効果的に緩和することが示された。
論文 参考訳(メタデータ) (2024-03-18T14:55:45Z) - Truly No-Regret Learning in Constrained MDPs [61.78619476991494]
未知のCMDPで学習するモデルベース原始双対アルゴリズムを提案する。
提案アルゴリズムは,誤差のキャンセルを伴わずにサブ線形後悔を実現する。
論文 参考訳(メタデータ) (2024-02-24T09:47:46Z) - Efficient Online Learning with Offline Datasets for Infinite Horizon
MDPs: A Bayesian Approach [25.77911741149966]
学習エージェントが専門家が使用する行動ポリシーをモデル化すれば,累積的後悔を最小限に抑えることができることを示す。
次に,iPSRL アルゴリズムを効率的に近似する Informed RLSVI アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-17T19:01:08Z) - Improving Adaptive Online Learning Using Refined Discretization [44.646191058243645]
リプシッツ損失を伴う制約のないオンライン線形最適化について検討する。
インスタンス最適性の追求に動機づけられ,我々は新しいアルゴリズムを提案する。
これらの結果の中心は、オンライン学習に対する継続的な時間的アプローチである。
論文 参考訳(メタデータ) (2023-09-27T21:54:52Z) - Efficient Methods for Non-stationary Online Learning [67.3300478545554]
本稿では, 動的後悔と適応的後悔を最適化する効率的な手法を提案し, ラウンド当たりの投影回数を$mathcalO(log T)$から$ $1$まで削減した。
本手法は,パラメータフリーオンライン学習において開発された還元機構を基礎として,非定常オンライン手法に非自明なツイストを必要とする。
論文 参考訳(メタデータ) (2023-09-16T07:30:12Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Learning-Assisted Algorithm Unrolling for Online Optimization with
Budget Constraints [27.84415856657607]
我々はLAAU(Learning-Assisted Algorithm Unrolling)と呼ばれる新しい機械学習支援アンローリング手法を提案する。
バックプロパゲーションによる効率的なトレーニングには、時間とともに決定パイプラインの勾配を導出します。
また、トレーニングデータがオフラインで利用可能で、オンラインで収集できる場合の2つのケースの平均的なコスト境界も提供します。
論文 参考訳(メタデータ) (2022-12-03T20:56:29Z) - Smoothed Online Learning is as Easy as Statistical Learning [77.00766067963195]
この設定では、最初のオラクル効率、非回帰アルゴリズムを提供する。
古典的な設定で関数クラスが学習可能な場合、文脈的包帯に対するオラクル効率のよい非回帰アルゴリズムが存在することを示す。
論文 参考訳(メタデータ) (2022-02-09T19:22:34Z) - Safe Online Bid Optimization with Return-On-Investment and Budget
Constraints subject to Uncertainty [87.81197574939355]
最適化問題と学習問題の両方について検討する。
我々は、潜在的に線形な数の制約違反を犠牲にして、サブ線形後悔を保証するアルゴリズム、すなわちGCBを提供する。
より興味深いことに、我々はGCB_safe(psi,phi)というアルゴリズムを提供し、サブ線形擬似回帰と安全性w.h.p.の両方を、耐性 psi と phi を受け入れるコストで保証する。
論文 参考訳(メタデータ) (2022-01-18T17:24:20Z) - Refined approachability algorithms and application to regret
minimization with global costs [0.38073142980732994]
ブラックウェルのアプローチ可能性 (Blackwell's approachability) は、2人のプレイヤー、すなわち意思決定者(Decision Maker)と環境(Environment)がベクター価値のペイオフで繰り返しゲームをする枠組みである。
我々は、ブラックウェルのアプローチ可能性のために、正規化リーダアルゴリズム(FTRL)のクラスを構築し、分析する。
この柔軟性により、これらのアルゴリズムを適用して、様々なオンライン学習問題への関心度を極力最小化することができる。
論文 参考訳(メタデータ) (2020-09-08T15:54:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。