論文の概要: Minimizing Dynamic Regret on Geodesic Metric Spaces
- arxiv url: http://arxiv.org/abs/2302.08652v2
- Date: Wed, 5 Jul 2023 13:40:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 23:06:44.557079
- Title: Minimizing Dynamic Regret on Geodesic Metric Spaces
- Title(参考訳): 測地線距離空間上の動的後悔の最小化
- Authors: Zihao Hu, Guanghui Wang, Jacob Abernethy
- Abstract要約: 測地線距離空間に適用可能な「最適」オンライン学習アルゴリズムを開発した。
これは、一般的な動的後悔を考慮し、「最適」オンライン学習アルゴリズムを開発する最初の作品である。
- 参考スコア(独自算出の注目度): 20.353993251916982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider the sequential decision problem where the goal is
to minimize the general dynamic regret on a complete Riemannian manifold. The
task of offline optimization on such a domain, also known as a geodesic metric
space, has recently received significant attention. The online setting has
received significantly less attention, and it has remained an open question
whether the body of results that hold in the Euclidean setting can be
transplanted into the land of Riemannian manifolds where new challenges (e.g.,
curvature) come into play. In this paper, we show how to get optimistic regret
bound on manifolds with non-positive curvature whenever improper learning is
allowed and propose an array of adaptive no-regret algorithms. To the best of
our knowledge, this is the first work that considers general dynamic regret and
develops "optimistic" online learning algorithms which can be employed on
geodesic metric spaces.
- Abstract(参考訳): 本稿では,完備リーマン多様体上の一般の動的後悔を最小化することが目的とする逐次決定問題を考える。
測地距離空間としても知られるそのような領域におけるオフライン最適化の課題は、最近大きな注目を集めている。
オンライン・セッティングの注目度は大幅に低下しており、ユークリッド・セッティングにおける結果の本体がリーマン多様体の領域に移植されるかどうかという疑問が残されており、新たな課題(例えば曲率)が生まれている。
本稿では,不適切な学習が許されるたびに非正の曲率を持つ多様体上で楽観的な後悔を得る方法を示し,適応的非回帰アルゴリズムを提案する。
私たちの知る限りでは、これは一般的な動的後悔を考慮し、測地線距離空間で使える「最適」オンライン学習アルゴリズムを開発する最初の作品である。
関連論文リスト
- Riemannian stochastic optimization methods avoid strict saddle points [68.80251170757647]
研究中のポリシーは、確率 1 の厳密なサドル点/部分多様体を避けていることを示す。
この結果は、アルゴリズムの極限状態が局所最小値にしかならないことを示すため、重要な正当性チェックを提供する。
論文 参考訳(メタデータ) (2023-11-04T11:12:24Z) - Curvature-Independent Last-Iterate Convergence for Games on Riemannian
Manifolds [77.4346324549323]
本研究では, 多様体の曲率に依存しないステップサイズが, 曲率非依存かつ直線的最終点収束率を達成することを示す。
我々の知る限りでは、曲率非依存率や/または最終点収束の可能性はこれまでに検討されていない。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - The Dynamics of Riemannian Robbins-Monro Algorithms [101.29301565229265]
本稿では,Robins と Monro のセミナル近似フレームワークを一般化し拡張するリーマンアルゴリズムの族を提案する。
ユークリッドのそれと比較すると、リーマンのアルゴリズムは多様体上の大域線型構造が欠如しているため、はるかに理解されていない。
ユークリッド・ロビンス=モンロスキームの既存の理論を反映し拡張するほぼ確実な収束結果の一般的なテンプレートを提供する。
論文 参考訳(メタデータ) (2022-06-14T12:30:11Z) - First-Order Algorithms for Min-Max Optimization in Geodesic Metric
Spaces [93.35384756718868]
min-maxアルゴリズムはユークリッド設定で解析されている。
指数関数法 (RCEG) が線形速度で最終収束を補正したことを証明した。
論文 参考訳(メタデータ) (2022-06-04T18:53:44Z) - Optimistic and Adaptive Lagrangian Hedging [11.698607733213226]
オンライン学習では、アルゴリズムは各ラウンドの敵によって選択される可能性のある損失のある環境と対戦する。
私たちは、後悔マッチングとヘッジを含むオンラインアルゴリズムのクラスであるLagrangian hedgingに楽観と適応的なステップを導入します。
論文 参考訳(メタデータ) (2021-01-23T23:32:40Z) - Regret minimization in stochastic non-convex learning via a
proximal-gradient approach [80.59047515124198]
機械学習やオペレーションの応用によって動機づけられた私たちは、オンラインで制約された問題を最小化するために、一階のオラクルフィードバックを後悔しています。
我々は、近位複雑性低減技術を保証する新しいプロキシグレードを開発する。
論文 参考訳(メタデータ) (2020-10-13T09:22:21Z) - Stochastic Zeroth-order Riemannian Derivative Estimation and
Optimization [15.78743548731191]
多様体非線型性の非線型性の難しさを克服するために、ガウス滑らか化関数のオラクル版を提案する。
ニューラルネットワークに対するロボティクスとブラックボックス攻撃に対するブラックボックス剛性制御における,結果によるアルゴリズムの適用性と実世界の応用を実証する。
論文 参考訳(メタデータ) (2020-03-25T06:58:19Z) - Minimizing Dynamic Regret and Adaptive Regret Simultaneously [60.17824125301273]
動的後悔と適応的後悔を同時に最小化できる新しいオンラインアルゴリズムを提案する。
我々の理論的保証は、あるアルゴリズムが任意の間隔で動的後悔を最小化できるという意味でさらに強い。
論文 参考訳(メタデータ) (2020-02-06T03:32:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。