論文の概要: Hoeffding's Inequality for Markov Chains under Generalized
Concentrability Condition
- arxiv url: http://arxiv.org/abs/2310.02941v1
- Date: Wed, 4 Oct 2023 16:21:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 14:08:42.532206
- Title: Hoeffding's Inequality for Markov Chains under Generalized
Concentrability Condition
- Title(参考訳): 一般濃度条件下におけるマルコフ鎖の不等式
- Authors: Hao Chen, Abhishek Gupta, Yin Sun, and Ness Shroff
- Abstract要約: 本稿では,積分確率計量(IPM)によって定義される一般化可積分性条件下でのマルコフ鎖の不等式について検討する。
我々のフレームワークの柔軟性により、伝統的な意味でのエルゴード的マルコフ連鎖を超えて、ホーフディングの不等式を適用することができる。
- 参考スコア(独自算出の注目度): 15.228649445346473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies Hoeffding's inequality for Markov chains under the
generalized concentrability condition defined via integral probability metric
(IPM). The generalized concentrability condition establishes a framework that
interpolates and extends the existing hypotheses of Markov chain Hoeffding-type
inequalities. The flexibility of our framework allows Hoeffding's inequality to
be applied beyond the ergodic Markov chains in the traditional sense. We
demonstrate the utility by applying our framework to several non-asymptotic
analyses arising from the field of machine learning, including (i) a
generalization bound for empirical risk minimization with Markovian samples,
(ii) a finite sample guarantee for Ployak-Ruppert averaging of SGD, and (iii) a
new regret bound for rested Markovian bandits with general state space.
- Abstract(参考訳): 本稿では,積分確率計量 (IPM) によって定義される一般化可積分性条件下でのマルコフ鎖の不等式について検討する。
一般化された連続性条件は、マルコフ連鎖のホーフディング型不等式を補間し拡張する枠組みを確立する。
我々のフレームワークの柔軟性により、ホッフディングの不等式は伝統的な意味でエルゴードマルコフ連鎖を越えて適用することができる。
本手法を機械学習の分野から生じる非漸近的解析に応用し,その有用性を実証する。
(i)マルコフサンプルによる経験的リスク最小化に結びついた一般化
(ii)sgdのployak-ruppert平均化のための有限サンプル保証と
(iii)一般状態空間で休息中のマルコフ・バンディットに対する新たな後悔。
関連論文リスト
- Stochastic Gradient Descent under Markovian Sampling Schemes [3.04585143845864]
マルコフ型サンプリングスキームにのみアクセス可能なバニラ勾配勾配の変動について検討する。
我々は、基礎となるマルコフ連鎖で可能な最小限の制限的な仮定の下で収束率を得ることに焦点をあてる。
論文 参考訳(メタデータ) (2023-02-28T09:18:00Z) - Offline Estimation of Controlled Markov Chains: Minimaxity and Sample
Complexity [8.732260277121547]
我々は、推定器のサンプル複雑性境界を開発し、最小限の条件を確立する。
特定の統計的リスク境界を達成するには、混合特性の強さとサンプル数との微妙で興味深いトレードオフが伴うことを示す。
論文 参考訳(メタデータ) (2022-11-14T03:39:59Z) - Stability and Generalization for Markov Chain Stochastic Gradient
Methods [49.981789906200035]
本稿では,最小化問題と最小化問題の両方に対して,MC-SGMの包括的一般化解析を行う。
我々はスムーズかつ非スムーズなケースに対して最適な過剰人口リスク境界を確立する。
コンベックス・コンケーブ問題に対する最初期のほぼ最適な収束率を期待と高い確率で開発する。
論文 参考訳(メタデータ) (2022-09-16T15:42:51Z) - On the Equity of Nuclear Norm Maximization in Unsupervised Domain
Adaptation [53.29437277730871]
核ノルムは、教師なし領域適応モデルの転送可能性を高める力を示している。
クラスレベルとサンプルレベルから予測的差別性と株式の両方を最大化する2つの新たな損失が提案されている。
論文 参考訳(メタデータ) (2022-04-12T07:55:47Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Semi-Supervised Clustering via Markov Chain Aggregation [9.475039534437332]
半教師付きクラスタリングのための制約付きマルコフクラスタリング(CoMaC)を導入する。
以上の結果から,CoMaCは最先端技術と競合していることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-17T09:07:43Z) - Comparison of Markov chains via weak Poincar\'e inequalities with
application to pseudo-marginal MCMC [0.0]
マルコフ連鎖の平衡への有界収束に対する弱ポアンカーの不等式として知られるある種の機能的不等式の使用について検討する。
本研究では, 独立メトロポリス・ハスティングス・サンプリング法や, 難易度を求める疑似マルジナル手法などの手法に対して, サブ幾何学的収束境界の導出を可能にすることを示す。
論文 参考訳(メタデータ) (2021-12-10T15:36:30Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z) - Three rates of convergence or separation via U-statistics in a dependent
framework [5.929956715430167]
我々はこの理論的なブレークスルーを、3つの異なる研究分野における現在の知識の状態を推し進めることで実行した。
まず、MCMC法によるトレースクラス積分作用素のスペクトル推定のための新しい指数関数不等式を確立する。
さらに、ペアワイズ損失関数とマルコフ連鎖サンプルを扱うオンラインアルゴリズムの一般化性能について検討する。
論文 参考訳(メタデータ) (2021-06-24T07:10:36Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。