論文の概要、ライセンス

# (参考訳) ステップサイズを固定した線形確率近似の高次確率境界 [全文訳有]

Tight High Probability Bounds for Linear Stochastic Approximation with Fixed Stepsize ( http://arxiv.org/abs/2106.01257v1 )

ライセンス: CC BY 4.0
Alain Durmus, Eric Moulines, Alexey Naumov, Sergey Samsonov, Kevin Scaman, Hoi-To Wai(参考訳) 本稿では,線形確率近似 (lsa) アルゴリズムの非漸近的解析について述べる。 この手法の族は、多くの機械学習タスクに現れ、線型システムの近似解を得るために使われる: $\bar{A}\theta = \bar{b}$ for that $\bar{A}$ and $\bar{b}$ can only access through random estimates $\{({\bf A}_n, {\bf b}_n): n \in \mathbb{N}^*\}$。 本解析は,タイトであることが示される行列の積に対するモーメントと高確率境界に関する新しい結果に基づいている。 従来より弱い条件下での lsa の性能に関する高い確率境界を導出する。 $\{({\bf a}_n, {\bf b}_n): n \in \mathbb{n}^*\}$ である。 しかし,それとは対照的に,多項式濃度境界をステップ化によって順序付きで定めている。 我々の結論は、ランダム行列の列$\{{\bf A}_n: n \in \mathbb{N}^*\}$に関する追加の仮定なしでは改善できないことを示し、特にガウス的あるいは指数関数的な高確率境界は保持できない。 最後に、我々は、反復の数とステップ化に関してシャープな順序で境界を確立することに特に注意し、その主項は中央極限定理に現れる共分散行列を含む。

This paper provides a non-asymptotic analysis of linear stochastic approximation (LSA) algorithms with fixed stepsize. This family of methods arises in many machine learning tasks and is used to obtain approximate solutions of a linear system $\bar{A}\theta = \bar{b}$ for which $\bar{A}$ and $\bar{b}$ can only be accessed through random estimates $\{({\bf A}_n, {\bf b}_n): n \in \mathbb{N}^*\}$. Our analysis is based on new results regarding moments and high probability bounds for products of matrices which are shown to be tight. We derive high probability bounds on the performance of LSA under weaker conditions on the sequence $\{({\bf A}_n, {\bf b}_n): n \in \mathbb{N}^*\}$ than previous works. However, in contrast, we establish polynomial concentration bounds with order depending on the stepsize. We show that our conclusions cannot be improved without additional assumptions on the sequence of random matrices $\{{\bf A}_n: n \in \mathbb{N}^*\}$, and in particular that no Gaussian or exponential high probability bounds can hold. Finally, we pay a particular attention to establishing bounds with sharp order with respect to the number of iterations and the stepsize and whose leading terms contain the covariance matrices appearing in the central limit theorems.
公開日: Wed, 2 Jun 2021 16:10:37 GMT

※ 翻訳結果を表に示しています。PDFがオリジナルの論文です。翻訳結果のライセンスはCC BY-SA 4.0です。詳細はトップページをご参照ください。

翻訳結果

    Page: /      
英語(論文から抽出)日本語訳スコア
1 2 0 2 n u J 1 2 0 2 n u J 0.85
2 ] L M . t a t s [ 2 ]LM . t a t s [ 0.74
1 v 7 5 2 1 0 1 v 7 5 2 1 0 0.85
. 6 0 1 2 : v i X r a . 6 0 1 2 : v i X r a 0.85
Tight High Probability Bounds for Linear Stochastic 線形確率論の厳密な高確率境界 0.78
Approximation with Fixed Stepsize 固定ステップサイズによる近似 0.74
Alain Durmus ∗ ENS Paris-Saclay Alain Durmus ∗ ENS Paris-Saclay 0.88
alain.durmus@ens-par is-saclay.fr alain.durmus@ens-par is-saclay.fr 0.39
Eric Moulines Eric Moulines 0.85
Ecole Polytechnique and HSE University ecole polytechnique と hse university 0.78
eric.moulines@polyte chnique.edu eric.moulines@polyte chnique.edu 0.59
Alexey Naumov HSE University アレクセイ・ナウモフ大学 0.53
Sergey Samsonov セルゲイ・サムソノフ 0.36
HSE University INRIA, DI/ENS, PSL Research University HSE大学 PSL研究大学InRIA, DI/ENS 0.85
Kevin Scaman anaumov@hse.ru ケヴィン・スカマン anaumov@hse.ru 0.61
svsamsonov@hse.ru svsamsonov@hse.ru 0.78
kevin.scaman@gmail.c om kevin.scaman@gmail.c om 0.59
Hoi-To Wai The Chinese University of Hong Kong ホイトワイ 中国・香港大学 0.50
htwai@se.cuhk.edu.hk htwai@se.cuhk.edu.hk 0.47
Abstract This paper provides a non-asymptotic analysis of linear stochastic approximation (LSA) algorithms with fixed stepsize. 概要 本稿では,線形確率近似 (lsa) アルゴリズムの非漸近的解析について述べる。 0.60
This family of methods arises in many machine learning tasks and is used to obtain approximate solutions of a linear system ¯Aθ = ¯b for which ¯A and ¯b can only be accessed through random estimates {(An, bn) : n ∈ N∗}. この手法の族は、多くの機械学習のタスクで現れ、線形系の近似解を得るのに用いられ、そこでは、A と b がランダムな推定 {(An, bn) : n ∈ N∗} を通してのみアクセス可能である。 0.71
Our analysis is based on new results regarding moments 我々の分析はモーメントに関する新しい結果に基づいている 0.76
and high probability bounds for products of matrices which are shown to be tight. 厳密な行列の積に対して高い確率境界が示されています 0.64
We derive high probability bounds on the performance of LSA under weaker con- 我々はより弱い共振器下でのLSAの性能に高い確率境界を導出する 0.60
ditions on the sequence {(An, bn) : n ∈ N∗} than previous works. 列 {(an, bn) : n ∈ n∗} 上のディションは、以前の仕事よりも大きい。 0.61
However, in contrast, we establish polynomial concentration bounds with order depending on the stepsize. しかし... 対照的に, 多項式濃度境界はステップ化に依存する順序で定まる。 0.59
We show that our conclusions cannot be improved without additional 我々の結論は追加なしでは改善できないことを示します 0.76
assumptions on the sequence of random matrices {An : n ∈ N∗}, and in partic- ランダム行列の列の仮定;An : n ∈ N∗},および部分集合における 0.70
ular that no Gaussian or exponential high probability bounds can hold. ガウス的あるいは指数関数的な高確率境界は持たない。 0.69
Finally, we pay a particular attention to establishing bounds with sharp order with respect to the number of iterations and the stepsize and whose leading terms contain the covariance matrices appearing in the central limit theorems. 最後に、我々は、反復の数とステップ化に関してシャープな順序で境界を確立することに特に注意し、その主項は中央極限定理に現れる共分散行列を含む。 0.77
1 Introduction This paper provides a detailed analysis of Linear Stochastic Approximation (LSA) schemes which aim at finding a solution θ⋆ for a linear system of the form ¯Aθ = ¯b. はじめに 本稿では、線形確率近似 (LSA) スキームの詳細な解析を行い、このスキームは、正の形の線形系に対する解 θ を探索することを目的としている。 0.63
In particular, we analyze LSA with a fixed stepsize α > 0 which consists in defining a sequence of estimates {θn : n ∈ N} for θ⋆ 特に、θ に対して推定 {θn : n ∈ n} の列を定義することからなる固定ステップ α > 0 を用いて lsa を解析する。 0.78
by the recursion θn+1 = θn − α{An+1θn − bn+1} , n ∈ N , 再帰によって θn+1 = θn − α{An+1θn − bn+1} , n ∈ N , 0.68
(1) where {(An, bn) : n ∈ N∗} is a sequence of i.i.d. (1) ここで {(An, bn) : n ∈ N∗} は i.i.d の列である。 0.80
random variables used as proxy for ¯A ∈ Rd×d and ¯b ∈ Rd which are typically unknown. A ∈ Rd×d と shb ∈ Rd のプロキシとして使われる確率変数は、通常は未知である。 0.70
This class of algorithms and the corresponding setting このアルゴリズムのクラスと対応する設定は 0.87
have a long history and important applications in signal processing such as channel equalization and echo cancellation [3, 22]. チャネル等化やエコーキャンセルなどの信号処理に長い歴史と重要な応用があります [3, 22]。 0.72
It has renewed interests in machine learning and computational statistics 機械学習と計算統計学に 新たな関心を寄せています 0.65
∗Authors listed in alphabetical order. ∗Authors はアルファベット順にリストされる。 0.62
Preprint. Under review. プレプリント。 レビュー中。 0.63
英語(論文から抽出)日本語訳スコア
especially for least-square estimation, Reinforcement learning (RL) and Q-learning [4, 7, 38, 35]. 特に最小二乗推定では、強化学習(RL)とQ学習[4, 7, 38, 35]。 0.76
The recursion (1) has already been studied in depth in several works which derive asymptotic [31, 22, 6, 3] and non-asymptotic [33, 25, 2, 19, 20, 5, 23, 34, 9, 12] guarantees. 再帰(1)は、漸近性[31,22,6,3]と非漸近性[33,25,2,19,19,20,20, 20,23,34,9,12]に由来するいくつかの作品において、すでに深く研究されている。
訳抜け防止モード: 再帰 (1 ) は漸近性[31, 22, 6, 3]に由来するいくつかの作品で既に深く研究されている。 非漸近性[33,25,2,19] 20, 5, 23, 34, 9, 12 ] guarantees .
0.84
However, in most cases, there is a consistent gap between these two types of analyses. しかし、ほとんどの場合、これらの2種類の分析の間には一貫したギャップがある。 0.67
While asymptotic analysis gives important insights on the qualitative convergence of (1) based on statistical key quantities of the problem on hand, they do not provide finite-time convergence, or high probability bounds, necessary to obtain non-asymptotic confidence sets, see [26, 10] and the references therein. 漸近解析(asymptotic analysis)は(1)の定性的収束に関する重要な洞察を、問題の統計的鍵量に基づいて与えているが、それらは非漸近的信頼集合を得るために必要となる有限時間収束や高い確率境界を提供していない。 0.83
On the other hand, non-asymptotic studies are in general too coarse and lose significant statistical information in their derivation. 一方、非漸近的研究は概して粗末であり、その導出において重要な統計情報を失う。 0.67
Further, their upper bounds are generally loose when used in predicting the actual performance of LSA. さらに、それらの上界は LSA の実際の性能を予測する際に一般的には緩い。 0.67
We aim at filling this gap and provide conditions on このギャップを埋めて 条件を与えることを目標にしています 0.56
This problem has been addressed in several contributions but at the expense of strong conditions on この問題はいくつかの貢献で解決されてきたが、強い条件を犠牲にしている。 0.53
{(An, bn) : n ∈ N∗} ensuring tight high probability bounds on the sequence {θn : n ∈ N}. {(An, bn) : n ∈ N∗} は列 {θn : n ∈ N} 上の厳密な高確率境界を保証する。 0.88
the sequence {(An, bn) : n ∈ N∗}. 列 {(an, bn) : n ∈ n∗} である。 0.66
[13] provided concentration bounds for non-linear stochastic al- 13] 非線形確率的alの濃度境界- 0.71
gorithms under a log-Sobolev condition which turns out to be hard to verify for most applications except for the Euler-Maruyama discretization scheme applied to Stochastic Differential Equation. 対数ソボレフ条件下でのgorithmsは、確率微分方程式に適用されるオイラー・マルヤマ離散化スキームを除いてほとんどの応用について検証することが難しい。 0.67
[27] derived concentration inequalities but assuming that the innovations in (1) are uniformly bounded. 27] 濃度不等式を導出するが、(1) の革新が一様有界であると仮定する。 0.67
In contrast, we aim at giving simple and mild conditions ensuring high probability bounds. 対照的に,我々は単純で穏やかな条件に高い確率境界を与えることを目標としている。 0.55
More precisely, one of our key contributions (Theorem 1) is to show that under mild conditions on the より正確には、私たちの重要な貢献の1つ(theorem 1)は、穏やかな条件下では 0.76
sequence {(An, bn) : n ∈ N∗}, for any δ ∈ (0, 1), n ∈ N and u ∈ Sd−1, δ ∈ (0, 1), n ∈ N および u ∈ Sd−1 に対する列 {(An, bn) : n ∈ N∗},
訳抜け防止モード: sequence { ( an, bn ) : n ∈ n∗ }, 任意の δ ∈ ( 0, 1 ) に対して、n ∈ n そして u ∈ sd−1 である。
0.90
P(cid:16)|u⊤(θn − θ⋆)| ≤ c{ P(cid:16)|u'(θn − θ')| ≤ c{ 0.97
√αu⊤Σu + α}plog(1/δ) + c{ρn 1/δ) + c{ρn + α}plog(1/δ) 0.64
α + αp2 0}δ− 1 α + αp2 0}δ− 1 0.88
p0(cid:17) ≥ 1 − δ , p0(cid:17) ≥ 1 − δ , 0.90
(2) where ρα ∈ (0, 1), c > 0 is a constant independent of n, α, δ, and p0 = o(α−1/4). (2) ここで ρα ∈ (0, 1), c > 0 は n, α, δ, p0 = o(α−1/4) の定数独立である。 0.89
In the above, Σ is the unique solution of the Lyapunov equation which naturally appears in central limit theorems for LSA with diminishing stepsize. 以上ではΣ。 Lyapunov 方程式のユニークな解であり、これは自然に段階化が減少する LSA の極限定理に現れる。 0.65
In addition, we show that the bound we get is tight with respect さらに、我々はその限界が厳密であることを示します。 0.62
to α and δ in the case where we only assume that −E[A1] = − ¯A is Hurwitz. α と δ に対して、-E[A1] = − >A がフルヴィッツであると仮定する。 0.71
Indeed, we provide counterexamples illustrating that for a fixed stepsize α and under the conditions that we consider, logarithmic dependence in 1/δ cannot hold in (2) but only a polynomial one. 実際、固定されたステップ α に対して、1/δ における対数依存は (2) に留まらず多項式 1 にしか持たないことを示す逆例を与える。 0.71
Regarding the dependence with respect to α, we extend [28] and show that for α small enough, {θn : n ∈ N} admits a unique stationary distribution πα and establish a central limit theorem for this family of distribution as α ↓ 0 at rate √α and with asymptotic covariance matrix Σ appearing in (2). α に対する依存に関して、[28] を拡張し、十分に小さい α に対して、{θn : n ∈ n} は一意的な定常分布 πα を許容し、この分布の族に対して、速度 sα において α が 0 であり、(2) に現れる漸近共分散行列 σ を持つような中心極限定理を定めている。 0.75
Finally, our proofs rely on a new analysis of product of matrices, extending the recent work of [17]. 最後に、我々の証明は行列の積の新しい解析に依存し、[17]の最近の研究を拡張している。 0.67
In particular, we establish conditions ensuring uniform bounds in n of the p-th moments of Yn ··· Y1, where {Yn : n ∈ N∗} is a sequence of independent matrices whose expected values have a spectral radius less than 1. 特に、yn ···· y1 の p-次モーメントの n における一様境界を保証する条件を定め、ここで {yn : n ∈ n∗} は期待値が 1 未満の独立行列の列である。 0.78
In comparison to existing results, the main challenge that we address here is that the random matrices {An : n ∈ N∗} are not assumed to be almost surely 既存の結果と比較して、ここで扱う主な課題はランダム行列 {an : n ∈ n∗} がほぼ確実に仮定されていないことである。 0.76
symmetric. The paper is organized as follows. 対称だ 論文は以下の通り整理される。 0.67
Section 2 formally discusses the assumptions on LSA for our analysis. 第2節は、分析のためのlsaの仮定を正式に論じている。 0.50
Section 3 presents the moment bound for product of random matrices. 第3節はランダム行列の積に束縛されたモーメントを示す。 0.58
Using this result, Section 4 shows the high probability concentration inequality (2) and Section 5 shows the tightness of the bounds by deriving a central limit theorem for LSA. この結果を用いて、第4節は高確率濃度不等式 (2) を示し、第5節は lsa の中央極限定理を導出して境界の厳密性を示す。 0.71
Notations Denote N∗ = N \ {0} and N− = Z \ N∗. 記法 N∗ = N \ {0} と N− = Z \ N∗ を記す。 0.77
Let d ∈ N∗ and Q be a symmetric positive definite d× d matrix. d ∈ N∗ と Q を対称正定値 d× d 行列とする。 0.76
For x ∈ Rd, we denote kxkQ = {x⊤Qx}1/2. x ∈ Rd に対して、kxkQ = {x\Qx}1/2 と表す。 0.73
For brevity, we set kxk = kxkId . 簡潔性については、kxk = kxkid とする。 0.54
We denote kAkQ = maxkxkQ=1 kAxkQ, and the subscriptless norm kAk = kAkI is the standard spectral norm. 我々は kakq = maxkxkq=1 kaxkq と表記し、subscriptless norm kak = kaki は標準スペクトルノルムである。 0.76
We denote the condition number of Q as κQ = λ−1 min(Q)λmax(Q). Q の条件数は κQ = λ−1 min(Q)λmax(Q) である。 0.87
We denote Sd−1 = {x ∈ Rd|kxk = 1}. Sd−1 = {x ∈ Rd|kxk = 1} を示す。 0.78
Let A1, . . . A1にしよう。 . . 0.85
, AN be d-dimensional matrices. は d-次元行列である。 0.68
We denoteQj ℓ=i Aℓ = Aj . Qj l=i Al = Aj と表す。 0.64
. . Ai if i ≤ j and with the conventionQj ℓ=i Aℓ = Id if i > j. . . Ai if i ≤ j and with conventionQj l=i Al = Id if i > j。 0.86
We say that a centered random variable (r.v.) 中心となる確率変数 (r.v.) は 0.58
X is sub-Gaussian with variance factor σ2 and we denote X ∈ SG(σ2) if for all λ ∈ R, log E[eλX ] ≤ λ2σ2/2. X が分散係数 σ2 を持つ準ガウス的であり、すべての λ ∈ R に対して log E[eλX ] ≤ λ2σ2/2 が成り立つことを X ∈ SG(σ2) と表す。
訳抜け防止モード: X は分散係数 σ2 とガウス群である すべての λ ∈ R に対して、log E[eλX ] ≤ λ2σ2/2 である。
0.86
We define the Wasserstein distance of order 2 between two probabilities measure µ and ν on Rd as W2(µ, ν) = inf ζ∈Π(µ,ν)RR2d kx − yk2dζ(x, y), where Π(µ, ν) is the set of probability measures on (R2d,B(R2d)) with marginals µ and ν respectively. rd 上の 2 つの確率測度 μ と ν の間の位数 2 のワッサーシュタイン距離を w2(μ, ν) = inf sππ(μ,ν)rr2d kx − yk2d(x, y) と定義し、ここで π(μ, ν) はそれぞれ μ と ν の辺を持つ (r2d, b(r2d)) 上の確率測度の集合である。 0.78
Denote by P2(Rd) the set of all probability measures on Rd with the finite second moment. P2(Rd) は有限第二モーメントを持つ Rd 上のすべての確率測度の集合に注意する。 0.76
2 2 0.85
英語(論文から抽出)日本語訳スコア
2 Linear Stochastic Approximation: Setting and Assumptions 2 線形確率近似:設定と推定 0.70
Consider the LSA recursion (1) with a deterministic initial point θ0. 決定論的初期点 θ0 を持つ LSA 再帰 (1) を考える。 0.82
The main assumption required in this paper is as follows: A1. この論文で必要とされる主な前提は以下のとおりである。 0.65
{(An, bn)}n∈N∗ is an i.i.d. {(An, bn)}n・N∗ は i.i.d である。 0.61
sequence satisfying the following conditions. 以下の条件を満たすシーケンス。 0.75
(i) E[b1] = ¯b and there exists Cb > 0 such that, for any u ∈ Sd−1, u⊤(b1 − ¯b) ∈ SG(C2 b). (i) E[b1] = >b であり、任意の u ∈ Sd−1 に対して u が SG(C2 b) となるような Cb > 0 が存在する。 0.90
(ii) There exists CA > 0 such that kA1k ≤ CA almost surely. (ii) kA1k ≤ CA がほぼ確実に存在するような CA > 0 が存在する。 0.77
(iii) The matrix − ¯A = −E[A1] is Hurwitz, i.e. (iii) 行列 − A = −E[A1] はハルヴィッツ、すなわち。 0.74
for any eigenvalue λ of ¯A, Re(λ) > 0. a の任意の固有値 λ に対し、re(λ) > 0 である。 0.75
Both conditions A 1-(i), (ii) are standard in analysis of LSA, e g , in [11, 34, 24]. 両方の条件 A 1-(i), (ii) は [11, 34, 24] における LSA, e g の解析において標準である。 0.90
Meanwhile, A 1(iii) guarantees the existence of a unique solution θ⋆ to ¯Aθ = ¯b. 一方、a 1(iii) は一意な解 θ を aθ = a b に保証する。 0.60
It is also a sufficient and necessary condition for the solution of the ordinary differential equation ˙θt = − ¯Aθt to converge exponentially n = −α ¯Aθd to θ⋆ [18, Lemma 4.1.2]. また、通常の微分方程式の解として、n = −α > Aθd を θ [18, Lemma 4.1.2] に指数的に収束させるのに十分な条件である。 0.70
The same kind of result holds for the discrete system θd n. Proposition 1. 同じ結果が離散系 θd n. 命題 1 に対しても成り立つ。 0.70
Assume that − ¯A is a Hurwitz matrix. A がフーウィッツ行列であると仮定する。 0.55
Then there exists a unique positive definite matrix Q satisfying the Lyapunov equation ¯A⊤Q + Q ¯A = I. このとき、一意的な正定値行列 q が存在して、リアプノフ方程式 s が成立する。 0.64
In addition, setting n+1− θd また、設定 n+1−θd 0.51
then for any α ∈ [0, α∞], we get kI − α ¯Ak2 すると、任意の α ∈ [0, α∞] に対して、kI − α Ak2 を得る。 0.72
a = kQk−1/2 , a = kQk−1/2 , 0.65
Q kQk−1 , and α∞ = (1/2)k ¯Ak−2 Q ≤ 1− aα. Qkk−1, および α∞ = (1/2)k >Ak−2 Q ≤ 1− aα。 0.72
If in addition α ≤ kQk2 then 1− aα ≥ 1/2. さらに α ≤ kQk2 であれば 1 − aα ≥ 1/2 となる。 0.70
n+1k ≤ √κQ(1 − n+1k ≤ >κQ(1 −) 0.58
(3) This result is well known but its proof can be found in Appendix A.1 for completeness. (3) この結果はよく知られているが、証明は完全性のために Appendix A.1 で見ることができる。 0.73
The 0k for α ∈ (0, α∞). 0k for α ∈ (0, α∞)。 0.64
above proposition implies that the discrete system converges exponentially as kθd aα)n/2kθd Recall that the aim of this paper is to derive high probability bounds on u⊤{θn − θ⋆} for any n ∈ N, u ∈ Sd−1. 上記の命題は、離散系が指数関数的に収束することを意味する: kθd aα)n/2kθd は、この論文の目的は任意の n ∈ n, u ∈ sd−1 に対して u 上の高い確率境界を導出することである。 0.66
Below, we present a counterexample to show that under only A 1, if α > 0 is fixed, then there exists ¯p > 0 such that limn→+∞ E[kθn − θ⋆kp] = +∞ for p ≥ ¯p. 下記の例では、α > 0 が固定されたとき、ある 1 の下では limn→+∞ e[kθn − θ kp] = +∞ が p ≥ {\displaystyle p} に対して成立することを示す逆例を示す。 0.77
As a corollary, it is impossible to obtain exponential high probability bounds for {kθn − θ⋆k : n ∈ N}. 系として、{kθn − θ\k : n ∈ n} の指数的高確率境界を得ることは不可能である。
訳抜け防止モード: 系図としては不可能である kθn − θ\k :n ∈ N } に対する指数的高確率境界を得る。
0.76
Example 1. Consider (1) with d = 1 taking bn = 0 for any n ∈ N∗ and for {An : n ∈ N∗} an i.i.d. 例1。 任意の n ∈ N∗ に対して bn = 0 を取る d = 1 と {An : n ∈ N∗} を i.i.d とする。 0.81
sequence of biased Rademacher r.v.s with parameter qA ∈ (1/2, 1): パラメータ qA ∈ (1/2, 1) によるバイアス付きラデマチャー r.v.s の列 0.64
An =(cid:26)1 An =(cid:26)1 0.92
with probability qA , −1 with probability 1 − qA . 確率 qA で。 −1 確率 1 − qa である。 0.72
(4) This choice is associated with θ⋆ = 0 and corresponds to the recursion: θn = Qn for some θ0 6= 0. (4) この選択は、ある θ0 6= 0 に対して θn = qn という再帰に対応する。 0.81
For any p ≥ 1 and α ∈ (0, 1), we have by definition, 任意の p ≥ 1 と α ∈ (0, 1) に対して、定義によって成り立つ。 0.87
k=1(1 − αAk)θ0, k=1(1 − αAk)θ0。 0.78
E [|θn|p] = {qA(1 − α)p + (1 − qA)(1 + α)p}n|θ0|p . E[|θn|p] = {qA(1 − α)p + (1 − qA)(1 + α)p}n|θ0|p である。 0.83
Using the lower bounds (1 − α)p ≥ 1 − αp and (1 + α)p ≥ 1 + αp + p(p − 1)α2/2, we get for any p ≥ 1 and α ∈ (0, 1), 下界 (1 − α)p ≥ 1 − αp と (1 + α)p ≥ 1 + αp + p(p − 1)α2/2 を用いることで、任意の p ≥ 1 と α ∈ (0, 1) に対して得られる。 0.97
E [|θn|p] ≥ {1 − pα[(2qA − 1) − (p − 1)α(1 − qA)/2]}n|θ0|p . E[|θn|p] ≥ {1 − pα[(2qA − 1) − (p − 1)α(1 − qA)/2]}n|θ0|p である。 0.85
If α ∈ (0, 1) is fixed, then for any p > ¯pq,α = 1 + 2(2qA − 1)/[α(1 − qA)], we have limn→+∞ E [|θn|p] = +∞. α ∈ (0, 1) が固定ならば、任意の p > シュプク,α = 1 + 2(2qA − 1)/[α(1 − qA)] に対して、limn→+∞ E [|θn|p] = +∞ となる。 0.93
On the other hand, then limn→+∞ E[θ2 n] = 0. 一方、limn→+∞ E[θ2 n] = 0 である。 0.83
Therefore {θn : n ∈ N} converges in distribution to the Dirac measure at 0 which corresponds to the unique stationary distribution of this sequence as a Markov chain. したがって {θn : n ∈ n} は、マルコフ連鎖としてこの列の唯一の定常分布に対応する 0 におけるディラック測度への分布に収束する。 0.79
In such a case, this distribution admit p moments for any p ≥ 0. そのような場合、この分布は任意の p ≥ 0 に対して p モーメントを許容する。 0.72
However, this result is specific to this particular case and does not hold if only A1 holds. しかし、この結果は特定のケースに特有であり、A1 が成り立つ限りは成り立たない。 0.72
Consider {θn : n ∈ N} defined by (1) with {An : n ∈ N∗} given in (4) and {bn : n ∈ N∗} be an i.i.d. (4) で与えられる {An : n ∈ N∗} と {bn : n ∈ N∗} を i.i.d とする (1) で定義される {θn : n ∈ N∗} を考える。 0.91
sequence of zero-mean Gaussian random variables with unit variance independent of {An : n ∈ N∗}. 単位分散が {An : n ∈ N∗} に依存しないゼロ平均ガウス確率変数の列。 0.75
We show in Appendix A.2 that there exists α2,∞ such that for any α ∈ (0, α2,∞], the Markov chain {θn : n ∈ N} admits a unique invariant distribution πα for any α > 0. アペンディックス A.2 において、任意の α ∈ (0, α2,∞] に対して、マルコフ連鎖 {θn : n ∈ N} が任意の α > 0 に対して一意な不変分布 πα を持つような α2,∞ が存在することを示す。 0.79
Further, for any α ∈ (0, α2,∞] there exists pα ≥ 1 such thatRR |θ|pdπα(θ) = +∞ for any p ≥ pα. さらに、任意の α ∈ (0, α2,∞) に対して、RR |θ|pdπα(θ) = +∞ となる pα ≥ 1 が存在する。 0.89
It is, however, possible to obtain any p-th moment uniform bound for {kθn − θ⋆k : n ∈ N} by しかしながら、{kθn − θ\k : n ∈ N} に対して有界な任意の p 番目のモーメントが得られる。 0.65
if α ∈ (0, 2(2qA − 1)/(1 − qA)), α ∈ (0, 2(2qa − 1)/(1 − qa)) であれば 0.84
strengthening A1-(iii) to: a1-(iii)の強化 0.70
3 3 0.85
英語(論文から抽出)日本語訳スコア
A2. There exist ˜a ∈ (0, 1), ˜α∞ > 0 and a definite positive d-dimensional matrix ˜Q such that almost surely, for any α ∈ (0, ˜α∞], kI − αA1k ˜Q < 1 − ˜aα. A2。 a ∈ (0, 1), sα∞ > 0 が存在し、任意の α ∈ (0, sα∞], ki − αa1k sq < 1 − saα に対してほぼ確実に成り立つような定式正の d-次元行列 sq が存在する。 0.77
Examples such that A2 holds include regularized linear regression, where we take A1 = λI + a1a⊤ 1 , for some λ > 0 and under the assumption that ka1k is bounded almost surely. a2 が持つような例としては正規化線形回帰があり、ある λ > 0 に対して a1 = λi + a1a> 1 をとり、ka1k がほとんど確実に有界であるという仮定の下で考える。
訳抜け防止モード: A2 が持つ例 正規化線形回帰を含み、A1 = λI + a1a> 1 を取る。 ある λ > 0 に対して、かつ、ka1k がほぼ確実に有界であると仮定する。
0.70
The LSA recursion 1 ])θ = ¯b which is guaranteed to have a unique solution. lsa再帰 1 ])θ = θb は一意的な解を持つことを保証される。 0.65
(1) approximates the solution to (λI + E[a1a⊤ On the other hand, examples where A 2 does not hold are common. 1) は (λI + E[a1a) への解を近似するが、A 2 が持たない例は一般的である。 0.75
For this, we consider TD(0) learning with linear function approximation. そこで,線形関数近似を用いたtd(0)学習を考える。 0.74
For a Markov Reward Process with X as the state space, P : X × X → [0, 1] as the transition probability, R : X → R as the reward function, and γ ∈ (0, 1) as a discount factor, TD(0) learning is described as in (1) with X を状態空間とするマルコフ・リワード過程では、遷移確率として P : X × X → [0, 1] 、報酬関数として R : X → R 、割引係数として γ ∈ (0, 1) に対し、TD(0) 学習は(1) で記述される。 0.81
An = φ(xn){φ(xn) − γφ(x′ An = φ(xn){φ(xn) − γφ(x′) 0.99
n)}⊤, bn = R(xn)φ(xn) , bn = r(xn) φ(xn) , , bn = r(xn) φ(xn) , 0.72
(5) where φ : X → Rd is a feature map. (5) ここで φ : X → Rd は特徴写像である。 0.82
A typical setting is when xn is drawn from the stationary distribution of P and x′ n ∼ P(xn,·). 典型的な設定は、xn が P の定常分布から引き出されるときであり、x′n > P(xn,·) である。 0.83
It is easy to verify A1 provided that kφ(x)k, R(x) are bounded for all x ∈ X [36]. kφ(x)k, r(x) がすべての x ∈ x [36] に対して有界であるような a1 の検証は容易である。 0.78
However, A2 is violated as An is only rank-one. しかし、A2はランク1であるので違反される。 0.68
Our next endeavor is to establish moment estimates on the product below: 次の取り組みは、以下の製品のモーメント見積を確立することです。 0.68
We also define its expected value as G(α) The above product naturally appears after re-centering the LSA recursion (1). また、その期待値を g(α) と定義し、上記の積は lsa 再帰の後に自然に現れる(1)。 0.73
For any n ∈ N∗, 任意の n ∈ n∗ に対して 0.65
Γ(α) m:n =Qn Γ(α) m:n = qn 0.89
i=m(I − αAi) , m, n ∈ N∗, m ≤ n . i=m(I − αAi) , m, n ∈ N∗, m ≤ n である。 0.84
m:n] = (I − α ¯A)n−m+1. m:n] = (i − α ]a)n−m+1。 0.83
m:n = E[Γ(α) m:n = e[γ(α) 0.79
An easy induction implies that θn − θ⋆ =(cid:0)I − αAn(cid:1){θn−1 − θ⋆} + αεn , θn − θ⋆ = ˜θ(tr) 簡単に誘導すれば θn − θa = (cid:0)I − αAn(cid:1){θn−1 − θa} + αεn , θn − θa = θ(tr) 0.67
n = Γ(α) ˜θ(tr) n = γ(α) ]θ(tr) である。 0.76
n + ˜θ(fl) n , n + シュθ(fl) n , 0.91
1:n{θ0 − θ⋆} , 1:n{θ0 − θ } である。 0.79
εn = bn − ¯b − {An − ¯A}θ⋆ . εn = bn − >b − {An − >A}θ 。 0.82
˜θ(fl) n = αPn ˜θ(fl) n = αPn 0.96
j=1 Γ(α) j+1:nεj . j=1(α) j+1:nεj。 0.78
(6) (7) (8) (6) (7) (8) 0.85
The decomposition (8) highlights the two sources of error in the estimation of θ⋆ by {θn : n ∈ N} which will be separately tackled: {˜θ(tr) : n ∈ N} corresponds to the transient (or bias) term and {˜θ(fl) : n ∈ N} to the fluctuation term. 分解 (8) は θ を {θn : n ∈ N} で推定する際の2つの誤差源を強調し、これは別々に取り組まれる: { >θ(tr) : n ∈ N} は過渡的(あるいは偏り)項に対応し、 { >θ(fl) : n ∈ N} は揺らぎ項に対応する。 0.85
Both errors are controlled by the product of matrices Γ(α) m:n, thereby motivating the study of the moment bound on Γ(α) どちらの誤差も行列 >(α) m:n の積によって制御され、したがって >(α) に有界なモーメントの研究を動機付ける。 0.68
1:n as we present next. n 次は1:nです。 n 0.65
n 3 Moment and High-probability Bounds for Products of Random Matrices n ランダムマトリックス製品における3モーメントと高確率境界 0.84
ℓ=1 σp 1:n = E[Γ(α) l=1 σp 1:n = E[a(α)) 0.73
m:n decays exponentially with n − m. m:n は n − m で指数関数的に崩壊する。 0.70
ℓ (B)}1/p. For p, q ≥ 1 and random matrix X, we write kXkp,q = {E[kXkq l(B)}1/p。 p, q ≥ 1 およびランダム行列 X に対して、kXkp,q = {E[kXkq] と書く。 0.84
Recall from Proposition 1 that the expected value G(α) 1:n] decays exponentially with n, here we expect a similar phenomenon to hold for the moment bound of Γ(α) 1:n. Precisely, in this section, we show that if p is fixed, then there exists αp > 0 such that for any α ∈ (0, αp], the p-th moment of Γ(α) To facilitate our discussions, we introduce the following notations. 命題1から、期待値 g(α) 1:n] が n で指数関数的に崩壊することを思い出す。ここでは、同様の現象が γ(α) 1:n のモーメント境界に対して成立することを期待する。正確には、p が固定されているならば、任意の α ∈ (0, αp] に対して γ(α) の p 番目のモーメントである αp > 0 が存在することを示す。 0.76
For B ∈ Rd×d, we denote by (σℓ(B))d ℓ=1 its singular values. B ∈ Rd×d に対して、 (σl(B))d l=1 は特異値である。 0.83
For p ≥ 1, the Schatten p-norm is denoted by kBkp = {Pd In the following, we present the main technical result on the product of general random matrices. p ≥ 1 に対して、シャッテン p-ノルムは kBkp = {Pd で表される。
訳抜け防止モード: p ≥ 1 に対して、シャッテン p-ノルムは kBkp = { Pd で表される。 一般無作為行列の積に関する主な技術的結果を示す。
0.67
The proof is based on the framework introduced in [17]. 証明は[17]で導入されたフレームワークに基づいている。 0.77
Proposition 2. Let {Yℓ : ℓ ∈ N} be an independent sequence and P be a positive definite matrix. 命題2。 yl : l ∈ n} を独立列とし、p を正定値行列とする。
訳抜け防止モード: 命題2。 let { yl : l ∈ n } は独立列である そして p は正定値行列である。
0.60
Assume that for each ℓ ∈ N there exist mℓ ∈ (0, 1) and σℓ > 0 such that kE[Yℓ]k2 P ≤ 1 − mℓ and kYℓ − E[Yℓ]kP ≤ σℓ almost surely. 各 l ∈ N に対して ml ∈ (0, 1) と σl > 0 が存在し、kE[Yl]k2 P ≤ 1 − ml かつ kYl − E[Yl]kP ≤ σl がほぼ確実に存在すると仮定する。 0.93
Define Zn = Qn Yℓ = YnZn−1, for n ≥ 1 and starting from Z0. Zn = Qn Yl = YnZn−1 を n ≥ 1 とし、Z0 から始める。 0.91
Then, for any 2 ≤ q ≤ p and n ≥ 1, Yℓ=1 (1 − mℓ + (p − 1)σ2 すると、任意の 2 ≤ q ≤ p および n ≥ 1, Yl=1 (1 − ml + (p − 1)σ2 に対して、 0.88
ℓ )kP 1/2Z0P −1/2k2 l)kP 1/2Z0P −1/2k2 0.44
p,q ≤ κP p]}1/q. p,q ≤ κP p]1/q。 0.92
kZnk2 p,q , kZnk2 p,q, 0.76
(9) ℓ=0 n where κP = λ−1 (9) ℓ=0 n κP = λ−1 0.76
min(P )λmax(P ). min(P )λmax(P )。 0.84
4 4 0.85
英語(論文から抽出)日本語訳スコア
Proof of Proposition 2 . Let 2 ≤ q ≤ p. Consider the following decomposition Zn = YnZn−1 = (Yn − E[Yn])Zn−1 + E[Yn]Zn−1, Therefore, we obtain for any n ∈ N, 命題2の証明。 次の分解 Zn = YnZn−1 = (Yn − E[Yn])Zn−1 + E[Yn]Zn−1 を考えると、任意の n ∈ N に対して得られる。 0.63
fP (Zn) = An + Bn , An = fP ((Yn − E[Yn])Zn−1) , Bn = fP (E[Yn])fP (Zn−1) , fP (Zn) = An + Bn , An = fP ((Yn − E[Yn])Zn−1) , Bn = fP (E[Yn])fP (Zn−1) , 0.89
where fP : Rd×d → Rd×d is defined for any B ∈ Rd×d by fP (B) = P 1/2BP −1/2. fP : Rd×d → Rd×d は任意の B ∈ Rd×d に対して fP (B) = P 1/2BP −1/2 で定義される。 0.79
Since E[An|Bn] = 0, [17, Proposition 4.3] (see Proposition 10 in Appendix B) implies that E[An|Bn] = 0, [17, Proposition 4.3] (Appendix B の命題 10 を参照) から、これは意味する。 0.73
kfP (Zn)k2 kfP (Zn)k2 0.99
p,q ≤ kBnk2 p,q ≤ kBnk2 0.99
p,q + (p − 1)kAnk2 p,q + (p − 1)kAnk2 0.93
p,q . (10) It remains to bound the two terms on the right hand side. p,q。 (10) 右辺に2つの項がある。 0.65
To this end, we use [16, Theorem 6.20] この目的のために、[16, Theorem 6.20]を使う。 0.72
which implies that for any B1, B2 ∈ Rd×d, つまり、任意の B1 に対して B2 ∈ Rd×d, 0.81
kB1B2kp,q ≤ kB1kkB2kp,q . kB1B2kp,q ≤ kB1kB2kp,q 0.58
(11) As a result and using that for any B ∈ Rd×d, kBkP = kfP (B)k, and kYn − E[Yn]kP ≤ σn we (11) 結果として、任意の B ∈ Rd×d に対して kBkP = kfP (B)k, kYn − E[Yn]kP ≤ σn となる。 0.85
get p(cid:3)(cid:1)1/q p(cid:3)(cid:1)1/q つかまえて p(cid:3)(cid:1)1/q p(cid:3)(cid:1)1/q 0.63
kAnkp,q =(cid:0)E(cid:2)kfP (Yn − E[Yn])fP (Zn−1)kq PkfP (Zn−1)kq kAnkp,q =(cid:0)E(cid:2)kfP (Yn − E[Yn])fP (Zn−1)kq PkfP (Zn−1)kq 0.96
kBnk2 ≤ σnkfP (Zn−1)kp,q . kBnk2 ≤ σnkfP (Zn−1)kp,q。 0.78
Similarly, applying kE[Yn]k2 同様に kE[Yn]k2 を適用する。 0.71
≤(cid:0)E(cid:2)kYn − E[Yn]kq P ≤ 1 − mn p,q =(cid:0)E(cid:2)kfP (E[Yn])fP (Zn−1)kq ≤(cid:0)E(cid:2)kE[Yn]kq PkfP (Zn−1)kq p,q ≤ Qn 1:n using Proposition 2, we identify the latter with Yℓ = I−αAℓ, ℓ ≥ 1, Y0 = I. Q ≤ 1 − aα. ≤(cid:0)E(cid:2)kYn − E[Yn]kq P ≤ 1 − mn p,q =(cid:0)E(cid:2)kfP (E[Yn])fP (Zn−1)kq ≤(cid:0)E(cid:2)kE[Yn]kq PkfP (Zn−1)kq p,q ≤ Qn 1:n を Proposition 2 を用いて、後者を Yl = I−αAl, l ≥ 1, Y0 = I. Q ≤ 1 − aα と同定する。 0.95
Further, A Combining (12) and (13) in (10) yields for any n ∈ N∗, kfP (Zn)k2 1)σ2 upon using (11) which implies that kZnkp,q = kP −1/2fP (Zn)P 1/2kp,q ≤ √κPkfP (Zn)kp,q. さらにA 任意の n ∈ N∗ に対して (12) と (13) を (10) で組み合わせると、kfP (Zn)k2 1)σ2 は (11) を用いて得られるので、kZnkp,q = kP −1/2fP (Zn)P 1/2kp,q ≤ シュκPkfP (Zn)kp,q となる。 0.67
In order to bound Γ(α) As − ¯A is Hurwitz, applying Proposition 1 yields kE[Yℓ]k2 A を Hurwitz と結合するために、命題 1 を適用すると kE[Yl]k2 が得られる。
訳抜け防止モード: α ) を有界にするためには、-A は Hurwitz である。 命題 1 を適用すると kE[Yl]k2
0.73
p(cid:3)(cid:1)2/q p(cid:3)(cid:1)2/q n)kfP (Z0)k2 i=1(1 − mn + (p − 1)σ2 p(cid:3)(cid:1)2/q p(cid:3)(cid:1)2/q n)kfP (Z0)k2 i=1(1 − mn + (p − 1)σ2 0.80
p,q ≤ (1 − mn + (p − p,q. p,q ≤ (1 − mn + (p − p,q) である。 0.95
The proof is then completed そしてその証明が完成する 0.76
≤ (1 − mn)kfP (Zn−1)k2 ≤ (1 − mn)kfP (Zn−1)k2 0.94
Q = kI − α ¯Ak2 Q = kI − α >Ak2 0.87
n)kfP (Zn−1)k2 n)kfP(Zn−1)k2 0.85
p,q . (13) (12) p,q。 (13) (12) 0.81
1-(ii) ensures that almost surely, 1-(ii) はそれをほぼ確実にする。 0.68
kYℓ − E[Yℓ]kQ = αkAℓ − ¯AkQ ≤ 2α√κQ CA = bQα . kYl − E[Yl]kQ = αkAl − >AkQ ≤ 2α-κQ CA = bQα 。 0.78
Therefore, (9) holds with mℓ = aα and σℓ = bQα. したがって、(9) は ml = aα と σl = bQα で成り立つ。 0.77
Noting that as kIkp = d1/p, we obtain the following corollary. kIkp = d1/p であることに注意すると、次の系が得られる。 0.52
Corollary 1. Assume A1-(ii)-(iii). 第1話。 A1-(ii)-(iii) を仮定する。 0.61
Then, for any α ∈ [0, α∞], 2 ≤ q ≤ p, and n ∈ N, Qα2)n/2 , このとき、任意の α ∈ [0, α∞], 2 ≤ q ≤ p, n ∈ n, qα2)n/2 に対して。 0.87
1:nkp,q ≤ √κQd1/p(1 − aα + (p − 1)b2 1:nkp,q ≤ ,κqd1/p(1 − aα + (p − 1)b2 0.85
(14) E1/qhkΓ(α) (14) E1/qhk'(α) 0.78
1:nkqi ≤ kΓ(α) 1:nkqi ≤ kγ(α) 0.91
where α∞ was defined in (3), and ここでは (3) で α∞ が定義され 0.80
bQ = 2√κQ CA . bQ = 2 κQ CA。 0.80
(15) (16) Note that Corollary 1 shows supn∈N E[kΓ(α) (15) (16) Corollary 1 は supn~N E[k)(α) を示すことに注意。 0.78
1:nkp] < +∞ for any α ∈ (0, αp,∞], where 任意の α ∈ (0, αp,∞) に対して 1:nkp] < +∞ となる。 0.90
αp,∞ = α∞ ∧ a/(2b2 αp,∞ = α∞ , a/(2b2) 0.72
Q(p − 1)) . q(p − 1)) である。 0.76
This kind of condition relating the choice α with the order p of the moment to be bounded is necessary as illustrated in Example 1. 選択 α と有界なモーメントの位数 p に関するこの種の条件は、例 1 に示すように必要である。 0.68
The above corollary further leads to the high-probability bound: Corollary 2. 上述の行程は、さらに高確率境界へと導かれる。 0.45
Assume A 1-(ii)-(iii). A 1-(ii)-(iii) を仮定する。 0.75
Then, for any α ∈ (0, α∞) where α∞ was defined in (3), δ ∈ (0, 1) and n ∈ N, with probability at least 1 − δ, このとき、任意の α ∈ (0, α∞) に対して、 α∞ は (3), δ ∈ (0, 1), n ∈ n で定義され、確率は少なくとも 1 − δ である。 0.88
1:nk ≤ √κQ exph−(anα − α2b2 kΓ(α) 1:nk ≤ >κQ exph−(anα − α2b2 k ) 0.83
Qn)/2 + bQαp2n log(d/δ)i . Qn)/2 + bQαp2n log(d/δ)i。 0.70
Proof. The result follows from combining Corollary 1 with p = q and Lemma 1 in Appendix B applied with A = (− log(κQ)+aαn+b2 証明。 その結果は、A = (− log(κQ)+aαn+b2 で適用された Appendix B において、Corollary 1 と p = q と Lemma 1 を組み合わせて得られる。
訳抜け防止モード: 証明。 その結果は以下の通りである。 Corollary 1 と p = q を組み合わせる A = ( − log(κQ)+aαn+b2
0.73
Qn/2 and C = d, p0 = 2, p1 = +∞. Qn/2 と C = d, p0 = 2, p1 = +∞ である。 0.78
Qα2n)/2, B = α2b2 Qα2n)/2, B = α2b2 0.63
5 5 0.85
英語(論文から抽出)日本語訳スコア
The result which we obtain in Corollary 2 is tight with respect to δ, as illustrated via the following example that continues from Example 1. Corollary 2 で得られる結果は、例 1 から続く次の例で示されるように、δ に関して厳密である。 0.73
Example (Continuation of Example 1). Consider {θn : n ∈ N} defined by (1) with {An : n ∈ N∗} given in (4) and bn = 0 for any n ∈ N∗. 例(例1の継続) (4) で与えられる {An : n ∈ N∗} と任意の n ∈ N∗ に対して bn = 0 で (1) で定義される {θn : n ∈ N} を考える。 0.74
Define ϕq(α) = qA log(cid:18) 1 + α ¯αq = sup{ ¯α > 0 : ϕq(α) > 0, ∀ α ∈ (0, ¯α)} . φq(α) = qA log(cid:18) 1 + α >αq = sup{ >α > 0 : φq(α) > 0, φα ∈ (0, >α)} を定義する。 0.92
(17) Note that ϕq(α) ∼ α(2qA − 1) as α ↓ 0. 17) φq(α) > α(2qA − 1) が α > 0 であることに注意。 0.85
Therefore since qA > 1/2, { ¯α > 0 : ϕq(α) > 0 for any α ∈ (0, ¯α)} 6= ∅ and ¯αq is well-defined. したがって、qA > 1/2 であるため、任意の α ∈ (0, φα) > 0 に対して { ~α > 0 : φq(α) > 0 となる。 0.77
Consider also ˜ϕq(α) = ϕq(α) log−1[(1 + Then, we show in Appendix B that for any ¯δ ∈ (cid:0)e−2n ˜ϕq(α), 1(cid:1) and δ ∈ α)/(1 − α)]. 付録 b において、任意の δ ∈ (cid:0)e−2n に対して、1(cid:1) および δ ∈ α)/(1 − α)] が成り立つことを示す。
訳抜け防止モード: 付録 b において、任意の δ ∈ ( cid:0)e−2n に対して φq(α ) = φq(α ) log−1[(1 + ) であることを示す。 1(cid:1 ) and δ ∈ α)/(1 − α ) ] .
0.89
(e−n ˜ϕ2 1 − α(cid:19) − log(1 + α), (e−n〜φ2) 1 − α(cid:19) − log(1 + α) である。 0.69
q(α)/(qA(1−qA))−2−1 log(n), 1), q(α)/(qA(1−qA))−2−1 log(n), 1) 0.96
P θn ≥ exp −ϕq(α)n + log(cid:18) 1 + α P θn ≥ exp −φq(α)n + log(cid:18) 1 + α 0.92
1 − α(cid:19)r n log(1/¯δ) 1 − α(cid:19)r n log(1/ sδ) 0.84
2 P θn ≥ exp −ϕq(α)n + log(cid:18) 1 + α 2 P θn ≥ exp −φq(α)n + log(cid:18) 1 + α 0.89
1 − α(cid:19)rnqA(1 − qA) log(1/δ) + 1 − α(cid:19)rnqA(1 − qA) log(1/δ) + 0.96
n log(n) 2 n log(n) 2 0.85
!! ≤ ¯δ , !! !! ≤ ¯δ , !! 0.92
≥ δ . (18) ≥ δ . (18) 0.85
(19) Note that the bound given by (18) and (19) shows that the tail distribution associated with θn Indeed, if ξ is a zero-mean one dimensional Gaussian distribubehaves as a log-normal one. (19) 18) と (19) で与えられる境界は、θn に付随するテール分布が実際に 0-平均 1 次元ガウスディストリブベブが対数正規分布であるときに示される。 0.76
tion with unit variance, then an easy computation shows that for any σ > 0, P(eσξ ≥ t) ∼ (2πσ2)−1/2 log−1(t) exp(−(2σ2)−1t2) as t → ∞, therefore, to have P(eσξ ≥ tδ) ≤ δ for a small δ > 0, then tδ has to be of order exp(σplog(1/δ)). 単位分散による割当ては、任意の σ > 0 に対して p(eπσ2)−1/2 log−1(t) exp(−(2σ2)−1t2) を t → ∞ とすると、小さな δ > 0 に対して p(eσ ≥ tδ) ≤ δ となるので、tδ は exp(σplog(1/δ)) の次数である。 0.92
Proposition 3. Assume A1-(iii), kA1− ¯Ak ∈ SG(C′ where α∞ was defined in (3), 2 ≤ q ≤ p, and n ∈ N, 命題3。 ここで α∞ は (3), 2 ≤ q ≤ p, n ∈ N で定義される。
訳抜け防止モード: 命題3。 α∞ が (3 ) で定義されたとき、A1-(iii ) kA1- >Ak ∈ SG(C′) を仮定する。 2 ≤ q ≤ p ,n ∈ N ,
0.68
We conclude the section with a complementary result of Corollary 1 that does not require A1-(ii): A > 0. a1-(ii): a > 0 でなくてもよい1号の補足的な結果でこの節を締めくくる。 0.66
Then, for any α ∈ (0, α∞) すると、任意の α ∈ (0, α∞) に対して 0.76
A) for some C′ a)あるc′に対して 0.64
E1/qhkΓ(α) Q = 2√κQ C′ A. E1/qhk'(α) Q = 2\κQ C′ A。 0.68
1:nkqi ≤ kΓ(α) 1:nkqi ≤ kγ(α) 0.91
where b′ 1:nkp,q ≤ √κQd1/p(1 − aα + q(p − 1)(b′ b' は 1:nkp,q ≤ ,κqd1/p(1 − aα + q(p − 1)(b′) 0.69
Q)2α2)n/2 , Q)2α2)n/2, 0.70
(20) The proof is similar to that of Proposition 2 and it can be found in Appendix B. (20) この証明は命題2の証明と似ており、Appendix Bで見ることができる。 0.76
4 Finite-time High-probability Bounds for LSA 4 LSA用有限時間高確率境界 0.78
Relying on the results established in Section 3 and the decomposition (8), we derive in this section 第3節で定める結果と分解(8)に基づいて,本条で導出する。
訳抜け防止モード: 第3節で定められた結果と分解(8)に依拠する この節では
0.70
high probability bounds on u⊤{θn − θ⋆} for any n ∈ N and u ∈ Sd−1, where {θn : n ∈ N} is defined in (1). 任意の n ∈ n と u ∈ sd−1 に対して u 上の高い確率境界は、ここで {θn : n ∈ n} は (1) で定義される。 0.88
We begin our study with the transient term ˜θ(tr) following statement is given in Appendix C.1. 本研究は,付録 c.1 において,逐次的項 θ(tr) を用いて開始する。 0.67
defined in (8). The proof of the 8)で定義される。 その証拠は 0.62
n Proposition 4. Assume A1 and let p0 ≥ 2. n 命題4。 A1 を仮定して p0 ≥ 2 とする。 0.69
Then, for any n ∈ N∗, α ∈ (0, αp0,∞), where αp0,∞ is defined in (16), u ∈ Sd−1 and δ ∈ (0, 1) it holds with probability at least 1 − δ that 1:n(θ0 − θ⋆)| ≤ √κQd1/p0 (1 − aα/4)nkθ0 − θ⋆kδ−1/p0 , すると、任意の n ∈ N∗ に対して α ∈ (0, αp0,∞) は (16) u ∈ Sd−1 と δ ∈ (0, 1) で定義されるが、これは少なくとも 1 − δ で 1:n(θ0 − θ )| ≤ シュκQd1/p0 (1 − aα/4)nkθ0 − θ kδ−1/p0 となる確率で成り立つ。 0.82
|u⊤Γ(α) where a was defined in (3). ウガンダ(α) ここで a は (3) で定義される。 0.67
Proposition 4 only provides a polynomial high probability bound with respect to δ. 命題4は δ に対して束縛された多項式高確率のみを与える。 0.71
This is due to 1:nk up to a maximal order are uniformly bounded in これは 1:nk から最大階までの値が一様有界であるからである。 0.61
the fact that only polynomial moments of kΓ(α) the number of iterations n. We now turn on the fluctuation term ˜θ(fl) n defined in (8). kγ(α) の多項式モーメントのみが反復数 n であるという事実は、(8) で定義されるゆらぎ項 θ(fl) n をオンにする。 0.74
We note that under A 1, the sequence {εn : n ∈ N} defined in (7) is i.i.d.. From this observation and following [12], we consider the decomposition A 1 の下で (7) で定義される列 {εn : n ∈ N} が i.d. であることに注意する。
訳抜け防止モード: 1 の次数 { εn : に注意する。 7 ) で定義される n ∈ n } はこの観測から i.i.d. であり、[12 ] に従う。 分解を考えると
0.78
n ˜θ(fl) n = α n シュθ(fl) n = α 0.85
Xj=1 Γ(α) j+1:nεj = J (α,0) Xj=1 シュ(α) j+1:nεj = J(α,0) 0.67
n + H (α,0) n n +H(α,0) n 0.85
, (21) 6 , (21) 6 0.85
英語(論文から抽出)日本語訳スコア
where {(J (α,0) ここで {(J(α,0) 0.71
n , H (α,0) n n ,H(α,0) n 0.85
) : n ∈ N} are defined by induction for n ≥ 0 as: ) : n ∈ N} は n ≥ 0 の帰納法で定義される。 0.80
J (α,0) n+1 =(cid:0)I − α ¯A(cid:1) J (α,0) H (α,0) n+1 = (I − αAn) H (α,0) J (α,0) n+1 = (cid:0)I − α >A(cid:1) J (α,0) H (α,0) n+1 = (I − αAn) H (α,0) 0.78
n n + αεn+1 , n n + αεn+1 0.77
− α(An+1 − ¯A)J (α,0) -α(An+1 − >A)J(α,0) 0.76
n J (α,0) 0 , H (α,0) n J (α,0) 0 , H (α,0) 0.86
0 = 0 , = 0 . 0 = 0 , = 0 . 0.85
(22) The latter recurrence can be written as (22) 後者の再発は、次のように書くことができる。 0.65
J (α,0) n = α J (α,0) n = α 0.87
n Xj=1 G(α) n Xj=1 G(α) 0.76
j+1:nεj , H (α,0) j+1:nεj , H (α,0) 0.71
n = −α n Xj=1 n = −α n Xj=1 0.79
j+1:n(Aj − ¯A)J (α,0) Γ(α) j+1:n(Aj − >A)J(α,0) >(α) 0.87
j−1 . n Note that J (α,0) centered and i.i.d. j−1 . n j (α,0) と i.i.d. に注意。 0.71
under A 1. In our next results, we show that J (α,0) stepsize α ↓ 0. A1に該当する。 次の結果は、j (α,0) が α をステップ化することを示している。 0.59
Denote for any n ∈ N∗ and α > 0, the covariance matrix of J (α,0) 任意の n ∈ n∗ と α > 0 に対して、j (α,0) の共分散行列を表す。 0.68
is a linear statistics of the random variables {εj 確率変数 {εj の線形統計量です 0.68
n n : j ∈ {1, . n n j ∈ {1, . 0.78
. . , n}} which are is the leading term as the . . , n {\displaystyle ,n}} は the の先頭の項である 0.77
as Σα n = Cov(J (α,0) として Σα n = cov(j(α,0) 0.74
n ) . (23) n ) . (23) 0.85
Proposition 5. Assume A 1. 命題5。 1 を仮定する。 0.63
Then for any n ∈ N∗, α ∈ (0, α∞], where α∞ is defined in (3), u ∈ Sd−1 and δ ∈ (0, 1), it holds with probability at least 1 − δ, すると、任意の n ∈ N∗, α ∈ (0, α∞] に対して、α∞ は (3), u ∈ Sd−1 および δ ∈ (0, 1) で定義される。
訳抜け防止モード: すると、任意の n ∈ N∗ に対して α ∈ (0, α∞ ], where α∞ は (3 ) u ∈ Sd−1 および δ ∈ (0, 1 ) で定義される。 少なくとも 1 − δ の確率で成り立つ。
0.93
where D1 = 60√3e4/3 and D2 is defined in (50). ここで d1 = 603e4/3 と d2 は (50) で定義される。 0.63
n (cid:12)(cid:12)u⊤J (α,0) n (cid:12)(cid:12)u-J( α,0) 0.75
(cid:12)(cid:12) < D1q{u⊤Σα (cid:12)(cid:12) < D1q{u>Σα 0.60
nu} log(2/δ) + αp1 + log(1/(aα))D2 log3/2(2/δ) , nu} log(2/δ) + αp1 + log(1/(aα))D2 log3/2(2/δ) , 0.77
(24) The proof of Proposition 5 is postponed to Appendix C.2. (24) 命題5の証明は付録c.2に延期される。 0.77
We analyze further the covariance associated with J (α,0) α. さらに J (α,0) α に付随する共分散を解析する。 0.72
First, note that for any α ∈ (0, α2,∞], {Σα Σα = αP∞ Indeed, using Proposition 1, we easily get that for any n ≥ 0, まず、任意の α ∈ (0, α2,∞] に対して {Σα Σα = αP∞ 実際、命題 1 を用いて、任意の n ≥ 0 に対して容易にそれを得る。 0.83
k=0 G1:kΣεG⊤ k=0 G1:kΣεG! 0.51
1:k is the unique solution of the Ricatti equation 1:kはリカッティ方程式の唯一の解である 0.76
¯AΣα + Σα ¯A⊤ − α ¯AΣα ¯A⊤ = Σε , with Σε = E[ε1ε⊤ 1 ] . Σε = E[ε1ε> 1 ] である。 0.44
n and its dependence with respect to n and n : n ∈ N∗} converges to αΣα as n → ∞ where n そして、その n と n : n ∈ n∗} に対する依存は ασα に収束し n → ∞ となる。 0.84
(25) (26) n − αΣαk ≤ α2Xk>n kΣα (25) (26) n −αΣαk ≤ α2Xk>n kΣα 0.82
kG1:kk2kΣεk ≤ αa−1κQkΣεk(1 − αa)n . kG1:kk2kΣεk ≤ αa−1κQkΣεk(1 − αa)n 。 0.52
We now give an expansion of Σα with respect to α. 現在、我々は α に関して Σα の拡張を与える。 0.81
It is well-known that as α ↓ 0, Σα converges to σα は α を 0 とし、σα は収束する。 0.61
Σ, the unique solution of the Lyapunov equation (see [32, Lemma 9.1]) Lyapunov方程式のユニークな解であるΣ([32, Lemma 9.1]参照) 0.91
¯AΣ + Σ ¯A⊤ = Σε . σ aσ + σ aσ = σε である。 0.37
(27) Our next result states this convergence is of the order of the stepsize α. (27) 次の結果は、この収束がステップ化 α の次数であることを示している。 0.72
Proposition 6. Assume that A1-(iii) holds. 第6話。 A1-(iii) が成り立つと仮定する。 0.58
Then, for any α ∈ (0, α∞], where α∞ is defined in (3), すると、任意の α ∈ (0, α∞] に対して、α∞ は (3) で定義される。 0.81
where Σα and Σ are defined in (25) and (27) respectively and a is given in (3). ここで Σα と Σ はそれぞれ (25) と (27) で定義され、a は (3) で与えられる。 0.83
kΣα − ΣkQ ≤ αa−1k ¯AΣ ¯A⊤kQ , kΣα − ΣkQ ≤ αa−1k .AΣ . 0.58
n The proof is given in Appendix C.3. n 証明は appendix c.3 で与えられる。 0.81
The last step in bounding ˜θ(fl) proceed similarly to (22) and consider the decomposition H (α,0) {(J (α,1) 有界化における最後のステップは (22) と同様に進み、分解 H (α,0) {(J (α,1) を考える。 0.86
) : n ∈ N} are defined by induction for n ≥ 0 as: J (α,1) n+1 = (I − α ¯A)J (α,1) , H (α,1) n+1 = (I − αAn+1)H (α,1) ) : n ∈ N} は n ≥ 0 の帰納法で定義される: J (α,1) n+1 = (I − α )A)J (α,1) , H (α,1) n+1 = (I − αAn+1)H (α,1) 0.83
− α(An+1 − ¯A)J (α,0) -α(An+1 − >A)J(α,0) 0.76
− α(An+1 − ¯A)J (α,1) -α(An+1 − >A)J(α,1) 0.75
, H (α,1) n n ,H(α,1) n n 0.85
n n n n J (α,1) 0 , H (α,1) n n n n J (α,1) 0 , H (α,1) 0.85
0 = 0 , = 0 . 0 = 0 , = 0 . 0.85
n is to consider H (α,0) n は H (α,0) を考える 0.91
. We = J (α,1) . 私たち J(α,1) 0.79
n n + H (α,1) n n + H (α,1) 0.88
n , where (28) n どこに (28) 0.80
In our next results, we bound each term of this decomposition separately. 次の結果では、この分解の各項を別々に扱います。 0.70
Proposition 7. Assume A1 and let p0 ≥ 2. プロポーズ7。 A1 を仮定して p0 ≥ 2 とする。 0.59
Then, for any n ∈ N, α ∈ (0, αp0,∞), where αp0,∞ is defined in (16), u ∈ Sd−1 and δ ∈ (0, 1/2), with probability at least 1 − 2δ, it holds 0δ−1/p0 , すると、任意の n ∈ n に対して α ∈ (0, αp0,∞) であり、ここで αp0,∞ は (16), u ∈ sd−1 と δ ∈ (0, 1/2) で定義される。
訳抜け防止モード: すると、任意の n ∈ N に対して α ∈ ( 0, ここで αp0,∞ は (16 ) で定義される。 u ∈ Sd−1 および δ ∈ (0, 1/2 ) 少なくとも 1 − 2δ の確率では、0δ−1 / p0 となる。
0.86
(29) where D3 and D4 are given in (58) and (61), respectively. (29) D3 と D4 はそれぞれ (58) と (61) で与えられる。 0.80
n (cid:12)(cid:12)u⊤J (α,1) n (cid:12)(cid:12)u-J( α,1) 0.75
(cid:12)(cid:12) < eD3α log2(1/δ) , (cid:12)(cid:12) < eD3α log2(1/δ) , 0.72
n (cid:12)(cid:12)u⊤H (α,1) n (cid:12)(cid:12)u-H( α,1) 0.75
(cid:12)(cid:12) < D4αp2 (cid:12)(cid:12) < D4αp2 0.62
7 7 0.85
英語(論文から抽出)日本語訳スコア
The proof of Proposition 7 is postponed to Appendix C.4. 命題7の証明は付録c.4に延期される。 0.70
Now we are ready to combine the previous bounds and to state the main result of this section. 現在、私たちは以前の境界を結合し、この節の主な結果を記述する準備ができています。 0.65
Theorem 1. Assume A 1 and let p0 ≥ 2. 理論1。 A 1 を仮定して p0 ≥ 2 とする。 0.67
Then, for any n ∈ N, α ∈ (0, αp0,∞), where αp0,∞ is defined in (16), u ∈ Sd−1 and δ ∈ (0, 1/4), with probability at least 1 − 4δ, it holds すると、任意の n ∈ n に対して α ∈ (0, αp0,∞) であり、ここで αp0,∞ は (16), u ∈ sd−1 と δ ∈ (0, 1/4) で定義される。 0.78
α−1/2|u⊤(θn − θ⋆)| < D1p{u⊤Σαu} log(2/δ) + α1/2q(1)(α, δ) + (1 − aα/4)n∆(1)(α, δ) , 2/δ) + α1/2q(1)(α, δ) + (1 − aα/4)n*(1)(α, δ) である。
訳抜け防止モード: θn − θn)| < D1p{u>Σαu } log(2 / δ ) + α1/2q(1)(α,) δ ) + ( 1 − aα/4)n∆(1)(α , δ ) ,
0.83
where Σα is the unique solution of (25), D1 = 60√3e4/3, a is defined in (3), Σα が (25) の唯一の解であるとき、D1 = 60\3e4/3 は (3) で定義される。 0.67
q(1)(α, δ) = (cid:0)eD3 log2(1/δ) + p1 + log(1/aα)D2 log3/2(2/δ)(cid:1) + D4p2 0δ−1/p0 , ∆(1)(α, δ) = D1pa−1κQkΣεk log(2/δ) + √κQd1/p0kθ0 − θ⋆kα−1/2δ−1/p0 , q(1)(α, δ) = (cid:0)eD3 log2(1/δ) + p1 + log(1/aα)D2 log3/2(2/δ)(cid:1) + D4p2 0δ−1/p0 , s(1)(α, δ) = D1pa−1κQkΣεk log(2/δ) + sκQd1/p0kθ0 − θ =kα−1/2δ−1/p0 , 0.58
where κQ and Σε are defined in (3) and (25) respectively. κQ と Σε はそれぞれ (3) と (25) で定義される。 0.87
Proof. The proof follows from the decomposition 証明。 証明は分解から従う。 0.61
(30) (31) u⊤(θn − θ⋆) = u⊤Γ(α) , J (α,1) (30) (31) u-(θn − θn) = u-(α) , J (α, 1) 0.86
where J (α,0) and H (α,1) sition 5, (26) and Proposition 7. ここで J (α,0) と H (α,1) は 5 (26) と Proposition 7 である。 0.83
n n n 1:n(θ0 − θ⋆) + u⊤J (α,0) n n n 1:n(θ0 − θ) + u J (α,0) 0.86
n + u⊤J (α,1) n n -+(α,1) n 0.80
+ u⊤H (α,1) + u/h (α,1) 0.64
n , are defined in (22)-(28), the union bound and Proposition 4, Propo- n , is defined in (22)-(28), the Union bound and Proposition 4, Propo- 0.82
We now discuss the high probability bound (30). 現在、高い確率境界(30)について論じている。 0.59
First, note that the term ∆(1)(α, δ), and in particular the initial condition vanishes exponentially fast in the number of iterations n. In addition, q(1)(α, δ) and ∆(1)(α, δ) are of order δ−1/p0 as δ → 0 and therefore (30) provides polynomial high probability bounds on LSA. 第一に、初期条件は反復数 n において指数関数的に速く消えることに注意し、さらに q(1)(α, δ) と δ(1)(α, δ) は δ → 0 として位数 δ−1/p0 であり、したがって (30) は LSA 上の多項式高確率境界を与える。 0.77
However, this conclusion is expected as illustrated in Example 1. しかし、この結論は例1に示すように期待されている。 0.60
Finally, the discussion of (30) with respect to α is postponed to the next section. 最後に、(30)のαに関する議論は次の節に延期される。 0.68
Under A2 we can provide a better bound for H (α,1) Proposition 8. A2 の下では、H (α, 1) 命題 8 に対するより良い境界を与えることができる。 0.60
Assume A1 and A2. A1 と A2 を仮定する。 0.64
Then, for any n ∈ N, α ∈ (0, α∞ ∧ ˜α∞), where α∞ is defined in (3), u ∈ Sd−1 and δ ∈ (0, 1/2), with probability at least 1 − 2δ, it holds すると、任意の n ∈ N に対し、α ∈ (0, α∞ )、α∞ は (3), u ∈ Sd−1 および δ ∈ (0, 1/2) で定義されるが、確率は 1 − 2δ である。 0.88
n . where D3 and D5 are given in (58) and (62) respectively. n . d3 と d5 はそれぞれ (58) と (62) で与えられる。 0.83
n (cid:12)(cid:12)u⊤J (α,1) n (cid:12)(cid:12)u-J( α,1) 0.75
(cid:12)(cid:12) < eD3α log2(1/δ) , (cid:12)(cid:12) < eD3α log2(1/δ) , 0.72
n (cid:12)(cid:12)u⊤H (α,1) n (cid:12)(cid:12)u-H( α,1) 0.75
(cid:12)(cid:12) < eD5α log2(1/δ) , (cid:12)(cid:12) < eD5α log2(1/δ) , 0.72
(32) As a result, we can establish exponential high probability bounds with respect to δ. Theorem 2. (32) その結果、 δ. theorem 2 に関して指数関数高確率境界が確立される。 0.80
Assume A 1 and A 2. A 1 と A 2 を仮定する。 0.80
Then, for any n ∈ N, α ∈ (0, α∞ ∧ ˜α∞), u ∈ Sd−1 and δ ∈ (0, 1/4), with probability at least 1 − 4δ, it holds すると、任意の n ∈ n, α ∈ (0, α∞ ), u ∈ sd−1, δ ∈ (0, 1/4) に対して、少なくとも 1 − 4δ の確率で成り立つ。 0.94
α−1/2|u⊤(θn − θ⋆)| < D1p{u⊤Σαu} log(2/δ) + α1/2q(2)(α, δ) + (1 − α˜a)n/2∆(2)(α, δ) , 2/δ) + α1/2q(2)(α, δ) + (1 − α >a)n/2\(2)(α, δ) である。 0.74
where D1 = 60√3e4/3, Σα is solution of (25), D1 = 60 = 3e4/3, Σα は (25) の解である。 0.61
q(2)(α, δ) = e(D3 + D5) log2(1/δ) + p1 + log(1/˜aα)D2 log3/2(2/δ) , ∆(2)(α, δ) = D1q˜a−1κ ˜QkΣεk log(2/δ) + κ1/2 q(2)(α, δ) = e(d3 + d5) log2(1/δ) + p1 + log(1/ saα)d2 log3/2(2/δ) , s(2)(α, δ) = d1q ,a−1κ ,qkσεk log(2/δ) + κ1/2 0.73
˜Q kθ0 − θ⋆kα−1/2 , Q kθ0 − θ\kα-1/2 , 0.44
(33) where Σε is defined in (25). (33) ここで Σε は (25) で定義される。 0.79
Proof. The proof follows the lines of Theorem 1 with Proposition 8 used instead of Proposition 7. 証明。 この証明は命題7の代わりに使われる命題8の定理1の行に従う。 0.66
5 Optimality of the derived bounds with respect to α: analysis of (θn)n∈N as 5 α に関する導出境界の最適性: (θn)n~N の解析 0.75
a Markov chain Markov (複数形 Markovs) 0.45
In this section, we study the sequence {θn : n ∈ N} defined in (1) as a Markov chain. この節では、(1) で定義される列 {θn : n ∈ N} をマルコフ連鎖として研究する。 0.74
This perspective will allow us to show that the bounds that we derived in Theorem 1 are near-Berstein high probability bounds with respect to the stepsize α. Denote by Rα the Markov kernel associated with {θn : n ∈ N}. この見地から、定理 1 で導かれる境界がステップ化 α に関してベルシュタイン高確率境界であることを示すことができる。 rα によって、マルコフ核は {θn : n ∈ n} に付随する。 0.74
First, we show that if α is small enough then Rα is geometrically ergodic with respect to the Wasserstein distance of order 2 denoted by W2 and give a representation of its stationary distribution as an infinite sum. まず、α が十分小さいならば、rα は w2 で表される位数 2 のワッサーシュタイン距離に関して幾何学的にエルゴード的であり、その定常分布の表現を無限和として与える。
訳抜け防止モード: まず、もしも αは十分小さい このとき Rα は W2 で表される位数 2 のワッサーシュタイン距離に関して幾何学的にエルゴード的である そしてその定常分布を無限和として表現する。
0.77
8 8 0.85
英語(論文から抽出)日本語訳スコア
Theorem 3. Assume A1. 理論3。 A1を仮定する。 0.58
Then, for any α ∈ (0, α2,∞), where α2,∞ is defined in (16), Rα admits a unique stationary distribution πα ∈ P2(Rd) and for any n ∈ N, このとき、 α2,∞ が (16) で定義される任意の α ∈ (0, α2,∞) に対して、Rα は一意な定常分布 πα ∈ P2(Rd) と任意の n ∈ N を許す。 0.91
W 2 2 (δθRn W2 2(δθRn) 0.74
α, πα) ≤qκQd(1 − aα/2)nZRd k˜θ − θk2dπα(˜θ) . α, πα) ≤qκQd(1 − aα/2)nZRd k >θ − θk2dπα( >θ) 。 0.60
(34) Further, if {(Ak, bk) : k ∈ N−} is any sequence of i.i.d. (34) さらに、 {(Ak, bk) : k ∈ N−} が任意の i.i.d の列であれば、 0.78
random variables with the same distribution as (A1, b1), then the following limit exists almost surely and in L2 and has distribution πα: A1, b1 と同じ分布を持つ確率変数ならば、次の極限はほぼ確実に L2 に存在し、分布 πα を持つ。 0.78
θ(α) ∞ = lim θ(α) ∞ = lim 0.85
n→−∞ θ(α,←) n n→−∞ θ(α,α)n である。 0.61
, θ(α,←) n , θ(α,α)n である。 0.80
= α 1 Xk=n = α 1 Xk=n 0.76
Γk:0bk−1 , Γk:0 = γk:0bk−1 , γk:0 = 0.37
0 Yi=k (Id − αAi) . 0 Yi=k (Id − αAi)。 0.76
(35) The proof is postponed to Appendix E.1. (35) 証明はAppendix E.1に延期される。 0.78
Based on Theorem 1, we easily get concentration bounds Theorem 1 に基づいて簡単に濃度境界を得る 0.80
for the family of distributions {πα : α ∈ (0, α2,∞)} around θ⋆. 分布の族 {πα : α ∈ (0, α2,∞)} に対して θ は成立する。 0.77
Theorem 4. Assume A1 and let p0 ≥ 2. 理論4。 A1 を仮定して p0 ≥ 2 とする。 0.64
Then, for any α ∈ (0, αp0,∞), where αp0,∞ is defined in (16), u ∈ Sd−1 and δ ∈ (0, 1/4), with probability at least 1 − 4δ, it holds where Σ is the unique solution of (27), D1 = 60√3e2/3, a is defined in (3), and q(1)(α, δ) in (31). すると、 αp0,∞ が (16) u ∈ Sd−1 と δ ∈ (0, 1/4) で定義される任意の α ∈ (0, αp0,∞) に対して、少なくとも 1 − 4δ の確率で Σ が (27) の唯一の解であり、D1 = 60\3e2/3 のとき、a は (3) で、q(1)(α, δ) は (31) で定義される。 0.87
∞ − θ⋆)| < D1p{u⊤Σu} log(2/δ) + α1/2[a−1/2k ¯AΣ ¯A⊤k1/2 ∞ − θ )| < d1p{u>σu} log(2/δ) + α1/2[a−1/2k である。 0.63
α−1/2|u⊤(θ(α) α−1/2|u\(θ(α)) 0.57
Q + q(1)(α, δ)] , q + q(1)(α, δ)] , 0.80
(36) Proof. The proof follows from Theorem 1, the Portmanteau theorem [21, Theorem 13.16], and the fact that convergence in W2 implies weak convergence. (36) 証明。 この証明は、ポートマントーの定理 [21, Theorem 13.16] から従い、W2 における収束は弱収束を意味する。
訳抜け防止モード: (36) 証明。 この証明は Theorem 1, the Portmanteau theorem [21, Theorem 13.16 ] から従う。 W2 における収束は弱収束を意味する。
0.78
Our results is only polynomial in δ and we cannot expect improving this dependency as illustrated 我々の結果は δ の多項式であり、この依存性を改善することは期待できない。
訳抜け防止モード: 我々の結果はδ の多項式のみである この依存関係の改善は期待できません
0.80
in Example 1 for fixed α. 例 1 では α を固定する。 0.78
The leading term in (36) as α ↓ 0 is pD1{u⊤Σu}. 36) における α > 0 の先頭項は pD1{u>Σu} である。 0.72
In our next result, we establish a central limit theorem for the family (θ(α) ∞ )α∈(0,α2,∞] where Σ plays the role of the asymptotic covariance matrix. 次の結果は、 σ が漸近共分散行列の役割を担う族 (θ(α) ∞ ) αψ(0,α2,∞] に対する中心極限定理を確立する。
訳抜け防止モード: 次の結果では、族 ( θ(α ) ∞ ) α∂(0,α2,∞ ) に対して中心極限定理を定めます。 Σ は漸近共分散行列 (asymptotic covariance matrix) の役割を果たす。
0.74
As a result, (36) is a Bernstein-type high probability bound with respect to α and therefore (36) is sharp. その結果、 (36) は α に対して束縛されたバーンスタイン型高確率であり、したがって (36) はシャープである。 0.78
Define for any α ∈ (0, α2,∞], 任意の α ∈ (0, α2,∞) に対して定義する。 0.87
Theorem 5. Assume A1. 理論5。 A1を仮定する。 0.59
Then, the family {˜θ(α) すると、族 { θ(α) が成立する。 0.53
zero-mean Gaussian random variable with covariance matrix Σ defined by (27). 共分散行列 Σ が (27) で定義されるゼロ平均ガウス確率変数。 0.74
˜θ(α) ∞ = α−1/2{θ(α) ˜θ(α) ∞ = α−1/2{θ(α) 0.85
∞ − θ⋆} . (37) ∞ : α ∈ (0, α2,∞]} converges in law as α ↓ 0 to a ∞ − θ⋆} . (37) ∞ : α ∈ (0, α2,∞]} は α > 0 から a に収束する。 0.78
n for any n ∈ N. Define {J (α,←) Xk=n 任意の n ∈ N に対して n {\displaystyle n} を定義する。 0.68
J (α,←) n J (α, b) n 0.76
= α n 1 Note that this result was established in [28, Theorem 1] for general stochastic approximation = α n 1 一般確率近似のための[28, Theorem 1]にこの結果が確立されたことに注意。 0.81
schemes but under stronger conditions on the sequence {εn : n ∈ N∗}. 順序 {εn : n ∈ n∗} 上のより強い条件下でのスキーム。 0.79
In particular, it is assumed that the distribution of ε1 admits a density with respect to the Lebesgue measure. 特に、ε1 の分布はルベーグ測度に関して密度を持つことが仮定されている。 0.70
We relax this condition and provide a new proof for this result. 我々はこの条件を緩和し、この結果に対する新しい証拠を提供する。 0.66
In particular, our strategy to establish Theorem 5 is to consider the decomposition (21) of {θn : n ∈ N} with θ0 = 0, since in such case θn = ˜θ(fl) 特に、定理5を確立するための我々の戦略は、θ0 = 0 の {θn : n ∈ N} の分解 (21) を考えることである。 0.65
: n ∈ N−} by : n ∈ n−} による 0.81
n Gk:0 = Yi=k n Gk:0 = Yi=k 0.71
, J (α,←) , J (α, b) 0.75
Gk:0εk−1 , gk:0εk−1 , 0.35
−n+1 has the same distribution as θ(α) −n+1 は θ(α) と同じ分布を持つ 0.84
(I − α ¯A) . (i − α) である。 0.73
starting from θ0 = 0 and J (α,0) Note that for any n ∈ N, θ(α,←) −n+1 admits a limit in L2 and almost surely denoted by J (α,←) as J (α,←) −n+1 . θ0 = 0 と J (α, 0) から始めると、任意の n ∈ N に対して θ(α, ) −n+1 は L2 の極限を認め、ほぼ確実に J (α, ) として J (α, ) −n+1 と表される。 0.85
In contrast to J (α,0) ∞ . 対照的に j (α,0) ∞ である。 0.62
Then, we get for any u ∈ Sd−1, α ∈ (0, α2,∞], bounded and Lipschitz functions f : R → R, with Lipschitz constant smaller than 1, by the Lebesgue dominated convergence theorem |E[f (u⊤ ˜θ(α,←) = lim すると、任意の u ∈ Sd−1, α ∈ (0, α2,∞] に対して、リプシッツ定数が 1 より小さい有界およびリプシッツ函数 f : R → R が、ルベーグ支配収束定理 |E[f(u> >θ(α, )) = lim によって得られる。 0.88
n→+∞|E[f (α−1/2u⊤[θ(α,←) E[|α−1/2u⊤H (α,0) n→+∞|E[f (α−1/2u⊤[θ(α) |] . n→+∞|E[f (α−1/2u)[θ(α, ) E[|α−1/2u)H(α, 0) n→+∞|E[f (α−1/2u)[θ(α) |]。 0.63
Using the decomposition H (α,0) ) : n ∈ N} are defined in (28) and plugging the bounds provided by Proposition 11 and Proposition 12 in Appendix C.4 shows that 分解 H (α,0) ) : n ∈ N} は (28) で定義され、 Appendix C.4 の Proposition 11 と Proposition 12 によって与えられる境界を埋める。 0.88
−n+1 − θ⋆])] − E[f (α−1/2u⊤J (α,←) −n+1 )]| n − θ⋆])] − E[f (α−1/2u⊤J (α,0) −n+1 − θ ]] − E[f (α−1/2u)J (α, ) −n+1 )]| n − θ ]] − E[f (α−1/2u)J (α, 0) 0.82
∞ )] − E[f (α−1/2u⊤J (α,←) ∞ )] − E[f (α−1/2u)J (α, ) 0.87
)]| ≤ lim sup n→+∞ , H (α,1) )]| ≤ lim sup n→+∞ , H (α, 1) 0.93
, where {(J (α,1) , where {(J(α,1) 0.96
∞ )]| + H (α,1) ∞ )]| + H(α,1) 0.69
= J (α,1) = lim J(α,1) =lim 0.72
(38) n n n (38) n n n 0.85
n n n n n 0 n n n n n 0 0.85
n lim sup α→0 n lim sup α→0 0.76
|E[f (u⊤ ˜θ(α,←) e[f (u] ]θ(α,α) である。 0.68
∞ )] − E[f (α−1/2u⊤J (α,←) ∞ )] − E[f (α−1/2u)J (α, ) 0.87
∞ )]| = 0 . ∞ )]| = 0 . 0.64
9 9 0.85
英語(論文から抽出)日本語訳スコア
Therefore by the Cramer Wold device and the Portmanteau theorem [21, Theorem 13.16], Theorem 5 follows from the next result. したがって、クラー・ウォルド・デバイスとポートマントーの定理 [21, theorem 13.16] により、定理5は次の結果から従う。 0.71
Proposition 9. Assume A1. 命題9。 A1を仮定する。 0.56
Then, for any u ∈ Sd−1, {α−1/2u⊤J (α,←) : α ∈ (0, α2,∞]} converges in distribution to the zero-mean Gaussian distribution with variance u⊤Σu where Σ is given in (27). すると、任意の u ∈ sd−1 に対して、 {α−1/2u\j (α,\) : α ∈ (0, α2,∞]} は分布が零平均ガウス分布に収束する(ここで σ は (27) で与えられる)。 0.79
∞ The proof is postponed to Appendix E.2. ∞ 証明はAppendix E.2に延期される。 0.78
6 Conclusion In this paper, we provided a novel non-asymptotic analysis of LSA algorithms with fixed stepsize. 6 結論 本稿では,LSAアルゴリズムのステップサイズを固定した非漸近解析を行った。 0.76
For any δ ∈ (0, 1), we obtain bounds on the sequence {kθn − θ⋆k : n ∈ N} that holds with probability at least 1 − δ. 任意の δ ∈ (0, 1) に対して、少なくとも 1 − δ の確率を持つ列 {kθn − θ\k : n ∈ n} 上の境界が得られる。 0.85
The bounds are proven to be tight with respect to the stepsize, and we show that these bounds necessarily have polynomial dependency in δ. 境界は段数に関して厳密であることが証明され、これらの境界が必ずδ に多項式依存を持つことが示される。 0.69
Importantly, our results do not require the matrices An to be symmetric but only Hurwitz, which enables one to apply them to various scenarios such as reinforcement learning. 重要なことに、この結果は行列 an が対称である必要はなく、ハーウィッツのみであり、強化学習のような様々なシナリオに適用することができる。 0.66
Future work includes extending our high probability bounds to a larger panel of random noise, e g , with heavy tailed distribution, Markovian dependency, as well as Polyak-Ruppert averaging. 将来の研究には、確率境界をより大きなランダムノイズのパネル、例えば、重い尾の分布、マルコフ依存、およびPolyak-Ruppert平均化にまで拡張することが含まれる。 0.66
References [1] R. B. Ash. 参考文献 [1] r. b. ash。 0.68
Information theory. Tracts in Pure & Applied Mathematics. 情報理論。 純粋数学と応用数学の分野。 0.74
John Wiley & Sons John Wiley & Sons 0.85
Inc, 1966. ISBN 0470034459,978047003 4453. 1966年。 ISBN 0470034459,978047003 4453 0.65
[2] F. Bach and E. Moulines. [2] F. Bach and E. Moulines 0.89
tion with convergence rate o(1/n). 収束率はo(1/n)である。 0.64
Z. Ghahramani, tion Processing Systems, https://proceedings. neurips.cc/paper/201 3/file/7fe1f8abaad09 4e0b5cb1b01d712f708- Paper.pdf. Z. Ghahramani, tion Processing Systems, https://proceedings. neurips.cc/paper/201 3/file/7fe1f8abaad09 4e0b5cb1b01d712f708- Paper.pdf 0.29
Non-strongly-convex smooth stochastic approximaIn C. J. C. Burges, L. Bottou, M. Welling, InformaURL C. J. C. Burges, L. Bottou, M. Welling, InformaURL 0.68
volume 26. Curran Associates, 第26巻。 Curran Associates 0.56
in Neural 2013. 2013年、ニューラル。 0.64
Inc., and K. Q. Weinberger, Inc. そして、K. Q. Weinberger 0.78
editors, Advances [3] A. Benveniste, M. Métivier, and P. Priouret. 編集・編集・編集 [3] a. benveniste, m. métivier, p. priouret。 0.59
Adaptive algorithms and stochastic approxima- 適応アルゴリズムと確率近似- 0.84
tions, volume 22. オプション、巻22。 0.41
Springer Science & Business Media, 2012. Springer Science & Business Media、2012年。 0.85
[4] D. P. Bertsekas and J. N. Tsitsiklis. 4] d. p. bertsekasとj. n. tsitsiklis。 0.73
Parallel and distributed computation: numerical methods. 並列および分散計算:数値計算法。 0.79
2003. [5] J. Bhandari, D. Russo, and R. Singal. 2003. J. Bhandari, D. Russo, R. Singal. 0.75
A finite time analysis of temporal difference learning with linear function approximation. 線形関数近似を用いた時間差学習の有限時間解析 0.76
In Conference On Learning Theory, pages 1691–1692, 2018. 学習理論に関する会議』1691-1692, 2018年。 0.79
[6] V. S. Borkar. 6] v. s. ボルカー 0.56
Stochastic Approximation: A Dynamical Systems Viewpoint. 確率近似(Stochastic Approximation): 動的システム視点。 0.73
Cambridge Univer- sity Press, 2008. ケンブリッジ大学 sity press、2008年。 0.67
[7] L. Bottou, F. E. Curtis, and J. Nocedal. [7] L. Bottou, F. E. Curtis, J. Nocedal. 0.94
Optimization methods for large-scale machine learning. 大規模機械学習のための最適化手法 0.75
Siam Review, 60(2):223–311, 2018. Siam Review, 60(2):223–311, 2018。 0.89
[8] S. Boucheron, G. Lugosi, and P. Massart. S. Boucheron, G. Lugosi, P. Massart. 0.64
Concentration inequalities: A nonasymptotic theory 濃度の不等式:非漸近理論 0.76
of independence. Oxford University Press, 2013. 独立の為です オックスフォード大学出版局、2013年。 0.63
[9] S. Chen, A. Devraj, A. Busic, and S. Meyn. 9]S. Chen, A. Devraj, A. Busic, S. Meyn 0.83
Explicit mean-square error bounds for monte-carlo and linear stochastic approximation. モンテカルロおよび線形確率近似に対する平均二乗誤差境界の明示 0.68
In International Conference on Artificial Intelligence and Statistics, pages 4173–4183. 人工知能と統計に関する国際会議』4173-4183頁。 0.72
PMLR, 2020. PMLR、2020年。 0.88
[10] X. Chen, J. D. Lee, X. T. Tong, Y. Zhang, et al Statistical inference for model parameters in [10] X. Chen, J. D. Lee, X. T. Tong, Y. Zhang, その他モデルパラメータの統計的推測 0.87
stochastic gradient descent. The Annals of Statistics, 48(1):251–273, 2020. 確率勾配降下 The Annals of Statistics, 48(1):251–273, 2020 0.66
[11] G. Dalal, B. Szörényi, G. Thoppe, and S. Mannor. G. Dalal, B. Szörényi, G. Thoppe, S. Mannor. 0.74
Finite sample analyses for TD(0) with TD(0)の有限サンプル解析 0.64
function approximation. In Thirty-Second AAAI Conference on Artificial Intelligence, 2018. 関数近似。 2018年、AIに関する第3回AAAI会議。 0.66
[12] A. Durmus, E. Moulines, A. Naumov, S. Samsonov, and H.-T. Wai. A. Durmus, E. Moulines, A. Naumov, S. Samsonov, H.-T. Wai. 0.91
On the stability of random matrix product with markovian noise: Application to linear stochastic approximation and td learning, 2021. マルコフ雑音を伴うランダム行列積の安定性について:線形確率近似とtd学習への応用, 2021。 0.80
[13] N. Frikha, S. Menozzi, et al Concentration bounds for stochastic approximations. 13] N. Frikha, S. Menozzi, et al concentration bounds for stochastic approximations。 0.85
Electronic Communications in Probability, 17, 2012. 電子 2012年4月17日、放送開始。 0.52
10 10 0.85
英語(論文から抽出)日本語訳スコア
[14] S. Guo, F. Qi, and H. M. Srivastava. [14]S.Guo,F.Qi,H.M.Sriva stava 0.67
Necessary and sufficient conditions for two classes of functions to be logarithmically completely monotonic. 2つの関数のクラスが対数的に完全単調である必要十分条件。 0.71
Integral Transforms and Special Functions, 18(11):819–826, 2007. doi: 10.1080/106524607015 28933. 積分変換と特殊関数 18(11):819–826, 2007 doi: 10.1080/106524606015 28933 0.76
URL https://doi.org/10.1 080/1065246070152893 3. URL https://doi.org/10.1 080/1065246070152893 3 0.46
[15] P. Hall and C. Heyde. [15]P.ホールとC.ハイド。 0.82
Martingale Limit Theory and Its Application. マルティンゲール極限理論とその応用 0.68
Academic Press, 1980. 新聞社、1980年。 0.58
[16] F. Hiai and D. Petz. [16]F. HiaiとD. Petz。 0.85
Introduction to Matrix Analysis and Applications. マトリックス分析と応用入門 0.50
Universitext. Springer 大学卒。 Springer 0.65
International Publishing, 2014. 2014年、国際出版。 0.89
ISBN 9783319041506. ISBN 9783319041506。 0.83
[17] D. Huang, J. Niles-Weed, J. [17]D. Huang, J. Niles-Weed, J. 0.87
A. Tropp, and R. Ward. A・トロップとR・ウォード。 0.60
Matrix concentration for products. 製品に対するマトリックス濃度。 0.84
arXiv preprint arXiv:2003.05437, 2020. arXiv arXiv: 2003.05437, 2020 0.79
[18] B. Jacob and H. Zwart. 18] b. jacob と h. zwart です 0.75
Linear Port-Hamiltonian Systems on Infinite-dimensional Spaces. 無限次元空間上の線形ポート-ハミルトン系 0.66
Number 223 in Operator Theory: Advances and Applications. 演算子理論における223番:進歩と応用。 0.70
Springer, 2012. ISBN 978-3-03480398-4. doi: 10.1007/978-3-0348-0 399-1. 2012年春。 ISBN 978-3-03480398-4. doi: 10.1007/978-3-0348-0 399-1. 0.40
10.1007/978-3-0348-0 399-1. 10.1007/978-3-0348-0 399-1. 0.24
[19] P. Jain, S. M. Kakade, R. Kidambi, P. Netrapalli, and A. Sidford. P. Jain, S. M. Kakade, R. Kidambi, P. Netrapalli, A. Sidford. 0.84
Accelerating stochastic gradient descent for least squares regression. 最小二乗回帰に対する確率勾配降下の加速 0.64
In Conference On Learning Theory, pages 545– 604. 第545-604頁。 0.24
PMLR, 2018. 2018年、PMLR。 0.68
[20] P. Jain, D. Nagaraj, and P. Netrapalli. P. Jain, D. Nagaraj, P. Netrapalli. 0.65
Making the last iterate of sgd information theoretically optimal. sgd 情報の最後の反復を理論的に最適にする。 0.70
In A. Beygelzimer and D. Hsu, editors, Proceedings of the Thirty-Second Conference on Learning Theory, volume 99 of Proceedings of Machine Learning Research, pages 1752– 1755, Phoenix, USA, 25–28 Jun 2019. a. beygelzimer and d. hsu, editors, proceedings of the 32-second conference on learning theory, volume 99 of proceedings of machine learning research, pages 1752–1755, phoenix, usa, 25–28 jun 2019 (英語) 0.84
PMLR. [21] A. Klenke. PMLR。 21] a・クレンケ 0.59
Probability Theory: A Comprehensive Course. 確率論:総合的なコース。 0.74
Universitext. Springer London, 大学卒。 スプリンガー・ロンドン 0.51
2013. ISBN 9781447153603. 2013. isbn 9781447153603所属。 0.75
[22] H. Kushner and G. G. Yin. H. Kushner と G. G. Yin. 0.74
Stochastic approximation and recursive algorithms and applica- 確率近似と再帰的アルゴリズムと乗法- 0.76
tions, volume 35. オプション、巻35。 0.38
Springer Science & Business Media, 2003. 専門は2003年出版の『Springer Science & Business Media』。 0.50
[23] C. Lakshminarayanan and C. Szepesvari. 23] c. lakshminarayanan, c. szepesvari。 0.71
Linear stochastic approximation: How far does constant step-size and iterate averaging go? 線形確率近似:定数ステップサイズと反復平均化はどこまで進むか? 0.73
In A. Storkey and F. Perez-Cruz, editors, Proceedings of the Twenty-First International Conference on Artificial Intelligence and Statistics, volume 84 of Proceedings of Machine Learning Research, pages 1347–1355. A. Storkey and F. Perez-Cruz, editors, Proceedings of the Tceedings of the Twenty-First International Conference on Artificial Intelligence and Statistics, Volume 84 of Proceedings of Machine Learning Research, pages 1347–1355 0.88
PMLR, 2018. 2018年、PMLR。 0.68
[24] O. Macchi and E. Eweda. [24]O.MacchiとE.Eweda。 0.62
Second-order convergence analysis of stochastic adaptive linear 確率的適応線形の二階収束解析 0.76
filtering. IEEE Transactions on Automatic Control, 28(1):76–85, 1983. フィルタリング。 IEEE Transactions on Automatic Control, 28(1):76–85, 1983 0.83
[25] A. Nemirovski, A. Juditsky, G. Lan, and A. Shapiro. A. Nemirovski, A. Juditsky, G. Lan, A. Shapiro. 0.77
Robust stochastic approximation approach ロバスト確率近似アプローチ 0.66
to stochastic programming. 確率的プログラミングです 0.56
SIAM Journal on optimization, 19(4):1574–1609, 2009. SIAM Journal on optimization, 19(4):1574–1609, 2009 0.93
[26] Y. Nesterov and J.-P. Vial. [26]Y. NesterovとJ.-P. Vial。 0.68
Confidence level solutions for stochastic programming. 確率的プログラミングのための信頼レベルソリューション。 0.69
Automatica, 44(6):1559–1568, 2008. 自動。 44(6):1559–1568, 2008. 0.75
[27] B. Pepin. 【27】b.ペピン。 0.62
Concentration inequalities for additive functionals: A martingale approach. 加法機能に対する濃度不等式 : マーチンゲールアプローチ 0.73
Stochas- tic Processes and their Applications, 135:103–138, 2021. Stochas- tic Processs and their Applications, 135:103–138, 2021。 0.79
[28] G. Pflug. [28] g. pflug. 0.92
Stochastic Minimization with Constant Step-Size: Asymptotic Laws. 一定のステップサイズを持つ確率最小化:漸近法則 0.68
SIAM Journal on Control and Optimization, 24(4):655–666, 1986. doi: 10.1137/0324039. SIAM Journal on Control and Optimization, 24(4):655–666, 1986. doi: 10.1137/0324039. 0.83
URL https://doi.org/10.1 137/0324039. URL https://doi.org/10.1 137/0324039。 0.43
[29] I. Pinelis. pinelis (複数形 pineliss) 0.39
An Approach to Inequalities アプローチ へ 不平等 0.56
of Dimensional Martingales, 1992. https://doi.org/10.1 007/978-1-4612-0367- 4_9. ですから ^ Martingales, 1992. https://doi.org/10.1 007/978-1-4612-0367- 4_9. 0.42
pages 128–134. doi: 128-134頁。 Doi: 0.60
ISBN 978-1-4612-0367-4. ISBN 978-1-4612-0367-4。 0.37
the Distributions for InfiniteBirkhäuser Boston, Boston, MA, URL 分布 Infinite Birkhäuser Boston, Boston, MA, URL 0.67
10.1007/978-1-4612-0 367-4_9. 10.1007/978-1-4612-0 367-4_9. 0.21
[30] I. Pinelis. pinelis (複数形 pineliss) 0.37
Optimum Bounds for the Distributions of Martingales in Banach Spaces. バナッハ空間におけるマルティンゲール分布の最適境界 0.64
The doi: 10.1214/aop/11769884 77. doi:10.1214/aop/1176 988477。 0.47
URL Annals of Probability, 22(4):1679 – 1706, 1994. https://doi.org/10.1 214/aop/1176988477. URL Annals of Probability, 22(4):1679– 1706, 1994.https://doi.org /10.1214/aop/1176988 477 0.74
[31] B. T. Polyak and A. [31] b. t. polyak と a。 0.89
B. Juditsky. B.ジュディツキー。 0.48
Acceleration of stochastic approximation by averaging. 平均化による確率近似の高速化 0.69
SIAM journal on control and optimization, 30(4):838–855, 1992. SIAM journal on control and optimization, 30(4):838–855, 1992年。 0.87
[32] A. S. Poznyak. [32]A.S. Poznyak. 0.88
Advanced Mathematical Tools for Automatic Control Engineers: Deterministic 自動制御エンジニアのための高度な数学的ツール:決定論的 0.63
Techniques. Elsevier, Oxford, 2008. テクニック。 オックスフォード大学エルゼビア校、2008年。 0.57
[33] A. Rakhlin, O. Shamir, and K. Sridharan. A. Rakhlin, O. Shamir, K. Sridharan. 0.68
Making gradient descent optimal for strongly convex stochastic optimization. 強凸確率最適化のための勾配降下最適化 0.81
In Proceedings of the 29th International Coference on International Conference on Machine Learning, pages 1571–1578, 2012. The 29th International Coference on International Conference on Machine Learning, page 1571–1578, 2012 (英語) 0.87
11 11 0.85
英語(論文から抽出)日本語訳スコア
[34] R. Srikant and L. Ying. [34]R.SrikantとL.Ying。 0.70
Finite-Time Error Bounds For Linear Stochastic Approximation and 線形確率近似と有限時間誤差境界 0.64
TD Learning. In Conference on Learning Theory, 2019. TD学習。 2019年 学習理論学会会長。 0.67
[35] R. S. Sutton. [35]R.S.サットン。 0.77
Learning to predict by the methods of temporal differences. 時間差の方法による予測の学習。 0.67
Machine Learning, 3(1):9–44, Aug 1988. 機械学習。 3:9-44, 1988年8月。 0.67
ISSN 1573-0565. doi: 10.1007/BF00115009. ISSN 1573-0565. doi: 10.1007/BF00115009 0.57
[36] J. N. Tsitsiklis and B. [36] J. N. Tsitsiklis, B. 0.91
Van Roy. An analysis of temporal-difference learning with function approximation. ヴァン・ロイ。 関数近似を用いた時間差学習の解析 0.75
IEEE Transactions on Automatic Control, 42(5):674–690, May 1997. IEEE Transactions on Automatic Control, 42(5):674–690, May 1997 0.91
ISSN 2334-3303. doi: 10.1109/9.580874. ISSN 2334-3303. doi: 10.1109/9.580874 0.54
[37] C. Villani. [37] c. villani。 0.88
Optimal transport : old and new. 最適輸送 : 古いものと新しいもの。 0.79
Grundlehren der mathematischen Wissenschaften. Springer, Berlin, 2009. 数学を専門とする。 2009年、ベルリン。 0.55
ISBN 978-3-540-71049-3. ISBN 978-3-540-71049-3。 0.38
[38] C. J. Watkins and P. Dayan. [38]C.J.ワトキンスとP.デイアン。 0.64
Q-learning. Machine learning, 8(3-4):279–292, 1992. Q学習。 機械学習 8(3-4):279–292, 1992。 0.76
A Proofs of Section 2 A.1 Proofs of Proposition 1 第2節の証明 A.1 命題1の証明 0.63
The existence and uniqueness of Q follows from [32, Lemma 9.1, p. 140]. Q の存在と特異性は [32, Lemma 9.1, p. 140] から従う。 0.85
Regarding the second statement, note that for any x ∈ Rd \ {0}, we have 第二の言明については、任意の x ∈ Rd \ {0} に対して、我々はあることに注意する。 0.67
x⊤(I − α ¯A)⊤Q(I − α ¯A)x x\(I − α >A)\Q(I − α >A)x 0.83
x⊤Qx = 1 − α kxk2 x‐Qx = 1 − α kxk2 0.76
x⊤Qx + α2 x⊤ ¯A⊤Q ¯Ax x‐Qx + α2 x である。 0.62
x⊤Qx . Hence, we get that for all α ∈ [0, α∞], + α2 x⊤ ¯A⊤Q ¯Ax x‐Qx . したがって、すべての α ∈ [0, α∞] , + α2 x に対して、これは成立する。 0.73
1 − α kxk2 1 − α kxk2 0.98
x⊤Qx x⊤Qx ≤ 1 − αkQk−1 + α2k ¯Ak2 x‐Qx x\qx ≤ 1 − αkqk−1 + α2k sak2 0.55
Q ≤ 1 − (1/2)kQk−1α . Q ≤ 1 − (1/2)kQk−1α 。 0.71
The proof is completed using that for any matrix ¯A ∈ Rd×d, k ¯AkQ ≤ κ1/2 証明は任意の行列 , A ∈ Rd×d に対して k , AkQ ≤ κ1/2 で完結する。 0.67
Q k ¯Ak. A.2 Proof for Example 1 略称は「Ak」。 a.2 の例 1 0.60
The existence and uniqueness of the stationary distribution πα is a consequence of Theorem 3 noting that A1 is satisfied for the particular case that we consider. 定常分布 πα の存在と一意性は、A1 が我々が考慮する特定の場合に対して満足であることを示す定理 3 の結果である。 0.73
We now show the second statement. 第2の声明をお見せします 0.58
Let α ∈ (0, α2,∞). α ∈ (0, α2,∞) とする。 0.79
First, note that since b1 is a zero-mean Gaussian random variables with unit variance independent of A1, we have for any p ≥ 1, まず、b1 は a1 とは独立な単位分散を持つ零平均ガウス確率変数であるため、任意の p ≥ 1 に対して有する。 0.73
E[θ2p 1 ] = E[θ2p] 1 ] = 0.75
]E[(1 − αA1)2p−k]E[bk 1] ]E[(1 − αA1)2p−k]E[bk1] 0.94
2p Xk=0(cid:18)2p 2p Xk=0(cid:18)2p 0.71
0 k(cid:19)E[θ2p−k Xk=0(cid:18)2p 0 k(cid:19)E[θ2p−k Xk=0(cid:18)2p 0.74
p 2k(cid:19)E[θ2(p−k) p 2k(cid:19)E[θ2(p−k) 0.81
0 = 0 ]E[(1 − αA1)2p] . 0 = 0 ]E[(1 − αA1)2p]。 0.83
This shows that taking θ0 with distribution πα that ifRR |θ|2pdπα(θ) < +∞, then it is necessary that E[(1 − αA1)2p] ≤ 1. これは θ0 を分布 πα とし、RR |θ|2pdπα(θ) < +∞ とすると、E[(1 − αA1)2p] ≤ 1 となる。 0.83
However, using that E[(1 − αA1)2p] = {qA(1 − α)2p + (1 − qA)(1 + α)2p} and (1 − α)2p ≥ 1 − 2αp and (1 + α)2p ≥ 1 + 2αp + 2p(2p − 1)α2/2, we get for any p ≥ 1, E[(1 − αA1)2p] ≥ {1 − 2pα[(2qA − 1) − (2p − 1)α(1 − qA)/2]}, therefore E[(1 − αA1)2p] ≤ 1 does not hold for 2p > ¯pq,α = 1 + 2(2qA − 1)/[α(1 − qA)]. しかし、 E[(1 − αA1)2p] = {qA(1 − α)2p + (1 − qA)(1 + α)2p ≥ 1 − 2αp and (1 + α)2p ≥ 1 + 2αp + 2p(2p − 1)α2/2 とすると、任意の p ≥ 1, E[(1 − αA1)2p] ≥ {1 − 2pα[(2qA − 1) − (2p − 1)α(1 − qA)/2] に対して E[(1 − αA1)2p] ≤ 1 は 2p > sq,α = 1 + 2qA−1(1- qA)/2 に対して成り立たない。 0.90
]E[(1 − αA1)2(p−k)]E[b2k ]E[(1 − αA1)2(p−k)]E[b2k] 0.90
1 ] ≥ E[θ2p 1 ] ≥ E[θ2p 0.92
B Technical and supporting results for Section 3 b 第3節の技術及び支援結果 0.77
Proposition 10 ([17, Proposition 4.3]). 命題 10 ([17, Proposition 4.3])。 0.63
Consider two random matrices X, Y ∈ Rd×d that satisfy E[Y|X] = 0. E[Y|X] = 0 を満たす2つのランダム行列 X, Y ∈ Rd×d を考える。 0.76
Then for 2 ≤ q ≤ p, そして 2 ≤ q ≤ p に対して 0.86
kX + Yk2 p,q ≤ kXk2 kX + Yk2 p,q ≤ kXk2 0.97
p,q + CpkYk2 p,q + CpkYk2 0.99
p,q , where Cp = p − 1. p,q, Cp = p − 1 である。 0.77
12 12 0.85
英語(論文から抽出)日本語訳スコア
Lemma 1. Let A ∈ R, B > 0, C ≥ 1, p0, p1 ∈ R such that 1 ≤ p0 ≤ p1 < +∞, and X a real random variable satisfying, for any p ∈ [p0, p1], レマ1号。 A ∈ R, B > 0, C ≥ 1, p0, p1 ∈ R を 1 ≤ p0 ≤ p1 < +∞ とし、X を任意の p ∈ [p0, p1] に対して実確率変数とする。 0.72
E[|X|p] ≤ C exp(−Ap + Bp2) . E[|X|p] ≤ C exp(−Ap + Bp2)。 0.82
Then, for all δ ∈ (0, 1], we have, with probability at least 1 − δ, すると、すべての δ ∈ (0, 1] に対して、少なくとも 1 − δ の確率を持つ。 0.82
(39) (40) |X| ≤ exp(cid:16)−A + Bp0 + 2pB log(C/δ) + log(C/δ)/p1(cid:17) , (39) (40) |X| ≤ exp(cid:16)−A + Bp0 + 2pB log(C/δ) + log(C/δ)/p1(cid:17) , 0.82
with the convention c/∞ = 0 for c > 0. c > 0 の慣例 c/∞ = 0 である。 0.85
In addition if (39) is satisfied for any p ≥ p0, then with probability at least 1 − δ, さらに、(39) が任意の p ≥ p0 に対して満たされるなら、確率は少なくとも 1 − δ である。 0.84
|X| ≤ exp(cid:16)−A + Bp0 + 2pB log(C/δ)(cid:17) . |X| ≤ exp(cid:16)−A + Bp0 + 2pB log(C/δ)(cid:17)。 0.73
Proof. Note that by the monotone convergence theorem, it is sufficient to show (39). 証明。 単調収束定理(英語版)により、(39) を示すのに十分である。 0.67
By Markov’s inequality, we have, for any t > 0 and p ∈ [p0, p1], マルコフの不等式により、任意の t > 0 と p ∈ [p0, p1] に対して有する。 0.74
P(|X| ≥ t) ≤ E[|X|p]/tp ≤ C exp (−p(log(t) + A − Bp)) . P(|X| ≥ t) ≤ E[|X|p]/tp ≤ C exp (−p(log(t) + A − Bp)) . 0.99
Taking t = exp(−A + 2Ba∗) for a∗ ∈ R and maximizing over p ∈ [p0, p1], we obtain t = exp(−A + 2Ba∗) を a∗ ∈ R とし、p ∈ [p0, p1] を最大化すると、得られる。 0.79
P(|X| ≥ exp(−A + 2Ba∗)) ≤ C exp (−Bp(2a∗ − p)) ≤ C exp (−Bφ(a∗)) , P(|X| ≥ exp(−A + 2Ba∗)) ≤ C exp (−Bp(2a∗ − p)) ≤ C exp (−Bφ(a∗)) , 0.97
(41) (42) where φ(a∗) = max (41) (42) ここで φ(a∗) = max 0.85
p∈[p0,p1] p(2a∗−p) = (2p0a∗−p2 p)[p0,p1] p(2a∗-p) = (2p0a∗-p2 0.52
0)1(−∞,p0](a∗)+(a∗)2 0)1(−∞,p0](a∗)+(a∗)2 0.65
1(p0,p1)(a∗)+(2p1a∗−p2 1(p0,p1)(a∗)+(2p1a∗−p2) 0.76
1)1[p1,+∞)(a∗) . 1)[p1,+∞)(a∗) である。 0.62
Note that for any t ∈ R, the inverse of φ is given by 0](t) + t1/2 任意の t ∈ R に対して φ の逆数は 0](t) + t1/2 で与えられることに注意。 0.87
φ←(t) = 1(−∞,p2 φ(t) = 1(−∞,p2) 0.82
p2 0 + t 2p0 p2 0 + t 2p0 0.78
1(p2 0,p2 1(p2) 0,p2。 0.75
1)(t) + p2 1 + t 2p1 1)(t) + p2 1 + t 2p1 0.82
1[p2 1,+∞)(t) . 1[p2] 1,+∞)(t) である。 0.71
For δ > 0, taking a∗ δ > 0 に対して a∗ を取る 0.72
δ = φ←(log(C/δ)/B) gives δ = φ (log(C/δ)/B) が与えられる 0.80
The proof then follows from the fact that for any t ∈ R, φ←(t) ≤ p0/2 + √t + t/(2p1). 証明は任意の t ∈ R に対して φ(t) ≤ p0/2 + t + t/(2p1) であるという事実から従う。 0.78
P(|X| ≥ exp[−A + 2Bφ←(log(C/δ)/B)]) ≤ δ . P(|X| ≥ exp[−A + 2Bφ\(log(C/δ)/B)]) ≤ δ である。 0.85
Proof of (18) and (19) 証明(18)及び(19) 0.65
Let α ∈ (0, ¯αq). α ∈ (0, αq) とする。 0.85
Note that by definition of {θn : n ∈ N} with (4), for any n ∈ N, (4) による {θn : n ∈ n} の定義により、任意の n ∈ n に対して 0.83
n Then, for any β > 0, we get n すると、任意の β > 0 に対して、 0.80
θn = (1 − α)Nn (1 + α)n−Nn , where Nn = θn = (1 − α)Nn (1 + α)n−Nn である。 0.88
Xk=1 P(cid:0)θn ≥ e−αβn(cid:1) = P (log(θn) ≥ −αβn) = P(cid:18)Nn log(cid:18) 1 − α Xk=1 P(cid:0)θn ≥ e−αβn(cid:1) = P(log(θn) ≥ −αβn) = P(cid:18)Nn log(cid:18) 1 − α 0.76
1{1}(Zk) . 1{1}(zk) である。 0.81
1 + α(cid:19) ≥ −αβn − n log(1 + α)(cid:19) 1 + α(cid:19) ≥ −αβn − n log(1 + α)(cid:19) 0.87
= P(cid:18)Nn ≤ n log−1(cid:18) 1 + α = P(cid:18)Nn − qAn ≤ −n(cid:20)qA − log−1(cid:18) 1 + α P(cid:18)Nn ≤ n log−1(cid:18) 1 + α = P(cid:18)Nn − qAn ≤ −n(cid:20)qA − log−1(cid:18) 1 + α 0.85
1 − α(cid:19){αβ + log(1 + α)}(cid:19) 1 − α(cid:19){αβ + log(1 + α)}(cid:19) 0.94
1 − α(cid:19){αβ + log(1 + α)}(cid:21)(cid:19) . 1 − α(cid:19){αβ + log(1 + α)}(cid:21)(cid:19)。 0.88
(43) Let βα,q = α−1 [qA log {(1 + α)/(1 − α)} − log(1 + α)]. (43) βα,q = α−1 [qA log {(1 + α)/(1 − α)} − log(1 + α)] とする。 0.90
Note that with the condition, α ∈ (0, ¯αq), βα,q > 0 and therefore for any β ∈ (0, βα,q), この条件では、任意の β ∈ (0, βα,q) に対して、α ∈ (0, βα,q) 、βα,q > 0 となる。 0.86
xα,β =(cid:20)qA − log−1(cid:18) 1 + α xα,β =(cid:20)qA − log−1(cid:18) 1 + α 0.83
1 − α(cid:19){αβ + log(1 + α)}(cid:21) ∈ (0, ˜ϕq(α)) , 1 − α(cid:19){αβ + log(1 + α)}(cid:21) ∈ (0, φq(α)) , 0.97
(44) We now show (18). (44) 第18話で登場。 0.59
From (43), it follows using Hoeffding’s inequality that for any β ∈ (0, βα,q), 43) から、任意の β ∈ (0, βα,q) に対して、Hoeffdingの不等式を用いて従う。 0.77
P(cid:0)θn ≥ e−αβn(cid:1) ≤ e−2nx2 P(cid:0)θn ≥ e−αβn(cid:1) ≤ e−2nx2 0.59
α,β . 13 (45) α,β . 13 (45) 0.85
英語(論文から抽出)日本語訳スコア
Hence, for ¯δ ∈ (e−2n ˜ϕ2 plog(1/¯δ)/2n, which corresponds by (44) to したがって、 (44) から (e-2n )φ2 plog(1/ )δ)/2n となる。 0.76
q(α), 1), there exists x ∈ (0, ˜ϕq(α)) such that e−2nx2 q(α), 1), e−2nx2 となる x ∈ (0, ] φq(α)) が存在する。 0.88
= ¯δ given by x = x = δ で与えられる。 0.83
(46) (47) β = α−1(cid:26)qA −qlog(1/¯δ)/(2n)(cid:27) log(cid:18) 1 + α (46) (47) β = α−1(cid:26)qA −qlog(1/ sδ)/(2n)(cid:27) log(cid:18) 1 + α 0.83
1 − α(cid:19) − α−1 log(1 + α) ∈ (0, βα,q) . 1 − α(cid:19) − α−1 log(1 + α) ∈ (0, βα,q) 。 0.94
This completes the proof of (18) using (45). これは (45) を用いた (18) の証明を完結させる。 0.75
We now show (19). Using [1, Lemma 4.7.2] and (43), it holds that for any β ∈ (0, βα,q), 第19回)に登場。 1, lemma 4.7.2] と (43) を用いると、任意の β ∈ (0, βα,q) に対して成り立つ。 0.70
where for any ˜q ∈ (0, 1), 任意の sq ∈ (0, 1) に対して、 0.75
P(cid:0)θn ≥ e−αβn(cid:1) ≥ exp(−nKL(qA − xα,β|qA) − 2−1 log(n)) , KL(˜q|qA) = ˜q log(˜q/qA) + (1 − ˜q) log((1 − ˜q)/(1 − qA)) . P(cid:0)θn ≥ e−αβn(cid:1) ≥ exp(−nKL(qA − xα,β|qA) − 2−1 log(n)) , KL( sq|qA) = sq log( sq/qA) + (1 − sq) log((1 − sq)/(1 − qA)) 。
訳抜け防止モード: P(cid:0)θn ≥ e−αβn(cid:1 ) ≥ exp(−nKL(qA − xα, β|qA ) − 2−1 log(n ) ) KL( tq|qA ) = tq log( tq / qA ) + ( 1 − tq ) log((1 − tq)/(1 − qA ) )
0.90
Note that for any ˜q ∈ (0, 1), ˜q ≤ qA, using log(1 + t) ≤ t for any t > −1, we get 任意の t > −1 に対して log(1 + t) ≤ t を用いる任意の sq ∈ (0, 1), sq ≤ qa に対して、我々は得られることに注意する。 0.82
KL(˜q|qA) ≤ (qA − ˜q)2/(qA(1 − qA)) . KL( sq|qA) ≤ (qA − sq)2/(qA(1 − qA)) である。 0.87
Therefore, plugging this result into (46) yields for any β ∈ (0, βα,q), したがって、この結果を (46) に差し込むと任意の β ∈ (0, βα,q) が得られる。 0.81
P(cid:0)θn ≥ e−αβn(cid:1) ≥ exp(−nx2 P(cid:0)θn ≥ e−αβn(cid:1) ≥ exp(−nx2) 0.65
α,β/(qA(1 − qA)) − 2−1 log(n)) . α,β/(qA(1 − qA)) − 2−1 log(n))。 0.92
corresponds by (44) to 44)から(44)に一致する 0.65
Hence, for δ ∈ (e−n ˜ϕ2 q(α)/(qA(1−qA))−2−1 log(n), 1) there exists x ∈ (0, ˜ϕq(α)) such that e−nx2/(qA(1−qA))−2−1 log(n) = δ, given by x = p2−1 log(n) + qA(1 − qA) log(1/δ)/n, which 1 − α(cid:19) − α−1 log(1 + α) . したがって、 δ ∈ (e−n ) q(α)/(qA(1−qA))−2−1 log(n), 1) に対し、e−nx2/(qA(1−qA))−2−1 log(n) = δ が存在し、x = p2−1 log(n) + qA(1 − qA) log(1/δ)/n で 1 − α(cid:19) − α−1 log(1 + α) となる。 0.96
β = α−1{qA −p2−1 log(n) + qA(1 − qA) log(1/δ)/n} log(cid:18) 1 + α β = α−1{qA −p2−1 log(n) + qA(1 − qA) log(1/δ)/n} log(cid:18) 1 + α 0.87
This completes the proof of (19) using (47). これは (47) を用いた (19) の証明を完結させる。 0.75
Proof of Proposition 3. It suffices to repeat the argument of Corollary 1. 命題3の証明。 Corollary 1 の議論を繰り返すだけで十分です。 0.63
We need a version of Yℓ where {Yℓ : ℓ ∈ N} are an independent and for Q ≤ 1 − mℓ and E1/q[kYℓ − Q] ≤ σℓ,q. ここで {Yl : l ∈ N} は独立で Q ≤ 1 − ml かつ E1/q[kYl − Q] ≤ σl,q に対して Yl のバージョンが必要である。 0.95
We use notations of An, Bn from Proposition 2. 我々は命題2から an,bn の表記を用いる。 0.71
Applying independence of Zn−1 Zn−1の独立性の適用 0.58
Proposition 2 for the product Zn = Qn each ℓ, q ∈ N there exist mℓ ∈ (0, 1) and σℓ,q > 0 such that kE[Yℓ]k2 E[Yℓ]kq and Yn and E1/q[kYℓ − E[Yℓ]kq 積 Zn = Qn の各 l, q ∈ N に対して kE[Yl]k2 E[Yl]kq と Yn と E1/q[kYl − E[Yl]kq が成立する ml ∈ (0, 1) と σl,q > 0 が存在することを仮定する。 0.90
Q] ≤ σℓ,q we estimate q] ≤ σl,q 推定する 0.81
ℓ=0 kAnkp,q ≤(cid:16)EhkYn − E[Yn]kq ℓ=0 kAnkp,q ≤(cid:16)EhkYn − E[Yn]kq 0.75
QkfQ(Zn−1)kq QkfQ(Zn−1)kq 0.88
pi(cid:17)1/q pi(cid:17)1/q 0.71
≤ σn,qkfQ(Zn−1)kp,q. ≤ σn,qkfQ(Zn−1)kp,q。 0.90
(48) The bound for kBnk2 p,q. (48) kBnk2 p,q の値。 0.75
Combining this inequality with (48) and (10) yields for any n ∈ N∗, kfQ(Zn)k2 p,q ≤ (1 − mn + (p − n,q)kfQ(Zn−1)k2 1)σ2 p,q. この不等式と (48) と (10) を組み合わせると、任意の n ∈ N∗ に対して kfQ(Zn)k2 p,q ≤ (1 − mn + (p − n,q)kfQ(Zn−1)k2 1)σ2 p,q が得られる。 0.84
The proof is then completed upon using (11) which implies that kZnkp,q = kQ−1/2fQ(Zn)Q1/2kp,q ≤ √κQkfQ(Zn)kp,q. 証明は、kznkp,q = kq−1/2fq(zn)q1/2kp,q ≤ ,κqkfq(zn)kp,q を用いて完結する。 0.83
Finally, it remains take Yℓ = I − αAℓ, ℓ ≥ 1, Y0 = I. 最後に、Yl = I − αAl, l ≥ 1, Y0 = I を取る。 0.83
As − ¯A is Hurwitz, applying Proposition 1 yields kE[Yℓ]k2 A) we get by Lemma 3 Hurwitz とすると、命題 1 を適用すると、Lemma 3 によって得られる kE[Yl]k2 A) が得られる。
訳抜け防止モード: A は Hurwitz である。 命題1の適用 kE[Yl]k2A ) Lemma 3 に到達します。
0.73
p,q remains the same: kBnk2 p,q ≤ Qn i=1(1 − mi + (p − 1)σ2 Q = kI− α ¯Ak2 p,q は同じである: kbnk2 p,q ≤ qn i=1(1 − mi + (p − 1)σ2 q = ki−α sak2 0.89
p,q ≤ (1 − mn)kfQ(Zn−1)k2 i,q)kfQ(Z0)k2 p,q ≤ (1 − mn)kfQ(Zn−1)k2 i,q)kfQ(Z0)k2 0.97
Q ≤ 1− aα. Q ≤ 1− aα。 0.83
Further, since kAℓ − ¯Ak ∈ SG(C′ さらに、kAl − >Ak ∈ SG(C′) である。 0.67
Taking mℓ = aα and σℓ,q = b′ ml = aα と σl,q = b′ を取る 0.85
E1/q[kYℓ − E[Yℓ]kq E1/q[kYl − E[Yl]kq 0.90
Q] = αE1/q[kAℓ − ¯Akq Q] = αE1/q[kAl − >Akq 0.73
Q] ≤ 2α√κQq C′ Qα√q we get the claim of the proposition. Q] ≤ 2α-κQq C′ Qα-q は命題の主張を得る。 0.68
A = αb′ Q√q . A = αb′ のqq。 0.70
C Proofs of Section 4 For ease of presentation, we drop in this section the dependence of J (α,0) with respect to α and simply write J (0) 第4節のC証明 提示の容易さのため、この節では α に対する J (α,0) の依存を断り、単に J (0) を記述する。 0.82
, H (α,1) n , respectively. , H (α, 1) n であった。 0.72
We denote ˜An = An − ¯A. A = An − A と書く。 0.61
n , H (0) , H (α,0) n , H (0) ,H(α,0) 0.84
n , J (1) n , H (1) n , J (1) n , H (1) 0.85
, J (α,1) n , J(α, 1) n 0.83
n n n 14 n n n 14 0.85
英語(論文から抽出)日本語訳スコア
C.1 Proof of Proposition 4 C.1 命題4の証明 0.68
Let n ∈ N∗, α ∈ (0, αp0,∞], u ∈ Sd−1 and δ ∈ (0, 1). n ∈ N∗, α ∈ (0, αp0,∞], u ∈ Sd−1, δ ∈ (0, 1) とする。 0.88
Under A1, applying Corollary 2 with p = p0 a1 では、p = p0 で冠 2 を適用する 0.67
yields E1/p0 [|u⊤Γ(α) yields E1/p0[|u)(α) 0.76
1:n(θ0 − θ⋆)|p0 ] ≤ E1/p0 [kΓ(α) 1:n(θ0 − θ )|p0 ] ≤ E1/p0 [k'(α) 0.84
1:nkp0]kθ0 − θ⋆k 1:nkp0]kθ0 − θ\k 0.71
≤ √κQd1/p0 (1 − aα + (p0 − 1)b2 ≤ >κQd1/p0 (1 − aα + (p0 − 1)b2 0.69
Qα2)n/2kθ0 − θ⋆k . Qα2)n/2kθ0 − θ\k 。 0.43
Since α ≤ a/(2b2 α ≤ a/(2b2) なので 0.58
Q(p0 − 1)), using (1 − t)1/2 ≤ 1 − t/2 for t ∈ [0, 1], we get ˜θ0|p0 ] ≤ √κQd1/p0kθ0 − θ⋆k(1 − aα/4)n . Q(p0 − 1) は (1 − t)1/2 ≤ 1 − t/2 を t ∈ [0, 1] に対して用い、 ≤ >κ Qd1/p0kθ0 − θ k(1 − aα/4)n を得る。 0.80
E1/p0 [|u⊤Γ(α) E1/p0[|u)(α) 0.67
1:n Applying Markov’s inequality easily completes the proof. 1:n マルコフの不等式を適用すると容易に証明が完了する。 0.67
C.2 Proof of Proposition 5 C.2 命題5の証明 0.68
Let n ∈ N∗, α ∈ (0, αp0,∞], u ∈ Sd−1 and δ ∈ (0, 1). n ∈ N∗, α ∈ (0, αp0,∞], u ∈ Sd−1, δ ∈ (0, 1) とする。 0.88
Using (22) and applying Rosenthal’s inequality [30, Theorem 4.1]2 for sum of centered independent random variables we get for any p ≥ 2, 22) を用いてローゼンタールの不等式 [30, theorem 4.1]2 を p ≥ 2 に対して得られる中心独立確率変数の和に適用する。 0.78
E[|u⊤J (0) E[|u)J (0) 0.90
n |p] ≤ (60e)ppp/2{u⊤Σα Applying Lemma 5, we obtain for any p ≥ 2, n |p] ≤ (60e)ppp/2{u\σα applying lemma 5 任意の p ≥ 2 に対して得られる。 0.74
nu}p/2 + αp60pppE(cid:20) max nu}p/2 + αp60pppE(cid:20) max 0.69
ℓ=1,...,n|u⊤Gℓ+1:nεℓ|p(cid:21) . l=1,...,n|u\Gl+1:nεl|p(cid:21)。 0.55
E[|u⊤J (0) E[|u)J (0) 0.90
n | ≥ c1{u⊤Σα n | ≥ c1{u>Σα 0.70
n |p] ≤ (60e)ppp/2{u⊤Σα n |p] ≤ (60e)ppp/2{u>Σα 0.71
nu}p/2 + (9{1 + log[1/(aα)]}κQ C2 nu}p/2 + (9{1 + log[1/(aα)]}κQ C2 0.94
(49) where the constant Cε is given in (63). (49) 定数 cε が (63) で与えられる場合。 0.75
Applying Markov’s inequality, we get for any p ≥ 2, c1, c2 > 0, P(|u⊤J (0) ≤ {c1{u⊤Σα ≤ (60e)ppp/2c−p Taking p = 3 log (2/δ), c1 = D1(log (2/δ))1/2 and c2 = αp1 + log(1/(aα))D2 log3/2(2/δ) マルコフの不等式を適用すると、任意の p ≥ 2, c1, c2 > 0, P(|u)J (0) ≤ {c1{u\Σα ≤ (60e)ppp/2c−p を p = 3 log (2/δ), c1 = D1(log (2/δ))1/2 と c2 = αp1 + log(1/(aα))D2 log3/2(2/δ) を得られる。 0.73
nu}1/2 + c2}−ph(60e)ppp/2{u⊤Σα 1 + (9{1 + log[1/(aα)]}κQ C2 nu}1/2 + c2}-ph(60e)ppp/2{u>Σα 1 + (9{1 + log[1/(aα)]}κQ C2 0.84
nu}p/2 + (9{1 + log[1/(aα)]}κQ C2 ε)p/2αp60pp3p/2c−p nu}p/2 + (9{1 + log[1/(aα)]}κQ C2 ε)p/2αp60pp3p/2c−p 0.66
nu}1/2 + c2) nu}1/2 + c2) 0.82
ε)p/2αp60pp3p/2 , ε)p/2αp60pp3p/2, 0.37
yields the statement, where 声明を提出し どこで 0.63
2 . ε)p/2αp60pp3p/2i 2 . ε)p/2αp60pp3p/2i 0.67
D1 = 60√3e4/3, D2 = 540√3e1/3κ1/2 d1 = 603e4/3, d2 = 5403e1/3κ1/2 0.39
Q Cε . (50) C.3 Proof of Proposition 6 Cε。 (50) C.3 命題6の証明 0.72
Lemma 2. Assume that A1-(iii) holds. レマ2号。 A1-(iii) が成り立つと仮定する。 0.64
Then, for any α ∈ (0, α∞], where α∞ is defined in (3), すると、任意の α ∈ (0, α∞] に対して、α∞ は (3) で定義される。 0.81
where Σα and Σ are defined in (25) and (27) respectively and a is given in (3). ここで Σα と Σ はそれぞれ (25) と (27) で定義され、a は (3) で与えられる。 0.83
kΣα − ΣkQ ≤ αa−1k ¯AΣ ¯A⊤kQ , kΣα − ΣkQ ≤ αa−1k .AΣ . 0.58
Proof. Let α ∈ (0, α∞]. 証明。 α ∈ (0, α∞) とする。 0.74
By definition, (25) and (27) imply 定義上は (25) と (27) は 0.76
¯A(Σα − Σ) + (Σα − Σ) ¯A⊤ − α ¯A(Σα − Σ) ¯A⊤ = α ¯AΣ ¯A⊤ , A(Σα − Σ) + (Σα − Σ) - α(Σα − Σ) -α(Σα − Σ) -α(Σα − Σ) -α(α) -α(AΣ) -α(AΣ)。 0.47
which writes This implies, by Proposition 1, と書いている。 これは、命題1によって示される。 0.38
Σα − Σ − (I − α ¯A)(Σα − Σ)(I − α ¯A)⊤ = α2 ¯AΣ ¯A⊤ . Σα − Σ − (I − α >A)(Σα − Σ)(I − α >A) = α2 >AΣ >A である。 0.80
Rearranging terms completes the proof. 用語の再配置は証明を完結させる。 0.48
kΣα − ΣkQ ≤ (1 − αa)kΣ − ΣkQ + α2k ¯AΣ ¯A⊤kQ , kΣα − ΣkQ ≤ (1 − αa)kΣ − ΣkQ + α2k ? 0.82
2Note that the specific universal constants CR,1 = 60e and CR,2 = 60 are not given in the statement, but a 2 特定の普遍定数 CR,1 = 60e と CR,2 = 60 は文中で与えられていないことに注意。 0.81
close inspection of the proof provide the given estimates. 証拠の綿密な検査は 所定の見積もりを提供する 0.69
15 15 0.85
英語(論文から抽出)日本語訳スコア
C.4 Proof of Proposition 7 C.4 命題7の証明 0.71
Proposition 7 is a direct consequence of the following statements. 命題7は次の声明の直接的な結果である。 0.72
Proposition 11. Assume A 1. 背番号11。 1 を仮定する。 0.60
Then, for any n ∈ N, α ∈ (0, α∞), where αp0,∞ is defined in (16), u ∈ Sd−1 and p ≥ 2, (51) すると、任意の n ∈ N, α ∈ (0, α∞) に対して、αp0,∞ は (16), u ∈ Sd−1 および p ≥ 2, (51) で定義される。 0.91
p where D3 is given in (58). p D3 は (58) で与えられる。 0.82
Moreover, for any δ ∈ (0, 1) with probability at least 1 − δ, さらに、少なくとも 1 − δ の確率を持つ任意の δ ∈ (0, 1) に対して。 0.84
(52) Proposition 12. (52) 命題12。 0.66
Assume A1 and let p0 ≥ 2. A1 を仮定して p0 ≥ 2 とする。 0.68
Then, for any n ∈ N, α ∈ (0, αp0,∞), where αp0,∞ is defined in (16), u ∈ Sd−1, (53) すると、任意の n ∈ N に対して、α ∈ (0, αp0,∞) に対して αp0,∞ は (16, u ∈ Sd−1, (53) で定義される。 0.88
2p0 , where D4 is given in (61). 2p0。 D4 は (61) で与えられる。 0.65
Moreover, for any δ ∈ (0, 1) with probability at least 1 − δ, さらに、少なくとも 1 − δ の確率を持つ任意の δ ∈ (0, 1) に対して。 0.84
(54) ] ≤ Dp (54) ] ≤ Dp 0.85
3αpp2p , E[(cid:12)(cid:12)u⊤J (1) n (cid:12)(cid:12) n (cid:12)(cid:12) ≤ eD3α log2(1/δ) . 3αpp2p。 E[(cid:12)(cid:12)u:J (1) n (cid:12)(cid:12) n (cid:12)(cid:12) ≤ eD3α log2(1/δ) である。 0.56
(cid:12)(cid:12)u⊤J (1) p0 ] ≤ Dp0 E[(cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) (cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) ≤ D4αp2 Xk=ℓ+1 (cid:12)(cid:12)u:J (1) p0 ] ≤ Dp0 E[(cid:12)(cid:12)(cid :12)u:H (1) n (cid:12)(cid:12)u:H (1) n (cid:12)(cid:12)≤ D4αp2 Xk=l+1 0.75
0δ−1/p0 . 4 αp0 p0 0δ−1/p0。 4 αp0 p0 0.50
n J (1) n = α2 n J (1) n = α2 0.90
Sℓ+1:nεℓ, with Sℓ+1:n = Sl+1:nεl, with Sl+1:n = 0.74
(I − α ¯A)n−k−1 ˜Ak(I − α ¯A)k−1−ℓ . (I − α >A)n −k−1 >Ak(I − α >A)k−1 −l )。 0.58
Proof of Proposition 11. First, we note that (28) implies 命題11の証明。 まず、(28)は、 0.50
n−1 Xℓ=1 Using the Minkowski inequality, n−1 Xl=1 Minkowskiの不等式の使用 0.64
It is easy to check that the sequence (α2Sℓ+1:nεℓ, Fℓ+1:n)n−1 α2sl+1:nεl, fl+1:n)n−1 の配列を確認するのは容易である 0.66
ℓ=1 is a martingale-differenc e, where l=1 はmartingale-differenc eであり、ここでは 0.55
Fℓ+1:n = σ(cid:0)(Aj, bj)j∈{ℓ+1,...,n}(cid:1). Fl+1:n = σ(cid:0)(Aj, bj)j∂{l+1,...,n)(cid:1)。 0.89
We may use Burkholders’s inequality [15, Theorem 2.10] to Burkholdersの不平等[15, Theorem 2.10]を使うかもしれません。 0.70
get n−1 E[(cid:12)(cid:12)u⊤J (1) n (cid:12)(cid:12) E[(cid:12)(cid:12)u⊤J (1) n (cid:12)(cid:12) つかまえて n−1 e[(cid:12)(cid:12)(cid :12)(cid:12)e[(cid:12)(cid:12)(u)j (1) n (cid:12)(cid:12) 0.66
p p ] ≤ (36p)pα2pE"(cid:16) p p ]≤ (36p)pα2pE" (cid:16) 0.83
] ≤ (36p)pα2p(cid:16) ]≤ (36p)pα2p(cid:16) 0.78
n−1 Xℓ=1 (u⊤Sℓ+1:nεℓ)2(cid:17)p/2#. n−1 Xl=1 (u)Sl+1:nεl)2(cid:17)p/2#。 0.59
Xℓ=1 E2/p[(u⊤Sℓ+1:nεℓ)p](cid:17)p/2 Xl=1 E2/p[(u>Sl+1:nεl)p](cid:17)p/2 0.62
(55) . (56) (55) . (56) 0.85
Denote V ⊤ α ¯A)k−1−ℓk ≤ κQ CA(1 − αa)(n−ℓ−2)/2. κq ca(1 − αa)(n−l−2)/2 と書く。 0.68
Applying [29, Theorem 3]3, we get for any t ≥ 0 29, Theorem 3]3 を適用すると、任意の t ≥ 0 が得られる。 0.80
ℓ+1 = u⊤Sℓ+1:n. Note that by Assumption A1-(ii) and Lemma 1, k(I− α ¯A)n−k−1 ˜Ak(I− l+1 = u Sl+1:n. 仮定 A1-(ii) と Lemma 1, k(I− α >A)n−k−1 >Ak(I−) に注意。 0.72
Using Lemma 3, Lemma 3を使用。 0.86
P(cid:0)kVℓ+1k ≥ t(cid:1) ≤ 2 exp(cid:8)−t2/(cid:0)2κ2 P(cid:0)kVl+1k ≥ t(cid:1) ≤ 2 exp(cid:8)−t2/(cid:0)2κ2 0.68
E2/p[kVℓ+1kp] ≤ 2√2 C2 E2/p[kVl+1kp] ≤ 2\2 C2 0.52
Q C2 A(n − ℓ)(1 − αa)n−ℓ−2(cid:1)(cid:9) . Q C2 A(n − l)(1 − αa)n−l−2(cid:1)(cid:9)。 0.80
A κ2 Q(n − ℓ)(1 − αa)(n−ℓ−2)p. κ2 Q(n − l)(1 − αa)(n−l−2)p。 0.81
Since Sℓ+1:n and εℓ are independent, Sl+1:n と εl は独立である。 0.75
E[|u⊤εℓ|p] . E[|u εl|p]。 0.66
Assumption A1-(i), Lemma 3 and Lemma 5 imply, that for any u ∈ Sd−1, A1-(i) と Lemma 3 と Lemma 5 を仮定すると、任意の u ∈ Sd−1 に対して。 0.79
E[|u⊤Sℓ+1:nεℓ|p] ≤ E[kVℓ+1kp] sup E[|u>Sl+1:nεl|p] ≤ E[kVl+1kp] sup 0.63
u∈Sd−1 E[|u⊤εℓ|p] ≤ pp/2 Cp u・Sd-1 E[|u\εl|p] ≤ pp/2 Cp 0.40
ε(2√2)p/2 . ε(2n2)p/2。 0.65
Combining this bound with (57), これを (57) に結合する。 0.76
E[|u⊤Sℓ+1:nεℓ|p] ≤ pp(2√2)p Cp E[|u\Sl+1:nεl|p] ≤ pp(2\2)p Cp 0.67
A κp Q Cp ε(n − ℓ)p/2(1 − αa)(n−ℓ−2)p/2 . κp Q Cp ε(n − l)p/2(1 − αa)(n−l−2)p/2。 0.79
This inequality and (56) imply この不平等と(56)意味 0.79
p E[(cid:12)(cid:12)u⊤J (1) n (cid:12)(cid:12) p E[(cid:12)(cid:12)u-J (1) n(cid:12)(cid:12) 0.83
] ≤ p2pα2p(72√2)p Cp ≤ αpDp ] ≤ p2pα2p(72>2)p Cp ≤ αpDp 0.67
(n − ℓ)(1 − αa)(n−ℓ−2)(cid:17)p/2 3p2p, where D3 = (72√2) CA κQ Cε a−1(1 − aα∞)−1. (n − l)(1 − αa)(n−l−2)(cid:17)p/2 3p2p, ここで D3 = (72 ) CA κQ Cε a−1(1 − aα∞)−1 となる。 0.71
Xℓ=1 ε(cid:16) Xl=1 ε(cid:16) 0.71
Q Cp A κp n−1 Q Cp κp n−1 0.74
3with X = Rd equipped with the Euclidean norm k · k. Note that kxk, x ∈ Rd is twice Gateaux differen- 3with X = Rd equipped with the Euclidean norm k · k. Note that kxk, x ∈ Rd is twice Gateaux differenten. 0.92
tiable and X ∈ D(A1, A2) with A1 = A2 = 1. X ∈ D(A1, A2) は A1 = A2 = 1 である。 0.85
16 (57) (58) 16 (57) (58) 0.85
(59) (59) 0.85
英語(論文から抽出)日本語訳スコア
Now the equation (29) follows from Markov’s inequality. この方程式 (29) はマルコフの不等式から導かれる。 0.72
Namely, for any c1 > 0 it holds すなわち、任意の c1 > 0 に対して 0.82
αpDp 3p2p cp 1αpDp 3 Taking p = log (1/δ) and c1 = e log2 (1/δ), we obtain (29). αpDp 3p2p cp 1αpDp 3 p = log (1/δ) および c1 = e log2 (1/δ) とすると (29) が得られる。 0.75
n (cid:12)(cid:12) ≥ c1αD3(cid:17) ≤ n (cid:12)(cid:12) ≥ c1αD3(cid:17) ≤ 0.69
P(cid:16)(cid:12)(ci d:12)u⊤J (1) P(cid:16)(cid:12)(ci d:12)u-J (1) 0.75
= c−p 1 p2p . =c−p 1p2p。 0.64
Proof of Proposition 12. With the decomposition (28), we represent 命題12の証明。 分解(28)により、我々は表現する。 0.62
Using Minkowski’s inequality, Minkowskiの不平等を利用。 0.77
u⊤H (1) n = −α うーん(1) n = −α 0.77
u⊤Γ(α) u/γ(α) である。 0.40
ℓ+1:n ˜AℓJ (1) ℓ−1. l+1:n ~AlJ (1) l−1。 0.75
n Xℓ=1 n Now, using the independence of Γ(α) n Xl=1 n さて、γ(α) の独立性を用いて 0.77
E1/p[(cid:12)(cid:12)u⊤Γ(α) E1/p[(cid:12)(cid:12)u\(α) 0.80
ℓ+1:n Hence, applying Corollary 2 to E1/p[kΓ(α) l+1:n したがって、e1/p[kγ(α)]へのcorollary 2の適用 0.70
p p p ] . ℓ+1:n p p p ] . l+1:n 0.84
] ≤ α ˜AℓJ (1) ] ≤ α シュアルJ(1) 0.70
˜AℓJ (1) ℓ−1, and Item (ii), シュアルJ(1) l−1,および項目(ii) 0.72
E1/p[(cid:12)(cid:12)u⊤Γ(α) E1/p[(cid:12)(cid:12)u\(α) 0.80
Xℓ=1 ℓ+1:n, ˜Aℓ, J (1) Xl=1 l+1:n,...Al,J(1) 0.82
E1/p[(cid:12)(cid:12)u⊤H (1) ℓ−1(cid:12)(cid:12) n (cid:12)(cid:12) E1/p(cid:2)|v⊤J (1) ] ≤ E1/p(cid:2)ku⊤Γ(α) ℓ−1(cid:12)(cid:12) ℓ−1|(cid:3) E1/p(cid:2)|v⊤J (1) ≤ 2 CA E1/p[kΓ(α) ℓ−1|(cid:3) . E1/p[(cid:12)(cid:12)(cid :12)(cid:12)(cid:12) n (cid:12)(cid:12) E1/p(cid:2)|viJ (1) ] ≤ E1/p(cid:2)kui(α) l−1(cid:12)(cid:12)(ci d:12) l−1(cid:3) E1/p(cid:2)|viJ (1) ≤ 2 CA E1/p(k)(α) l−1|(cid:3) 。 0.67
ℓ+1:nkp], and (59) to supv∈Sd−1 E1/p[(cid:12)(cid:12)v⊤J (1) ℓ−1(cid:12)(cid:12) Qα2(cid:1)(n−ℓ)/2 l+1:nkp] および (59) から supvpvsd−1 e1/p[(cid:12)(cid:12)v\j (1) l−1(cid:12)(cid:12) qα2(cid:1)(n−l)/2 への変換 0.65
Xℓ=1(cid:0)1 − aα + (p − 1)b2 Xl=1(cid:0)1 − aα + (p − 1)b2 0.84
] ≤ 2 CA √κQd1/pD3α2p2 ] ≤ 2 CA >κQd1/pD3α2p2 0.43
˜Aℓk(cid:3) sup ℓ+1:nkp] sup >Alk(cid:3) sup l+1:nkp] sup 0.77
v∈Sd−1 v∈Sd−1 v~Sd−1 v~Sd−1 0.33
ℓ+1:n n E1/p[(cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) Since p0 − 1 ≤ a/(2b2 l+1:n n E1/p[(cid:12)(cid:12)u:H (1) n (cid:12)(cid:12) なぜなら p0 − 1 ≤ a/(2b2) 0.78
p Qα), from the previous estimate it follows n p0 ] ≤ 2 CA √κQd1/p0 D3α2p2 E1/p0 [(cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) ≤ 4 CA √κQd1/p0 D3αp2 p0] ≤ Dp0 4 αp0 p0 p 前回の見積もりでは、n p0 ] ≤ 2 CA シュκQd1/p0 D3α2p2 E1/p0 [(cid:12)(cid:12)u\H (1) n (cid:12)(cid:12) ≤ 4 CA シュκQd1/p0 D3αp2 p0] ≤ Dp0 4 αp0 p0 0.74
0/a . 0 0/aであった。 0 0.59
Xℓ=1 E[(cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) Xl=1 E[(cid:12)(cid:12)u\H (1) n(cid:12)(cid:12) 0.70
Using Markov’s inequality, we get with probability at least 1 − δ, 0/δ1/p0 . マルコフの不等式を用いて、確率は少なくとも 1 − δ, 0/δ1/p0 となる。 0.65
Hence, (cid:12)(cid:12)u⊤H (1) そのため (cid:12)(cid:12)u-h (1) 0.72
n (cid:12)(cid:12) ≤ D4αp2 n (cid:12)(cid:12) ≤ D4αp2 0.65
C.5 Proof of Proposition 8 c.5 命題の証明 8 0.71
(1 − αa)(n−ℓ)/2 (1 − αa)(n−l)/2 0.84
2p0 , where D4 = 4 CA √κQd1/p0 D3/a . 2p0, D4 = 4 CA >κQd1/p0 D3/a。 0.52
p ], (60) . p ], (60) . 0.78
(61) The proof is along the same lines as the proof of H (1) E1/p[kΓ(α) (61) 証明は H(1) E1/p[k)(α) の証明と同じ直線に沿っている 0.84
n in Appendix C.4, with the better bound for ℓ+1:nkp]. Appendix C.4では、l+1:nkp]のバウンダリがよりよい。 0.73
For reader’s convenience, we provide the proof below. 読者の利便性については、以下に証明する。 0.58
Starting with equation (60), 方程式 (60) から始める。 0.78
we note that under A2, We also apply (59) to supv∈Sd−1 E1/p[(cid:12)(cid:12)v⊤J (1) ℓ−1(cid:12)(cid:12) A2では、 また (59) を supv・Sd−1 E1/p[(cid:12)(cid:12)v\J (1) l−1(cid:12)(cid:12)に適用する。 0.60
p E1/p[kΓ(α) p E1/p[k](α) 0.83
ℓ+1:nkp] ≤pκ ˜Q(cid:0)1 − α˜a(cid:1)n−ℓ Xℓ=1(cid:0)1 − α˜a(cid:1)n−ℓ l+1:nkp] ≤pκ(cid:0)1 − α(cid:1)n−l xl=1(cid:0)1 − α(cid:1)n−l 0.73
] ≤ 2pκ ˜Q CA D3α2p2 ]≤ 2pκ >Q CA D3α2p2 0.57
]. Then n p ]. そして n p 0.75
. E1/p[(cid:12)(cid:12)u⊤H (1) n (cid:12)(cid:12) . E1/p[(cid:12)(cid:12)u-H (1) n(cid:12)(cid:12) 0.79
where we have defined Now the equation (32) follows from Markov’s inequality. 定義しました さて、方程式 (32) はマルコフの不等式から導かれる。 0.65
D5 = 2pκ ˜Q CA D3/˜a . D5 = 2pκ > Q CA D3/ >a 。 0.52
17 ≤ D5αp2 , 17 ≤ D5αp2。 0.67
(62) (62) 0.85
英語(論文から抽出)日本語訳スコア
D Concentration results for sub-Gaussian random variables ガウス以下の確率変数に対するD濃度結果 0.63
Lemma 3. Random variable X ∈ SG(σ2) for some σ > 0 if and only if for all t ≥ 0 the condition P(|X| ≥ t) ≤ 2 exp{−t2/(2σ2)} holds. 第3弾。 ある σ > 0 に対するランダム変数 X ∈ SG(σ2) と、すべての t ≥ 0 に対して条件 P(|X| ≥ t) ≤ 2 exp{−t2/(2σ2)} が成り立つこと。 0.73
In addition, in such a case, for any p ≥ 2, we have さらに、そのような場合、任意の p ≥ 2 に対して、我々は成り立つ。 0.79
E[|X|p] ≤ √2e(2/e)p/2pp/2σp. E[|X|p] ≤ 2e(2/e)p/2pp/2σp。 0.63
Proof. The first statement is well-known, see for example [8, Theorem 2.1]. 証明。 最初の文はよく知られており、例えば [8, Theorem 2.1] を参照してください。 0.62
We now show the second statement. 私たちは今 第二の声明だ 0.60
By the Fubini theorem, E[|X|p] = pR +∞ フビニの定理により、E[|X|p] = pR +∞ 0.66
0 up−1P(|X| > u) du, we get 0 up−1p(|x| > u) du、 0.82
up−1e−u2/(2σ2) du = p2p/2σpΓ(p/2), up−1e−u2/(2σ2) du = p2p/2σp (p/2) 0.50
E[|X|p] = 2pZ ∞ E[|X|p] = 2pZ ∞ 0.86
0 using the change of variable t = u2/(2σ2). 0 変数 t = u2/(2σ2) の変化を使います。 0.81
Now, using an upper bound Γ(p/2) ≤ (p/2)(p−1)/2e1−p/2 (see e g [14, Theorem 2]), and p1/2 ≤ 2p/2, we finally get さて、上界 γ(p/2) ≤ (p/2)(p−1)/2e1−p/2 と p1/2 ≤ 2p/2 を用いることで、最終的に得られる。 0.84
E[|X|p] ≤ √2e(2/e)p/2pp/2σp . E[|X|p] ≤ 2e(2/e)p/2pp/2σp。 0.63
Lemma 4. Let {Xℓ : ℓ ∈ N} be a sequence of random variables such that Xℓ ∈ SG(σ2) for any ℓ ∈ N and some σ2 > 0. 第4回。 Xl : l ∈ N} を任意の l ∈ N およびある σ2 > 0 に対して Xl ∈ SG(σ2) となるような確率変数の列とする。 0.72
Then for any p ≥ 2, 任意の p ≥ 2 に対して。 0.74
ℓ=1,...,n(cid:16)|Xℓ|/p1 + log ℓ(cid:17)p(cid:21) ≤ 3pσppp/2 . l=1, ..., n(cid:16)|Xl|/p1 + log l(cid:17)p(cid:21) ≤ 3pσppp/2 である。 0.63
E(cid:20) max E(cid:20)max 0.82
0 up−1P(|ξ| > u)du, the union bound, and Lemma 3, we get 0 up−1p(|\| > u)du, the union bound, and lemma 3 が成り立つ。 0.80
Proof. Set ak = (1 + log k)1/2 for k ∈ N∗. 証明。 k ∈ N∗ に対して ak = (1 + log k)1/2 とする。 0.69
Using the Fubini’s theorem, E[|ξ|p] = pR +∞ E(cid:20) max k=1,...,n{|Xk|p/ap フービニの定理を用いて、E[|||p] = pR +∞ E(cid:20) max k=1,...,n{|Xk|p/ap 0.74
0 n 2σ k}(cid:21) = pZ +∞ ≤ 2pσp + pZ +∞ ≤ 2pσp + pZ +∞ ≤ 2pσp + 2pZ +∞ ≤ 2pσp + 2pσpZ +∞ Z +∞ ≤ 2pσp + 0 n 2σ k(cid:21) = pZ +∞ ≤ 2pσp + pZ +∞ ≤ 2pσp + pZ +∞ ≤ 2pσp + 2pZ +∞ ≤ 2pσp + 2pσpZ +∞ Z +∞ ≤ 2pσp + 0.79
π2pσp 2σ up−1 π2pσp 2σ up−1 0.59
up−1P(cid:18) max up−1P(cid:18) max up−1P(cid:18) max up−1P(cid:18) max 0.62
k=1,...,n|Xk| ≥ uak(cid:19) du k=1,...,n|Xk| ≥ uak(cid:19) du Xk=1 P(cid:0)|Xk| ≥ uak(cid:1) du Xk=1 k/(2σ2)(cid:9) du exp(cid:8)−u2a2 k−y2/2(cid:1) dy Xk=1 yp−1 exp(cid:8)−y2/2(cid:9)(cid:0) yp−1 exp(cid:8)−y2/2(cid:9) dy ≤ 2pσp + k=1, ...,n|Xk| ≥ uak(cid:19) du k=1, ...,n|Xk| ≥ uak(cid:19) du Xk=1 P(cid:0)|Xk| ≥ uak(cid:1) du Xk=1 k/(2σ2)(cid:9) du exp(cid:8)−u2a2 k−y2/2(cid:1) dy Xk=1 yp−1 exp(cid:8)−y2/2(cid:0) yp−1 exp(cid:8)−y2/2(cid:9) dy ≤ 2σp + (cid:9) 0.64
up−1 2σ 3 n up−1 2σ 3 n 0.77
n 2 2 π2pσp2p/2−1 n 2 2 π2pσp2p/2−1 0.69
3 Γ(p/2) . 3 は (p/2)。 0.76
Using Γ(p/2) ≤ (p/2)(p−1)/2e1−p/2 (see [14, Theorem 2]), we get p/2) ≤ (p/2)(p−1)/2e1−p/2 ([14, Theorem 2]参照) を用いて、 0.79
E(cid:20) max k=1,...,n{|Xk|p/ap E(cid:20) max k=1,...,n{|Xk|p/ap 0.76
Since √pe−p/2 ≤ e−1/2 and 2p ≤ 4pp/2, pe−p/2 ≤ e−1/2 と 2p ≤ 4pp/2 である。 0.48
E(cid:20) max k=1,...,n{|Xk|p/ap E(cid:20) max k=1,...,n{|Xk|p/ap 0.76
k}(cid:21) ≤ 2pσp + π2σpp(p+1)/2e1−p/2/(3√2) . k}(cid:21) ≤ 2pσp + π2σpp(p+1)/2e1−p/2/(3\2) 。 0.54
k}(cid:21) ≤ σppp/2(cid:0)4 + π2e1/2/(3√2)(cid:1) < 9σppp/2 . k(cid:21) ≤ σppp/2(cid:0)4 + π2e1/2/(3\2)(cid:1) < 9σppp/2 である。 0.58
Lemma 5. Assume A1. 第5回。 A1を仮定する。 0.56
Then, for any n ∈ N∗ and v ∈ Sd−1, v⊤εn defined by (7) is a sub-Gaussian すると、任意の n ∈ N∗ および v ∈ Sd−1 に対して、(7) で定義される v εn はガウス部分群である。 0.58
random variable with parameter パラメータを持つランダム変数 0.85
C2 ε = 2 C2 C2 ε = 2 C2 0.88
b +8 C2 A kθ⋆k2 . b + 8 C2 の1つ。 0.61
18 (63) 18 (63) 0.85
英語(論文から抽出)日本語訳スコア
In addition, for any n ∈ N∗, p ≥ 2, u ∈ Sd−1 and α ∈ (0, α∞), it holds さらに、任意の n ∈ N∗ に対して p ≥ 2, u ∈ Sd−1 および α ∈ (0, α∞) が成り立つ。 0.93
E(cid:20) max ℓ=1,...,n|u⊤G(α) E(cid:20) max l=1,...,n|u\G(α) 0.81
ℓ+1:nεℓ|p(cid:21) ≤(cid:0)9κQp C2 l+1:nεl|p(cid:21)≤(cid:0)9κQp C2 0.63
ε{1 + log[1/(aα)]}(cid:1)p/2 ε{1 + log[1/(aα)]}(cid:1)p/2 0.95
where α∞, a and κQ are defined in (3). α∞, a, κq は (3) で定義される。 0.80
, Proof. First we prove (63). , 証明。 最初に証明する(63)。 0.75
Using the representation (7), for any λ ∈ R, E(cid:2)exp(cid:8)λv⊤εn(cid:9)(cid:3) ≤ E(cid:2)exp(cid:8)λv⊤(bn − ¯b − {An − ¯A}θ⋆)(cid:9)(cid:3) 任意の λ ∈ r に対する表現 (7) を用いることで、e(cid:8)λv\εn(cid:9)(cid:3) ≤ e(cid:2)exp(cid:8)λv\(bn −)b − {an − \a}θ\)(cid:9)(cid:3) が得られる。 0.78
Note that A 1-(ii) implies (cid:12)(cid:12)v⊤( ¯A − An)θ⋆(cid:12)(cid:12) ≤ 2 CA kθ⋆k. 注意: A 1-(ii) は (cid:12)(cid:12)(cid :12)(cid:12) ≤ 2 CA kθ k) を意味する。 0.87
Hence, using the Hoeffding inequality, v⊤( ¯A − An)θ⋆ ∈ SG(4 C2 したがって、ホイーフディングの不等式を用いて、v\( >A − An)θ\ ∈ SG(4 C2) が成り立つ。 0.54
≤ E1/2(cid:2)exp(cid:8 )2λv⊤(bn − ¯b)(cid:9)(cid:3)E1/2 (cid:2)exp(cid:8)2λv⊤( ¯A − An)θ⋆(cid:9)(cid:3) . ≤ E1/2(cid:8)2\v(cid:9 )(cid:9)(cid:3)E1/2( cid:2)exp(cid:8)2\v( cid:9)(cid:3) 0.79
A kθ⋆k2). Combining this result with A1-(i), b(cid:9) exp(cid:8)4λ2 C2 通称K2。 この結果とA1-(i), b(cid:9) exp(cid:8)4λ2 C2の組み合わせ 0.62
E(cid:2)exp(cid:8)λv⊤εn(cid:9)(cid:3) ≤ exp(cid:8)λ2 C2 E(cid:2)exp(cid:8)λv εn(cid:9)(cid:3) ≤ exp(cid:8)λ2 C2 0.71
yielding the first statement of the lemma. 補題の最初の文を出す。 0.53
A kθ⋆k2(cid:9) , a kθ\k2(cid:9) , 0.58
To prove the second part, let us denote vℓ = (I − α ¯A)n−ℓu/k(I − α ¯A)n−ℓuk ∈ Sd−1. 第二の部分を証明するために、vl = (I − α >A)n−lu/k(I − α >A)n−luk ∈ Sd−1とする。 0.69
Using Proposition 1, E[ max 利用 命題1。 E[max] 0.67
ℓ=1,...,n|u⊤G(α) ≤ κp/2 l=1,...,n|u\G(α) ≤ κp/2 0.72
Q ℓ=1,...,n|v⊤ E[ max E(cid:20) max Q l=1,...,n|v> E[max E(cid:20) max 0.84
ℓ=1,...,n ℓ+1:nεℓ|p] = E[ max l=1,...,n l+1:nεl|p] = e[max 0.76
ℓ εℓ|pkG(α) l εl|pkG(α) 0.78
ℓ=1,...,n|v⊤ ℓ εℓ|p(1 − αa)p(n−ℓ)/2] |v⊤ ℓ εℓ|p (1 + log (n − ℓ + 1))p/2(cid:21)(cid:2 6)max [(1 + log(x + 1))e−aαx](cid:27)p/2 l=1,...,n|v'l εl|p(1 − αa)p(n−l)/2] |v'l εl|p(1 + log (n − l + 1))p/2(cid:21)(cid:2 6)max [(1 + log(x + 1))e−aαx](cid:27)p/2 0.80
x>0 ε p)p/2(cid:26)max x>0。 ε p)p/2(cid:26)max 0.87
x>0 ≤ κp/2 x>0。 ≤ κp/2 0.75
Q (9 C2 ≤ κp/2 Q (9 C2) ≤ κp/2 0.69
Q , ℓ+1:nukp] Q , l+1:nukp] 0.85
(1 + log(x + 1))e−aαx)(cid:27)p/2 (1 + log(x + 1))e−aαx)(cid:27)p/2 0.80
where in the last inequality we used Lemma 4. 最後の不等式では lemma 4 を使いました 0.52
Set f (x) = (1 + log(x + 1))e−cx with c = aα ≤ 1 over x > 0. f (x) = (1 + log(x + 1))e−cx を x > 0 上の c = aα ≤ 1 とする。 0.95
First, note that f ′(x) = e−cx(1/(1 + x) − c − c log(x + 1)) < 0 for all x > 1/c − 1, and thus the maximum is attained for x ∈ [0, 1/c − 1]. まず、すべての x > 1/c − 1 に対して f ′(x) = e−cx(1/(1 + x) − c − c log(x + 1)) < 0 であることに注意する。
訳抜け防止モード: まず、すべての x > 1 / c − 1 に対して f ′(x ) = e−cx(1/(1 + x ) − c − c log(x + 1 ) ) < 0 であることに注意。 したがって、最大値は x ∈ [ 0, 1 / c − 1 ] .
0.93
Moreover, for any x ≤ 1/c − 1, we have f (x) ≤ 1 + log(1 + x) ≤ 1 + log(1/c), leading to the desired result. さらに、任意の x ≤ 1/c − 1 に対して f ( x) ≤ 1 + log(1 + x) ≤ 1 + log(1/c) が存在し、所望の結果につながる。 0.95
E Proof of Section 5 E.1 Proof of Theorem 3 e 第5節の証明 e.1 定理の証明 3 0.77
Let α ∈ (0, α2,∞) and λ1, λ2 ∈ P2(Rd). α ∈ (0, α2,∞) と λ1, λ2 ∈ P2(Rd) とする。 0.93
By [37, Theorem 4.1], there exists a couple of random variables θ(1) 0 − θ(2) 0 k2] independent of {(An, bn) : n ∈ N∗}. 37, Theorem 4.1] により、{(An, bn) : n ∈ N∗} とは独立な確率変数 θ(1) 0 − θ(2) 0 k2] が存在する。 0.81
We introduce then a synchronous coupling between λ1Rn α and λ2Rn n ) : n ∈ N} starting from θ(1) このとき λ1Rn α と λ2Rn n ) : n ∈ N} の θ(1) から始まる同期結合を導入する。 0.84
α as follows. Let {(θ(1) αは以下の通り。 let {(θ(1) 0.77
2 (λ1, λ2) = E[kθ(1) 2 (λ1, λ2) = e[kθ(1) 0.95
such that W 2 0 , θ(2) w2は 0 , θ(2) 0.69
n , θ(2) 0 n , θ(2) 0 0.85
0 respectively and for all n ≥ 0, n + αbn+1 0 それぞれ、すべての n ≥ 0, n + αbn+1 に対して 0.80
and θ(2) 0 θ(1) n+1 = (I − αAn+1)θ(1) θ(2) n+1 = (I − αAn+1)θ(2) θ(2) 0 θ(1) n+1 = (I − αAn+1)θ(1) θ(2) n+1 = (I − αAn+1)θ(2) 0.94
n + αbn+1 . n + αbn+1。 0.66
(64) Since for all n ≥ 0, the distribution of (θ(1) Wasserstein distance we get for any n ∈ N, n − θ(2) (64) すべての n ≥ 0 に対して、(θ(1) wasserstein 距離の分布は任意の n ∈ n, n − θ(2) に対して得られる。 0.87
α) ≤ E1/2[kθ(1) α) ≤ E1/2[kθ(1) 0.84
W2(λ1Rn α, λ2Rn W2(λ1Rn) α,λ2Rn 0.67
n , θ(2) n ) belongs to Π(λ1Rn n , θ(2) n ) は λ(λ1Rn) に属する 0.76
α, λ2Rn α), by definition of the α,λ2Rn α) の定義により 0.73
n k2] = E1/2[kΓ1:n[θ(1) n k2] = E1/2[k]1:n[θ(1) 0.83
0 − θ(2) ≤ D2(1 − aα/2)n/2W2(λ1, λ2) , 0 − θ(2) ≤ D2(1 − aα/2)n/2W2(λ1, λ2) である。 0.70
0 ]k2] (65) 0 ]k2] (65) 0.92
where we have used Corollary 1 for the last inequality. 最後の不平等のためにCorollary 1を使いました。 0.63
By [37, Theorem 6.16], the space P2(Rd) endowed with W2 is a Polish space. 37, Theorem 6.16] により、W2 が与えられた空間 P2(Rd) はポーランド空間である。 0.77
Then, (λ1Rn α)n≥0 is a Cauchy sequence and converges to a limit πλ1 α does not depend すると、(λ1Rn α)n≥0 はコーシー列であり、極限 πλ1 α に収束する。 0.74
γ ) = 0. We show that the limit πλ1 γ ) = 0. 我々は πλ1 の極限を示す。 0.75
α ∈ P2(Rd), limn→+∞ W2(λ1Rn α ∈ P2(Rd), limn→+∞ W2(λ1Rn) 0.74
α, πλ1 19 α, πλ1 19 0.82
英語(論文から抽出)日本語訳スコア
on λ1. Assume that there exists πλ2 inequality λ1です πλ2不等式が存在すると仮定する 0.60
α such that limk→+∞ W2(λ2Rn limk→+∞ W2(λ2Rn) となる α 0.60
α, πλ2 α ) = 0. α, πλ2 α ) = 0. 0.82
By the triangle α , λ2Rn 三角形で α,λ2Rn 0.72
α , λ1Rn W2(πλ1 α,λ1Rn W2(πλ1) 0.67
α , πλ2 α) + W2(λ1Rn α , πλ2 α) + W2(λ1Rn) 0.76
α ) ≤ W2(πλ1 α ) ≤ W2(πλ1) 0.74
α) + W2(πλ2 α ) = 0 and πλ1 α) + W2(πλ2 α ) = 0 と πλ1 0.85
α, λ2Rn Thus by (65), taking the limits as n → +∞, we get W2(πλ1 α , πλ2 α . α, λ2rn は (65) で、極限を n → +∞ とすると w2(πλ1 α , πλ2 α ) となる。 0.80
The limit is thus the same for all initial distributions and is denoted by πα. したがって、この極限はすべての初期分布に対して同じであり、πα で表される。 0.62
Moreover, πα is invariant for Rα. さらに、πα は Rα に対して不変である。 0.53
Indeed for all k ∈ N∗, W2(παRα, πα) ≤ W2(παRα, παRn α, πα), Using (65) again, we get taking n → +∞, W2(παRα, πα) = 0 and παRα = πα. 実際、すべての k ∈ N∗ に対し、W2(παRα, πα) ≤ W2(παRα, παRn α, πα) は (65) を用いて n → +∞, W2(παRα, πα) = 0 と παRα = πα を取る。 0.78
The fact that πα is the unique stationary distribution is straightforward by contradiction and using (65). πα が一意的な定常分布であるという事実は、矛盾と (65) の使用によって単純である。 0.64
(34) is a simple consequence of (65) taking λ2 = πα. (34) は (65) が λ2 = πα を取る単純な結果である。 0.83
It remains to show that θ(α) : E1/2[kΓn:0bn−1k2] = k ∈ N−} is E1/2[kΓn:0k2]E1/2[kbn−1k2] and therefore A1-(i) combined with Corollary 1 ensures that Pn≤−1 this series is finite and therefore (θn)n∈N− defined in (35) is a Cauchy sequence almost surely and in L2 which ensures its convergence. θ(α) : E1/2[k\n:0bn−1k2] = k ∈ N−} が E1/2[k\n:0k2]E1/2[kbn−1k2] であることを示し、従って、A1-(i) と Corollary 1 と組み合わせることで、Pn≤−1 この級数が有限であることを保証する。 0.79
Finally, assume now that {(Ak, bk) : k ∈ N−} is independent of {(Ak, bk) : k ∈ N∗}. 最後に、 {(Ak, bk) : k ∈ N−} が {(Ak, bk) : k ∈ N∗} とは独立であると仮定する。 0.91
To conclude it is then sufficient to note that if θ0 = θ(α) ∞ , then θ1 has the same distribution as θ(α) 結論づけると、θ0 = θ(α) ∞ であれば、θ1 は θ(α) と同じ分布を持つ。
訳抜け防止モード: 結論としては十分である。 θ0 = θ(α ) ∞ ならば、 θ1 は θ(α ) と同じ分布を持つ。
0.85
E1/2[kθn − θn+1k2] = Pn≤−1 E1/2[kθn − θn+1k2] = Pn≤−1 0.50
∞ is well-defined and has distribution πα. ∞ はよく定義され、分布 πα を持つ。 0.65
i.i.d., Pn≤−1 i.d., Pn≤−1 0.58
∞ by definition of the recursion (1). ∞ は再帰(recursion) (1) の定義による。 0.72
Since {(Ak, bk) since {(Ak, bk) 0.79
α) . α = πλ2 α) . α = πλ2 0.82
α) + W2(παRn α) + W2(παRn) 0.74
E.2 Proof of Proposition 9 E.2 命題9の証明 0.70
Consider a sequence {αn : n ∈ N} converging to 0 such that for any n ∈ N αn ∈ (0, α2,∞], and let u ∈ Sd−1. 任意の n ∈ N αn ∈ (0, α2,∞] に対して 0 に収束する列 {αn : n ∈ N} を考え、u ∈ Sd−1 とする。 0.90
For ease of notation, we simply denote G(n) 表記の容易性のため、G(n) を単純に表す。 0.68
k:0 = G(αn) k:0 = G(αn) 0.82
k:0 . Note that α−1/2 k:0。 注意 α−1/2 0.47
n u⊤J (αn,←) n uj (複数形 ujs) 0.63
∞ = 1 Xk=−∞ ∞ = 1 Xk=−∞ 0.76
∆Mn,k , By [15, Theorem 3.6], it is sufficient to show that シュマン、k。 15, Theorem 3.6] では、それを示すのに十分です。 0.59
∆Mn,k = α1/2 シュマン、k = α1/2 0.50
n u⊤G(n) n (複数形 ns) 0.61
k:0 εk−1 . sup k≤1 k:0 εk−1。 sup k≤1 0.57
Xk≤1 sup n∈N Xk≤1 sup nhtmln 0.60
∆Mn,k P −→n→+∞ シュマン、k P -→n→+∞ 0.57
0 ∆M 2 n,k 0 2代目。 n,k 0.66
u⊤Σu P −→n→+∞ ∆M 2 ウシシュウ P −→n→+∞ >M 2 0.58
E[sup k≤1 E[sup k≤1] 0.72
n,k] < +∞ . n,k] < +∞ 。 0.84
(66) (67) (68) (66) (67) (68) 0.85
First, by Markov inequality and Proposition 1 and A1-(i), we have for any η > 0 that まず、マルコフの不等式と命題 1 と A1-(i) により、任意のη > 0 に対して、 0.70
P(sup k≤1 P(sup k≤1) 0.72
∆Mn,k ≥ η) ≤ η−4E[sup shMn,k ≥ η) ≤ η−4E[sup] 0.78
≤ η−4α2 n E[kε0k4]κ2 ≤ η−4α2 n E[kε0k4]κ2 0.67
QXk≤1 k≤1 ∆M 4 QXk≤1 k≤1 4代目。 0.50
n,k] ≤ η−4α2 n,k]≤η−4α2 0.81
nXk≤1 (1 − aαn)−2(k−1) ≤ η−4α2 nXk≤1 (1 − aαn)−2(k−1) ≤ η−4α2 0.64
E[kG(n) E[kε0k4]κ2 E[kG(n) E[kε0k4]κ2 0.83
n k:0k4kεk−1k4] n k:0k4kεk−1k4] 0.55
Q(1 − (1 − aαn)2)−1 , q(1 − (1 − aαn)2)−1 , 0.92
which shows that (66) holds. これは (66) が持つことを示すものです 0.65
Denote by Σn the unique solution of the Ricatti equation (25) with α ← αn. リカティ方程式 (25) の α > αn による一意解について Σn が述べる。 0.64
We get by Lemma 2 that there exists C ≥ 0 such that for any n ∈ N, レンマ 2 により、任意の n ∈ N に対して C ≥ 0 が存在することが分かる。 0.72
Therefore, we obtain that kΣ − Σnk ≤ Cαn . それゆえ私たちは kΣ − Σnk ≤ Cαn 。 0.63
|Xk≤1 ∆M 2 |Xk≤1 2代目。 0.37
n,k − u⊤Σu| ≤ αn|Xk≤1 n,k − u Σu| ≤ αn|Xk≤1 0.58
((G(n) k:0 )⊤u)⊤[εk−1ε⊤ ((G(n)) k:0 ) (u) ][εk−1ε] である。 0.68
k−1 − Σε](G(n) k−1 − Σε](G(n)) 0.89
k:0 )⊤u| + Cαn . k:0 )u| + cαn である。 0.49
Then, to establish (67), it remains to show that そして、(67)を確立するために、それを示そうとする。 0.74
αn|Xk≤1 ((G(n) αn|Xk≤1 ((G(n)) 0.64
k:0 )⊤u)⊤[εk−1ε⊤ k:0 ) (u) ][εk−1ε] である。 0.41
k−1 − Σε](G(n) k−1 − Σε](G(n)) 0.89
k:0 )⊤u| k:0 ) [u|] 0.43
P −→n→+∞ 0 . P -→n→+∞ 0 . 0.69
(69) 20 (69) 20 0.85
英語(論文から抽出)日本語訳スコア
This follows from A1-(ii)-(i) and Proposition 1 which shows that これは A1-(ii)-(i) と命題 1 から従う。 0.55
k:0 )⊤u)⊤[εk−1ε⊤ k:0 ) (u) ][εk−1ε] である。 0.41
E[|Pk≤1((G(n) Eh|((G(n) kG(n) k:0k4E[kεk−1ε⊤ E[|Pk≤1((G(n) Eh|((G(n) kG(n) k:0k4E[kεk−1ε) 0.74
k−1 − Σε](G(n) k−1 − Σε](G(n)) 0.89
k:0 )⊤u|2] k−1 − Σε](G(n) k−1 − Σεk2] ≤ E[kε0ε⊤ k:0 )\u|2] k−1 − Σε](G(n) k−1 − Σεk2] ≤ E[kε0ε] 0.69
k:0 )⊤u|2i 0 − Σεk2]κ2 k:0 )u|2i 0 − σεk2]κ2 0.56
k:0 )⊤u)⊤[εk−1ε⊤ k:0 ) (u) ][εk−1ε] である。 0.41
=Xk≤1 ≤Xk≤1 =xkhtml1 ≤xkhtml1 0.41
Q(1 − (1 − aαn)2)−1 . Q(1 − (1 − aαn)2)−1。 0.82
Therefore, lim n→+∞ そのため リム n→+∞ 0.55
α2 n E[|Xk≤1 α2n E[|Xk≤1 0.81
which completes the proof of (69). これは (69) の証明を完結させる。 0.69
((G(n) k:0 )⊤u)⊤[εk−1ε⊤ ((G(n)) k:0 ) (u) ][εk−1ε] である。 0.68
k−1 − Σε](G(n) k−1 − Σε](G(n)) 0.89
k:0 )⊤u|2] = 0 , k:0 ) (u|2] = 0 , 0.71
Finally, we show (68) which follows from A1-(ii)-(i) and Proposition 1, 最後に、A1-(ii)-(i) と命題 1 から続く (68) を示す。 0.59
E[sup k≤1 E[sup k≤1] 0.72
∆M 2 n,k] ≤Xk≤1 2代目。 n,k]≤Xk≤1 0.57
E[∆M 2 n,k] = αnXk≤1 ≤ αnE[ε0ε⊤ e[\m 2 ] n,k] = αnxkhtml1 ≤ αne[ε0ε] 0.66
0 ]Xk≤1 ((G(n) 0 ]Xk≤1 ((G(n)) 0.87
k:0 )⊤u)⊤E[εk−1ε⊤ k:0 ) = E(εk−1ε) 0.54
k−1](G(n) k−1](G(n)) 0.92
k:0 )⊤u kG(n) k:0) kG(n) 0.78
k:0k2 ≤ E[ε0ε⊤ k:0k2 ≤ E[ε0ε] 0.52
0 ]κQ/a . 21 0 ]κQ/a。 21 0.75
                                           ページの最初に戻る

翻訳にはFugu-Machine Translatorを利用しています。