論文の概要: Concentration Phenomenon for Random Dynamical Systems: An Operator
Theoretic Approach
- arxiv url: http://arxiv.org/abs/2212.03670v2
- Date: Tue, 30 May 2023 21:20:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 03:49:34.227500
- Title: Concentration Phenomenon for Random Dynamical Systems: An Operator
Theoretic Approach
- Title(参考訳): ランダム力学系に対する濃度現象:作用素論的アプローチ
- Authors: Muhammad Abdullah Naeem and Miroslav Pajic
- Abstract要約: 本稿では, 所定の観測値に対する濃度現象を定式化する。
可観測関数/報酬関数が非有界であるとしても、ある意味では非有界であることが判明した。
for some $q>2$, $|er|_q.
濃度現象におけるエンプレバーシビリティの役割はデミスト化されている。
- 参考スコア(独自算出の注目度): 10.051309746913512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Via operator theoretic methods, we formalize the concentration phenomenon for
a given observable `$r$' of a discrete time Markov chain with `$\mu_{\pi}$' as
invariant ergodic measure, possibly having support on an unbounded state space.
The main contribution of this paper is circumventing tedious probabilistic
methods with a study of a composition of the Markov transition operator $P$
followed by a multiplication operator defined by $e^{r}$. It turns out that
even if the observable/ reward function is unbounded, but for some for some
$q>2$, $\|e^{r}\|_{q \rightarrow 2} \propto \exp\big(\mu_{\pi}(r)
+\frac{2q}{q-2}\big) $ and $P$ is hyperbounded with norm control $\|P\|_{2
\rightarrow q }< e^{\frac{1}{2}[\frac{1}{2}-\frac{1}{q}]}$, sharp
non-asymptotic concentration bounds follow. \emph{Transport-entropy} inequality
ensures the aforementioned upper bound on multiplication operator for all
$q>2$. The role of \emph{reversibility} in concentration phenomenon is
demystified. These results are particularly useful for the reinforcement
learning and controls communities as they allow for concentration inequalities
w.r.t standard unbounded obersvables/reward functions where exact knowledge of
the system is not available, let alone the reversibility of stationary measure.
- Abstract(参考訳): 作用素論的手法により、離散時間マルコフ連鎖の与えられた観測可能な `$r$' の濃度現象を「$\mu_{\pi}$' を不変エルゴード測度として定式化し、おそらく非有界状態空間への支持を持つ。
この論文の主な貢献は、マルコフ遷移作用素 $P$ の合成と、$e^{r}$ で定義される乗算作用素の研究によって、退屈な確率的方法を回避することである。
観測可能/報酬関数が非有界であるとしても、ある$q>2$, $\|e^{r}\|_{q \rightarrow 2} \propto \exp\big(\mu_{\pi}(r) +\frac{2q}{q-2}\big) $ and $P$ is hyperbounded with norm control $\|P\|_{2 \rightarrow q }< e^{\frac{1}{2}[\frac{1}{2}-\frac{1}{q}]} の場合、シャープな非漸近濃度境界は従う。
emph{transport-entropy} 不等式は、上述の乗算作用素上の上限をすべての$q>2$に対して保証する。
濃度現象における 'emph{reversibility} の役割は脱線化される。
これらの結果は、システムに関する正確な知識が得られていないような、集中不等式 w.r.t 標準の非有界オブザーバブル/逆関数を許容するコミュニティの強化学習や制御に特に有用である。
関連論文リスト
- Quantum Detection of Recurrent Dynamics [0.0]
このような近似的再帰を検出するための簡単な量子アルゴリズムについて述べる。
隠れたテンソル構造は、演算子レベルの自発的対称性の破れの高エネルギー文脈で両方現れることが観察されている。
我々は,これらの構造を探索し,関連するスペクトル情報を検出することの難しさについて,いくつかの知見を収集する。
論文 参考訳(メタデータ) (2024-07-22T21:13:45Z) - Tensor network approximation of Koopman operators [0.0]
本稿では,測度保存エルゴディックシステムの可観測物の進化を近似する枠組みを提案する。
提案手法は,スキューアジョイント・クープマン発生器のスペクトル収束近似に基づく。
この量子に着想を得た近似の重要な特徴は、次元$(2d+1)n$のテンソル積空間から情報を取得することである。
論文 参考訳(メタデータ) (2024-07-09T21:40:14Z) - The Dirac Delta as a Singular Potential for the 2D Schrodinger Equation [0.0]
分布一般化量子論の枠組みにおいて、対象$Hpsi$は分布として定義される。
その重要性は数学的に厳密な方法であり、いかなる種類の正規化や正規化にも依存しない。
分布解釈は、波動関数が定義できない点で評価する必要性を解消する。
論文 参考訳(メタデータ) (2023-12-23T00:43:06Z) - Thermalization of closed chaotic many-body quantum systems [0.0]
本稿では,ハートリー・フォック法とボヒガス・ジョノニ・シュミット予想を組み合わせることで,カオス多体量子系の熱化を研究する。
半古典的状態において、$rm Tr (A rho(t))$ は時間スケール $hbar / Delta$ で平衡値に向かって崩壊することを示す。
論文 参考訳(メタデータ) (2023-10-04T11:16:35Z) - Quantum and classical low-degree learning via a dimension-free Remez
inequality [52.12931955662553]
ハイパーグリッド上の関数をポリトーラス上の高調波拡張に関連付ける新しい方法を示す。
巡回群 $exp(2pi i k/K)_k=1K$ の積に対して函数の上限が$f$であることを示す。
我々は最近、超キューブやキュービット上の観測可能な観測値の低次学習を、同様に効率的に行う方法として、EI22, CHP, VZ22を引用して、新しい空間に拡張した。
論文 参考訳(メタデータ) (2023-01-04T04:15:40Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Uncertainties in Quantum Measurements: A Quantum Tomography [52.77024349608834]
量子系 $S$ に関連する可観測物は非可換代数 $mathcal A_S$ を形成する。
密度行列 $rho$ は可観測物の期待値から決定できると仮定される。
アーベル代数は内部自己同型を持たないので、測定装置は可観測物の平均値を決定することができる。
論文 参考訳(メタデータ) (2021-12-14T16:29:53Z) - On the Self-Penalization Phenomenon in Feature Selection [69.16452769334367]
カーネル群に基づく暗黙の空間性誘導機構について述べる。
アプリケーションとしては、この疎結合誘導機構を使用して、特徴選択に一貫性のあるアルゴリズムを構築します。
論文 参考訳(メタデータ) (2021-10-12T09:36:41Z) - Random matrices in service of ML footprint: ternary random features with
no performance loss [55.30329197651178]
我々は、$bf K$ の固有スペクトルが$bf w$ の i.d. 成分の分布とは独立であることを示す。
3次ランダム特徴(TRF)と呼ばれる新しいランダム手法を提案する。
提案したランダムな特徴の計算には乗算が不要であり、古典的なランダムな特徴に比べてストレージに$b$のコストがかかる。
論文 参考訳(メタデータ) (2021-10-05T09:33:49Z) - Superharmonic double-well systems with zero-energy ground states:
Relevance for diffusive relaxation scenarios [0.0]
直線上のSmoluchowski拡散過程の緩和特性をスペクトル的に定量することができる。
hatH$の特異性は、準特殊解決可能なSchr"odinger型系の族を指すことである。
論文 参考訳(メタデータ) (2021-04-24T08:11:54Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。