論文の概要: On the $\alpha$-lazy version of Markov chains in estimation and testing
problems
- arxiv url: http://arxiv.org/abs/2105.09536v1
- Date: Thu, 20 May 2021 06:26:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-05-21 13:45:31.402020
- Title: On the $\alpha$-lazy version of Markov chains in estimation and testing
problems
- Title(参考訳): 推定およびテスト問題におけるマルコフ連鎖の$\alpha$-lazyバージョンについて
- Authors: Sela Fried, Geoffrey Wolfer
- Abstract要約: いくつかの結果から、元のプロセスの$alpha$-lazyバージョンをシミュレートすることで、周期性要件を省略できることを示す。
特に、上記の結果のいくつかについては、元のプロセスの$alpha$-lazyバージョンをシミュレートすることで、周期性要件を省略できることを示す。
- 参考スコア(独自算出の注目度): 4.594159253008449
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We formulate extendibility of the minimax one-trajectory length of several
statistical Markov chains inference problems and give sufficient conditions for
both the possibility and impossibility of such extensions. We follow up and
apply this framework to recently published results on learning and identity
testing of ergodic Markov chains. In particular, we show that for some of the
aforementioned results, we can omit the aperiodicity requirement by simulating
an $\alpha$-lazy version of the original process, and quantify the incurred
cost of removing this assumption.
- Abstract(参考訳): いくつかの統計マルコフ連鎖推論問題のミニマックス1軌道長の拡張性を定式化し、そのような拡張の可能性と不可能性の両方に十分な条件を与える。
我々は、このフレームワークをエルゴードマルコフ連鎖の学習とアイデンティティテストに関する最近発表された結果に追従し、応用する。
特に、上記の結果のいくつかについては、元のプロセスの$\alpha$-lazyバージョンをシミュレートして周期性要件を省略し、この仮定を除去するコストを定量化できることが示される。
関連論文リスト
- Sharp Convergence Rates for Masked Diffusion Models [53.117058231393834]
制約を克服するオイラー法に対する全変分に基づく解析法を開発した。
その結果、スコア推定の仮定を緩和し、パラメータ依存性を改善し、収束保証を確立する。
全体としては,CTMC軌道に沿った直接テレビによる誤り分解と,FHSのためのデカップリングに基づく経路解析を導入している。
論文 参考訳(メタデータ) (2026-02-26T00:47:51Z) - Asymptotically Optimal Sequential Testing with Markovian Data [20.18233038746029]
我々は,エルゴディックマルコフ連鎖によって生成されるデータに対して,一側および$$-correct sequence hypothesis testについて検討した。
我々は,有効なシーケンシャルテストの停止時間に対して,非漸近性に依存しない厳密なインスタンスを確立する。
本研究はマルコフ依存下での最適シーケンシャルテスト手順の鋭く一般的な特徴である。
論文 参考訳(メタデータ) (2026-02-19T18:11:02Z) - Stabilizing Fixed-Point Iteration for Markov Chain Poisson Equations [49.702772230127465]
有限状態マルコフ鎖を$n$状態と遷移行列$P$で研究する。
すべての非退化モードが実周辺不変部分空間 $mathcalK(P)$ によってキャプチャされ、商空間 $mathbbRn/mathcalK(P) 上の誘導作用素が厳密に収縮し、ユニークな商解が得られることを示す。
論文 参考訳(メタデータ) (2026-01-31T02:57:01Z) - Achieving $\varepsilon^{-2}$ Dependence for Average-Reward Q-Learning with a New Contraction Principle [13.418969441591882]
平均回帰マルコフ決定過程に対する同期および非同期Q-ラーニングの収束率を示す。
分析の核となるのは、インスタンス依存半ノルムの構成であり、マルコフ決定過程の遅延変換の後、ベルマン作用素がこの半ノルムの下で一段階の縮約となることを示す。
論文 参考訳(メタデータ) (2026-01-29T05:54:31Z) - Don't Throw Away Your Beams: Improving Consistency-based Uncertainties in LLMs via Beam Search [111.6996614063716]
整合性に基づく不確実性推定の候補を生成するためにビームサーチを用いる新しい手法のファミリーを導入する。
我々は、6つのQAデータセットに対する我々のアプローチを実証的に評価し、その多項サンプリングに対する一貫した改善が最先端のUQパフォーマンスをもたらすことを発見した。
論文 参考訳(メタデータ) (2025-12-10T11:24:29Z) - Estimating stationary mass, frequency by frequency [11.476508212290275]
本稿では,指数関数的に$alpha$-mixingプロセスの定常分布によって配置される確率質量を推定する問題を考察する。
総変分距離におけるこの確率ベクトルを推定し、$n$の普遍的一貫性を示す。
我々は、自然の自己正規化統計混合配列の濃度不等式を含む補完ツールを開発し、関連する問題に対する推定器の設計と分析に独立して有用であることを示した。
論文 参考訳(メタデータ) (2025-03-17T04:24:21Z) - Robust Label Shift Quantification [55.2480439325792]
本稿では,ラベル分布のロバストな推定器を提案する。
以上の結果から,最大公試ラベルシフトのロバスト性に関する経験的観測の理論的検証が得られた。
論文 参考訳(メタデータ) (2025-02-05T13:51:24Z) - Step-by-Step Reasoning for Math Problems via Twisted Sequential Monte Carlo [55.452453947359736]
Twisted Sequential Monte Carlo(TSMC)に基づく新しい検証手法を提案する。
TSMCを大規模言語モデルに適用し、部分解に対する将来的な報酬を推定する。
このアプローチは、ステップワイドなヒューマンアノテーションを必要としない、より直接的なトレーニングターゲットをもたらす。
論文 参考訳(メタデータ) (2024-10-02T18:17:54Z) - Testing the Feasibility of Linear Programs with Bandit Feedback [53.40256244941895]
我々は,低回帰アルゴリズムと反復対数の漸近法則に基づくテストを開発する。
このテストが信頼できることを証明し、信号レベルに適応する'$Gamma,$ of any instance。
信頼性テストのサンプルコストに対して、最小限の$(Omegad/Gamma2)$で補う。
論文 参考訳(メタデータ) (2024-06-21T20:56:35Z) - Language Model Cascades: Token-level uncertainty and beyond [65.38515344964647]
言語モデル(LM)の最近の進歩により、複雑なNLPタスクの品質が大幅に向上した。
Cascadingは、より好ましいコスト品質のトレードオフを達成するためのシンプルな戦略を提供する。
トークンレベルの不確実性を学習後遅延ルールに組み込むことで,単純な集約戦略を著しく上回ることを示す。
論文 参考訳(メタデータ) (2024-04-15T21:02:48Z) - On Learning Latent Models with Multi-Instance Weak Supervision [57.18649648182171]
本稿では,複数の入力インスタンスに関連付けられた遷移関数$sigma$ラベルによって,教師信号が生成される弱い教師付き学習シナリオについて考察する。
我々の問題は、潜在的な構造学習やニューロシンボリックな統合など、さまざまな分野で満たされている。
論文 参考訳(メタデータ) (2023-06-23T22:05:08Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - A Geometric Reduction Approach for Identity Testing of Reversible Markov
Chains [25.33133112984769]
可逆マルコフ連鎖の同一性を、観測の単一軌跡からの参照に対して検定する問題を考察する。
少なくとも軽度に制限された環境では、可逆鎖に対するアイデンティティのテストは、より大きな状態空間上の対称鎖へのテストに還元されることを示す。
論文 参考訳(メタデータ) (2023-02-16T03:41:39Z) - Offline Estimation of Controlled Markov Chains: Minimaxity and Sample
Complexity [8.732260277121547]
我々は、推定器のサンプル複雑性境界を開発し、最小限の条件を確立する。
特定の統計的リスク境界を達成するには、混合特性の強さとサンプル数との微妙で興味深いトレードオフが伴うことを示す。
論文 参考訳(メタデータ) (2022-11-14T03:39:59Z) - Comparison of Markov chains via weak Poincar\'e inequalities with
application to pseudo-marginal MCMC [0.0]
マルコフ連鎖の平衡への有界収束に対する弱ポアンカーの不等式として知られるある種の機能的不等式の使用について検討する。
本研究では, 独立メトロポリス・ハスティングス・サンプリング法や, 難易度を求める疑似マルジナル手法などの手法に対して, サブ幾何学的収束境界の導出を可能にすることを示す。
論文 参考訳(メタデータ) (2021-12-10T15:36:30Z) - Three rates of convergence or separation via U-statistics in a dependent
framework [5.929956715430167]
我々はこの理論的なブレークスルーを、3つの異なる研究分野における現在の知識の状態を推し進めることで実行した。
まず、MCMC法によるトレースクラス積分作用素のスペクトル推定のための新しい指数関数不等式を確立する。
さらに、ペアワイズ損失関数とマルコフ連鎖サンプルを扱うオンラインアルゴリズムの一般化性能について検討する。
論文 参考訳(メタデータ) (2021-06-24T07:10:36Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Identity testing of reversible Markov chains [4.594159253008449]
我々は、観測の単一の軌道に基づいてマルコフ鎖のアイデンティティテストの問題を検討する。
対称性の仮定をより自然な可逆性の仮定に緩和し、参照と未知のマルコフ鎖の両方が同じ定常分布を共有していると仮定する。
論文 参考訳(メタデータ) (2021-05-13T15:03:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。