論文の概要: Sampling and Identity-Testing Without Approximate Tensorization of Entropy
- arxiv url: http://arxiv.org/abs/2506.23456v1
- Date: Mon, 30 Jun 2025 01:36:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.881609
- Title: Sampling and Identity-Testing Without Approximate Tensorization of Entropy
- Title(参考訳): エントロピーの近似テンソル化のないサンプリングとアイデンティティテスト
- Authors: William Gay, William He, Nicholas Kocurek, Ryan O'Donnell,
- Abstract要約: エントロピーの近似テンソル化を満足しない分布に対するアイデンティティテストとサンプリングの複雑さについて検討する。
修正対数ソボレフの不等式を満たす分布の混合に対して,データに基づく初期化と最適なサンプル複雑性からグラウバー力学の高速混合を示す。
また,Blancaなどのアルゴリズムの単純化や改良も行った。
- 参考スコア(独自算出の注目度): 1.593690982728631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Certain tasks in high-dimensional statistics become easier when the underlying distribution satisfies a local-to-global property called approximate tensorization of entropy (ATE). For example, the Glauber dynamics Markov chain of an ATE distribution mixes fast and can produce approximate samples in a small amount of time, since such a distribution satisfies a modified log-Sobolev inequality. Moreover, identity-testing for an ATE distribution requires few samples if the tester is given coordinate conditional access to the unknown distribution, as shown by Blanca, Chen, \v{S}tefankovi\v{c}, and Vigoda (COLT 2023). A natural class of distributions that do not satisfy ATE consists of mixtures of (few) distributions that do satisfy ATE. We study the complexity of identity-testing and sampling for these distributions. Our main results are the following: 1. We show fast mixing of Glauber dynamics from a data-based initialization, with optimal sample complexity, for mixtures of distributions satisfying modified log-Sobolev inequalities. This extends work of Huang, Koehler, Lee, Mohanty, Rajaraman, Vuong, and Wu (STOC 2025, COLT 2025) for mixtures of distributions satisfying Poincar\'e inequalities. 2. Answering an open question posed by Blanca et al., we give efficient identity-testers for mixtures of ATE distributions in the coordinate-conditional sampling access model. We also give some simplifications and improvements to the original algorithm of Blanca et al.
- Abstract(参考訳): 高次元統計学における特定のタスクは、基礎となる分布がエントロピーの近似テンソル化(ATE)と呼ばれる局所的-言語的性質を満たすと容易になる。
例えば、ATE分布のグラウバー力学マルコフ連鎖は、修正された対数ソボレフの不等式を満たすため、高速に混合され、少量の時間で近似サンプルを生成することができる。
さらに、ATE分布のIDテストは、Blanca, Chen, \v{S}tefankovi\v{c}, Vigoda (COLT 2023) が示すように、テスターが未知分布への座標条件アクセスを与えられた場合、サンプルをほとんど必要としない。
ATEを満足しない分布の自然なクラスは、ATEを満足しない(fw)分布の混合からなる。
これらの分布に対するアイデンティティテストとサンプリングの複雑さについて検討する。
1) 修正された対数ソボレフの不等式を満たす分布の混合に対して,データに基づく初期化と最適なサンプル複雑性のグラウバー力学の高速混合を示す。
これは、Poincar\eの不等式を満たす分布の混合に対して、Huang, Koehler, Lee, Mohanty, Rajaraman, Vuong, Wu (STOC 2025, COLT 2025) の著作を拡張している。
2) Blancaらによるオープンな質問に答えて, 座標条件サンプリングアクセスモデルにおいて, ATE分布の混合に対して効率的な同一性テストを行う。
また、Blanca et al のアルゴリズムの単純化と改良も行っている。
関連論文リスト
- Efficiently learning and sampling multimodal distributions with data-based initialization [20.575122468674536]
静止測度から少数のサンプルを与えられたマルコフ連鎖を用いて多重モーダル分布をサンプリングする問題を考察する。
マルコフ連鎖が$k$dのスペクトルギャップを持つ場合、静止分布からのサンプルは、静止測度からテレビ距離において$varepsilon$-closeの条件法則を持つサンプルを効率よく生成する。
論文 参考訳(メタデータ) (2024-11-14T01:37:02Z) - Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Broadening Target Distributions for Accelerated Diffusion Models via a Novel Analysis Approach [49.97755400231656]
本研究では,新しいDDPMサンプリング器が,これまで考慮されていなかった3種類の分散クラスに対して高速化性能を実現することを示す。
この結果から, DDPM型加速サンプリング器におけるデータ次元$d$への依存性が改善された。
論文 参考訳(メタデータ) (2024-02-21T16:11:47Z) - Fit Like You Sample: Sample-Efficient Generalized Score Matching from
Fast Mixing Diffusions [29.488555741982015]
幅広いマルコフ過程の混合時間と生成元 $mathcalL$ との密接な関係を示す。
我々はマルコフ連鎖を高速化し、より良いスコアマッチング損失を構築する技術に適応する。
特に、拡散のプレコンディショニング'をスコア損失の適切なプレコンディショニング'に変換することができる。
論文 参考訳(メタデータ) (2023-06-15T17:58:42Z) - Nearest-Neighbor Sampling Based Conditional Independence Testing [15.478671471695794]
条件付きランダム化テスト (CRT) は、2つの確率変数 X と Y が条件付き独立な与えられた確率変数 Z であるかどうかをテストするために最近提案された。
本研究の目的は, 与えられたXの分布の正確な形式を仮定することなく, 隣り合うサンプリングを用いて, CRTの新たな代替品を開発することである。
論文 参考訳(メタデータ) (2023-04-09T07:54:36Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。
標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。
この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文 参考訳(メタデータ) (2020-01-19T12:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。