論文の概要: A Simple Method for PMF Estimation on Large Supports
- arxiv url: http://arxiv.org/abs/2510.15132v1
- Date: Thu, 16 Oct 2025 20:47:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.388746
- Title: A Simple Method for PMF Estimation on Large Supports
- Title(参考訳): 大規模支援のためのPMF簡易推定法
- Authors: Alex Shtoff,
- Abstract要約: 本研究では,PMF が多モードかつ重み付きである大規模離散支持体上での確率質量関数 (PMF) の非パラメトリック推定について検討した。
経験的PMFをこの低次元部分空間に投影すると、ノイズを抑えながら粗い構造を保存する滑らかなマルチモーダル推定が得られる。
この方法は実装が短く、サンプルサイズにまたがって堅牢であり、信頼性と速度のため、自動パイプラインと大規模探索分析に適している。
- 参考スコア(独自算出の注目度): 0.7163391346004578
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study nonparametric estimation of a probability mass function (PMF) on a large discrete support, where the PMF is multi-modal and heavy-tailed. The core idea is to treat the empirical PMF as a signal on a line graph and apply a data-dependent low-pass filter. Concretely, we form a symmetric tri-diagonal operator, the path graph Laplacian perturbed with a diagonal matrix built from the empirical PMF, then compute the eigenvectors, corresponding to the smallest feq eigenvalues. Projecting the empirical PMF onto this low dimensional subspace produces a smooth, multi-modal estimate that preserves coarse structure while suppressing noise. A light post-processing step of clipping and re-normalizing yields a valid PMF. Because we compute the eigenpairs of a symmetric tridiagonal matrix, the computation is reliable and runs time and memory proportional to the support times the dimension of the desired low-dimensional supspace. We also provide a practical, data-driven rule for selecting the dimension based on an orthogonal-series risk estimate, so the method "just works" with minimal tuning. On synthetic and real heavy-tailed examples, the approach preserves coarse structure while suppressing sampling noise, compares favorably to logspline and Gaussian-KDE baselines in the intended regimes. However, it has known failure modes (e.g., abrupt discontinuities). The method is short to implement, robust across sample sizes, and suitable for automated pipelines and exploratory analysis at scale because of its reliability and speed.
- Abstract(参考訳): 本研究では,PMF が多モードかつ重み付きである大規模離散支持体上での確率質量関数 (PMF) の非パラメトリック推定について検討した。
その中核となる考え方は、経験的PMFを線グラフ上の信号として扱い、データ依存ローパスフィルタを適用することである。
具体的には、経験的 PMF から構築された対角行列で摂動された経路グラフ Laplacian を対称三対角作用素とし、最小の feq 固有値に対応する固有ベクトルを計算する。
経験的PMFをこの低次元部分空間に投影すると、ノイズを抑えながら粗い構造を保存する滑らかなマルチモーダル推定が得られる。
クリッピング及び再正規化の軽量後処理ステップは、有効なPMFを得る。
対称三対角行列の固有ペアを計算するため、計算は信頼性が高く、所望の低次元超空間の次元の支持時間に比例して時間とメモリを実行する。
また、直交系列リスク推定に基づいて次元を選択するための実用的なデータ駆動型ルールも提供する。
合成および実重み付き例において、本手法はサンプリングノイズを抑えながら粗い構造を保ち、目的の体制における対数スプラインおよびガウス-KDEベースラインと好適に比較する。
しかし、障害モード(例えば、突然の不連続)が知られている。
この方法は実装が短く、サンプルサイズで堅牢であり、信頼性と速度のため、自動パイプラインと大規模探索解析に適している。
関連論文リスト
- Euclidean Distance Matrix Completion via Asymmetric Projected Gradient Descent [25.846262685970164]
本稿では,Burer-Monteiro因子化に基づく勾配型アルゴリズムの提案と解析を行う。
部分ユークリッド距離測定から点集合構成を再構成する。
論文 参考訳(メタデータ) (2025-04-28T07:13:23Z) - A Bayesian Approach Toward Robust Multidimensional Ellipsoid-Specific Fitting [0.0]
本研究は, ノイズおよび外周波の汚染における散乱データに多次元楕円体を適合させる, 新規で効果的な方法を提案する。
楕円体領域内でのプリミティブパラメータの探索を制約するために、均一な事前分布を組み込む。
本研究では, 顕微鏡細胞計数, 3次元再構成, 幾何学的形状近似, 磁力計の校正タスクなど, 幅広い応用に応用する。
論文 参考訳(メタデータ) (2024-07-27T14:31:51Z) - Large-scale gradient-based training of Mixtures of Factor Analyzers [67.21722742907981]
本稿では,勾配降下による高次元学習を効果的に行うための理論解析と新しい手法の両立に寄与する。
MFAトレーニングと推論/サンプリングは,学習終了後の行列逆変換を必要としない精度行列に基づいて行うことができることを示す。
理論解析と行列の他に,SVHNやMNISTなどの画像データセットにMFAを適用し,サンプル生成と外乱検出を行う能力を示す。
論文 参考訳(メタデータ) (2023-08-26T06:12:33Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - Robust Principal Component Analysis: A Median of Means Approach [17.446104539598895]
主成分分析(main Component Analysis)は、データビジュアライゼーション、デノイング、次元削減のためのツールである。
最近の教師付き学習手法は、外見的な観察を扱う上で大きな成功を収めている。
本稿では,MoM原理に基づくPCA手法を提案する。
論文 参考訳(メタデータ) (2021-02-05T19:59:05Z) - Stochastic Approximation for Online Tensorial Independent Component
Analysis [98.34292831923335]
独立成分分析(ICA)は統計機械学習や信号処理において一般的な次元削減ツールである。
本稿では,各独立成分を推定する副産物オンライン時系列アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-28T18:52:37Z) - Independent finite approximations for Bayesian nonparametric inference [30.367795444044788]
等質なランダム測度に対する実用的な有限次元近似を構築するためのレシピを提案する。
我々は、AIFAの近似誤差を、一般的なCRMとNCRMの幅広いクラスに上限付けする。
最悪の場合、TFAはAIFAよりも効率的であることを示す。
論文 参考訳(メタデータ) (2020-09-22T19:37:21Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。