論文の概要: Improving Nonparametric Density Estimation with Tensor Decompositions
- arxiv url: http://arxiv.org/abs/2010.02425v1
- Date: Tue, 6 Oct 2020 01:39:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 06:29:51.808461
- Title: Improving Nonparametric Density Estimation with Tensor Decompositions
- Title(参考訳): テンソル分解による非パラメトリック密度推定の改善
- Authors: Robert A. Vandermeulen
- Abstract要約: 非パラメトリック密度推定器は、しばしば低次元データに対してよく機能するが、高次元データに適用すると苦しむ。
本稿では、これらの改善が他の単純化された依存前提にまで拡張できるかどうかを考察する。
多次元ヒストグラムにおける低ランク非負のPARAFACやTucker分解に対する推定の制限は、ビン幅速度の次元指数を除去することを示す。
- 参考スコア(独自算出の注目度): 14.917420021212912
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While nonparametric density estimators often perform well on low dimensional
data, their performance can suffer when applied to higher dimensional data,
owing presumably to the curse of dimensionality. One technique for avoiding
this is to assume no dependence between features and that the data are sampled
from a separable density. This allows one to estimate each marginal
distribution independently thereby avoiding the slow rates associated with
estimating the full joint density. This is a strategy employed in naive Bayes
models and is analogous to estimating a rank-one tensor. In this paper we
investigate whether these improvements can be extended to other simplified
dependence assumptions which we model via nonnegative tensor decompositions. In
our central theoretical results we prove that restricting estimation to
low-rank nonnegative PARAFAC or Tucker decompositions removes the
dimensionality exponent on bin width rates for multidimensional histograms.
These results are validated experimentally with high statistical significance
via direct application of existing nonnegative tensor factorization to
histogram estimators.
- Abstract(参考訳): 非パラメトリック密度推定器は低次元データに対してよく機能するが、その性能は高次元データに適用すると、おそらく次元性の呪いによって損なわれる。
これを回避する1つのテクニックは、特徴間の依存性を仮定せず、データは分離可能な密度からサンプリングされる。
これにより、各辺縁分布を独立に推定できるため、全関節密度の推定にかかわる遅い速度を回避することができる。
これはネーブベイズモデルで用いられる戦略であり、ランク1テンソルの推定に類似している。
本稿では、これらの改善が非負のテンソル分解を通じてモデル化する他の単純化された依存仮定に拡張できるかどうかを検討する。
中心的な理論的結果は,低ランク非負のPARAFACやTucker分解に対する推定の制限が,多次元ヒストグラムのビン幅速度の次元指数を除去することを証明する。
これらの結果は、既存の非負のテンソル因子化を直接ヒストグラム推定装置に適用することにより、高い統計的意義で実験的に検証される。
関連論文リスト
- High-Dimensional Tensor Discriminant Analysis with Incomplete Tensors [5.745276598549783]
本研究では,高次元線形判別分析における不完全データを用いたテンソル分類手法を提案する。
提案手法は,データ不足のかなりの割合であっても,シミュレーションや実データ解析において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-18T18:00:16Z) - Double Debiased Covariate Shift Adaptation Robust to Density-Ratio Estimation [7.8856737627153874]
重み付けによる共変量シフト適応のための二重頑健な推定器を提案する。
我々の推定器は密度比推定誤差から生じるバイアスを低減する。
特に、密度比推定器または回帰関数が整合である場合、我々の推定器は整合性を保つ。
論文 参考訳(メタデータ) (2023-10-25T13:38:29Z) - Anomaly Detection with Variance Stabilized Density Estimation [49.46356430493534]
本稿では, 観測試料の確率を最大化するための分散安定化密度推定問題を提案する。
信頼性の高い異常検知器を得るために,分散安定化分布を学習するための自己回帰モデルのスペクトルアンサンブルを導入する。
我々は52のデータセットで広範なベンチマークを行い、我々の手法が最先端の結果につながることを示した。
論文 参考訳(メタデータ) (2023-06-01T11:52:58Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Nonparametric Probabilistic Regression with Coarse Learners [1.8275108630751844]
我々は, 密度の形状や形状について最小限の仮定で, 正確な条件密度を計算することができることを示す。
このアプローチをさまざまなデータセットで実証し、特に大きなデータセットで競合性能を示す。
論文 参考訳(メタデータ) (2022-10-28T16:25:26Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Error Analysis of Tensor-Train Cross Approximation [88.83467216606778]
我々は, テンソル全体の精度保証を行う。
結果は数値実験により検証され、高次テンソルに対するクロス近似の有用性に重要な意味を持つ可能性がある。
論文 参考訳(メタデータ) (2022-07-09T19:33:59Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Low-rank Characteristic Tensor Density Estimation Part II: Compression
and Latent Density Estimation [31.631861197477185]
生成確率モデルを学習することは、機械学習における中核的な問題である。
本稿では,共同次元化と非パラメトリック密度推定の枠組みを提案する。
提案手法は, 回帰処理, サンプリング, 異常検出において, 極めて有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-06-20T00:38:56Z) - Low-rank Characteristic Tensor Density Estimation Part I: Foundations [38.05393186002834]
テンソル因子化ツールに基づく新しい手法を提案する。
次元の呪いを回避するため、この特性テンソルの低ランクモデルを導入する。
提案手法の有望な性能を,複数の測定データを用いて実証する。
論文 参考訳(メタデータ) (2020-08-27T18:06:19Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。