論文の概要: On the Statistical Complexity of Estimating VENDI Scores from Empirical Data
- arxiv url: http://arxiv.org/abs/2410.21719v1
- Date: Tue, 29 Oct 2024 04:19:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:43:06.864192
- Title: On the Statistical Complexity of Estimating VENDI Scores from Empirical Data
- Title(参考訳): 経験的データによるVENDIスコア推定の統計的複雑さについて
- Authors: Azim Ospanov, Farzan Farnia,
- Abstract要約: VENDIスコアは、生成モデルを評価するための基準フリーメトリックである。
行列ベースのエントロピー統計に収束する$t$truncated VENDI統計を導入する。
VENDIスコアに対する既存のNystr"om法とFKEA近似法の両方が、定義されたtruncated VENDI統計に収束することを示す。
- 参考スコア(独自算出の注目度): 9.054540533394926
- License:
- Abstract: Reference-free evaluation metrics for generative models have recently been studied in the machine learning community. As a reference-free metric, the VENDI score quantifies the diversity of generative models using matrix-based entropy from information theory. The VENDI score is usually computed through the eigendecomposition of an $n \times n$ kernel matrix for $n$ generated samples. However, due to the high computational cost of eigendecomposition for large $n$, the score is often computed on sample sizes limited to a few tens of thousands. In this paper, we explore the statistical convergence of the VENDI score and demonstrate that for kernel functions with an infinite feature map dimension, the evaluated score for a limited sample size may not converge to the matrix-based entropy statistic. We introduce an alternative statistic called the $t$-truncated VENDI statistic. We show that the existing Nystr\"om method and the FKEA approximation method for the VENDI score will both converge to the defined truncated VENDI statistic given a moderate sample size. We perform several numerical experiments to illustrate the concentration of the empirical VENDI score around the truncated VENDI statistic and discuss how this statistic correlates with the visual diversity of image data.
- Abstract(参考訳): 生成モデルに対する参照なし評価指標は、機械学習コミュニティで最近研究されている。
基準のない計量として、VENDIスコアは情報理論から行列ベースのエントロピーを用いて生成モデルの多様性を定量化する。
VENDIスコアは通常、$n$生成されたサンプルに対する$n \times n$カーネル行列の固有分解によって計算される。
しかし、大きな$n$の固有分解の計算コストが高いため、このスコアは数万に制限されたサンプルサイズで計算されることが多い。
本稿では,VENDIスコアの統計的収束について検討し,無限の特徴写像次元を持つカーネル関数に対して,限られたサンプルサイズに対する評価スコアが行列ベースのエントロピー統計に収束しないことを実証する。
我々は、$t$-truncated VENDI 統計という別の統計手法を導入する。
VENDIスコアに対する既存のNystr\"om法とFKEA近似法は、中程度のサンプルサイズで定義されたtruncated VENDI統計値に収束することを示す。
本研究は,VENDIスコアの変動するVENDI統計値の集中度を示す数値実験を行い,この統計値が画像データの視覚的多様性とどのように相関するかを議論する。
関連論文リスト
- Robust Estimation for Kernel Exponential Families with Smoothed Total Variation Distances [2.317910166616341]
統計的推測では、標本は独立であり、確率分布から同一に分布していると一般的に仮定する。
本稿では,GAN-like 推定器の一般統計モデルへの応用について検討する。
論文 参考訳(メタデータ) (2024-10-28T05:50:47Z) - Towards a Scalable Reference-Free Evaluation of Generative Models [9.322073391374039]
本稿では、VENDIとRKEのエントロピースコアを推定するためのカーネルエントロピー近似(FKEA)法を提案する。
我々は、FKEAの数値性能を、標準画像、テキスト、ビデオデータセットに適用して広範囲に評価する。
実験結果から,大規模生成モデルに適用する手法のスケーラビリティと解釈可能性を示す。
論文 参考訳(メタデータ) (2024-07-03T09:54:58Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - An Interpretable Evaluation of Entropy-based Novelty of Generative Models [36.29214321258605]
生成モデルのモードベースノベルティを定量化するために,カーネルベースのエントロピーノベルティ(KEN)スコアを提案する。
合成および実画像データセットの数値計算結果から,新しいモードの検出におけるフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2024-02-27T08:00:52Z) - MAUVE Scores for Generative Models: Theory and Practice [95.86006777961182]
本報告では,テキストや画像の生成モデルで発生するような分布のペア間の比較尺度であるMAUVEについて述べる。
我々は、MAUVEが人間の文章の分布と現代のニューラル言語モデルとのギャップを定量化できることを発見した。
我々は、MAUVEが既存のメトリクスと同等以上の画像の既知の特性を識別できることを視覚領域で実証する。
論文 参考訳(メタデータ) (2022-12-30T07:37:40Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - RIFLE: Imputation and Robust Inference from Low Order Marginals [10.082738539201804]
我々は,不備なデータの存在下での回帰と分類のための統計的推論フレームワークを開発する。
我々のフレームワークであるRIFLEは、基礎となるデータ分布の低次モーメントを対応する信頼区間で推定し、分布的に堅牢なモデルを学ぶ。
実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-09-01T23:17:30Z) - Multi-label Contrastive Predictive Coding [125.03510235962095]
差分相互情報(MI)推定器は、コントラスト予測符号化(CPC)のような教師なし表現学習法で広く利用されている。
本稿では,複数の正のサンプルを同時に同定する必要がある多ラベル分類問題に基づく新しい推定器を提案する。
同一量の負のサンプルを用いて複数ラベルのCPCが$log m$boundを超えることができる一方で、相互情報の有意な下限であることを示す。
論文 参考訳(メタデータ) (2020-07-20T02:46:21Z) - Density of States Estimation for Out-of-Distribution Detection [69.90130863160384]
DoSEは状態推定器の密度である。
我々は、他の教師なしOOD検出器に対するDoSEの最先端性能を実証する。
論文 参考訳(メタデータ) (2020-06-16T16:06:25Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Unbiased and Efficient Log-Likelihood Estimation with Inverse Binomial
Sampling [9.66840768820136]
逆二項サンプリング(IBS)は、データセット全体のログ類似度を、バイアスなく効率的に推定することができる。
IBSは、推定パラメータと最大対数類似値において、代替サンプリング法よりも低い誤差を生成する。
論文 参考訳(メタデータ) (2020-01-12T19:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。