Fugu-MT 論文翻訳(概要): PQMass: Probabilistic Assessment of the Quality of Generative Models using Probability Mass Estimation

論文の概要: PQMass: Probabilistic Assessment of the Quality of Generative Models using Probability Mass Estimation

arxiv url: http://arxiv.org/abs/2402.04355v2
Date: Thu, 06 Mar 2025 05:43:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-07 17:59:00.3428
Title: PQMass: Probabilistic Assessment of the Quality of Generative Models using Probability Mass Estimation
Title（参考訳）: PQMass:確率質量推定を用いた生成モデルの品質の確率論的評価
Authors: Pablo Lemos, Sammy Sharief, Nikolay Malkin, Salma Salhi, Conner Stone, Laurence Perreault-Levasseur, Yashar Hezaveh,
Abstract要約: そこで本研究では,各試料から得られる2つの分布を比較するための可能性のない手法を提案する。 PQMassはサンプル空間を重複しない領域に分割し、各領域に該当するデータサンプルの数にチ二乗テストを適用する。我々はPQMassが適度に高次元データにスケールできることを示し、実用的な応用における特徴抽出の必要性を排除している。
参考スコア（独自算出の注目度）: 7.143427689586699
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We propose a likelihood-free method for comparing two distributions given samples from each, with the goal of assessing the quality of generative models. The proposed approach, PQMass, provides a statistically rigorous method for assessing the performance of a single generative model or the comparison of multiple competing models. PQMass divides the sample space into non-overlapping regions and applies chi-squared tests to the number of data samples that fall within each region, giving a p-value that measures the probability that the bin counts derived from two sets of samples are drawn from the same multinomial distribution. PQMass does not depend on assumptions regarding the density of the true distribution, nor does it rely on training or fitting any auxiliary models. We evaluate PQMass on data of various modalities and dimensions, demonstrating its effectiveness in assessing the quality, novelty, and diversity of generated samples. We further show that PQMass scales well to moderately high-dimensional data and thus obviates the need for feature extraction in practical applications.
Abstract（参考訳）: 生成モデルの品質評価を目的とし,各サンプルから得られた2つの分布を比較する可能性のない手法を提案する。提案手法であるPQMassは,1つの生成モデルの性能評価や,複数の競合モデルの比較を行う統計的に厳密な手法を提供する。 PQMass はサンプル空間を重複しない領域に分割し、各領域に該当するデータサンプル数にチ二乗検定を適用し、2組のサンプルから派生したビン数が同じ多項分布から引き出される確率を測定する p-値を与える。 PQMass は真の分布の密度に関する仮定に依存せず、訓練や補助モデルへの適合にも依存しない。そこで我々は,PQMassを様々なモダリティや次元のデータに基づいて評価し,その品質,新規性,多様性を評価する上での有効性を実証した。さらに、PQMassは適度な高次元データにスケール可能であることを示し、実用的な応用における特徴抽出の必要性を排除している。

関連論文リスト

Flow-Based Density Ratio Estimation for Intractable Distributions with Applications in Genomics [80.05951561886123]
我々は条件認識フローマッチングを利用して、生成軌道に沿った密度比を追跡するための1つの動的定式化を導出する。クローズドフォーム比推定のためのシミュレーションベンチマーク上での競合性能を実証し,本手法が単一セルゲノミクスデータ解析における多目的タスクをサポートすることを示す。
論文参考訳（メタデータ） (2026-02-27T17:27:55Z)
Don't Throw Away Your Beams: Improving Consistency-based Uncertainties in LLMs via Beam Search [111.6996614063716]
整合性に基づく不確実性推定の候補を生成するためにビームサーチを用いる新しい手法のファミリーを導入する。我々は、6つのQAデータセットに対する我々のアプローチを実証的に評価し、その多項サンプリングに対する一貫した改善が最先端のUQパフォーマンスをもたらすことを発見した。
論文参考訳（メタデータ） (2025-12-10T11:24:29Z)
Importance-Weighted Non-IID Sampling for Flow Matching Models [5.995277983968318]
本研究では,フロー分布の多様で健全な領域をカバーするために,複数のサンプルを共同で描画する重要重み付き非IIDサンプリングフレームワークを提案する。多様性と品質のバランスをとるために,多様性機構のためのスコアベースの正規化を導入する。提案手法は,重要度と期待値の双方について,多種多様で高品質なサンプルと正確な推定値を生成する。
論文参考訳（メタデータ） (2025-11-21T22:05:56Z)
Scalable Importance Sampling in High Dimensions with Low-Rank Mixture Proposals [37.634056981112444]
重要サンプリングは、希少事象の可能性を効率的に推定するモンテカルロ法である。本稿では,重要サンプリングのためのパラメータ提案密度として,確率的主成分分析器(MPPCA)の混合物を提案する。提案手法を3つの模擬システム上で検証し, サンプル効率と故障分布評価の質に一貫した利得を示す。
論文参考訳（メタデータ） (2025-05-19T16:44:48Z)
Learning Survival Distributions with the Asymmetric Laplace Distribution [16.401141867387324]
非対称ラプラス分布(ALD)に基づくパラメトリックサバイバル解析法を提案する。この分布は、平均、中央値、モード、変動、量子化といった一般的なイベントサマリーの閉形式計算を可能にする。提案手法は, 精度, 識別, 校正の点でパラメトリックおよび非パラメトリックアプローチより優れていることを示す。
論文参考訳（メタデータ） (2025-05-06T17:34:41Z)
Mixture models for data with unknown distributions [0.6345523830122168]
実数値多変量データに対する混合モデルの幅広いクラスを記述・解析する。データの分割と分布の推定の両方を返却し、クラスタリングと密度推定を各クラスタ内で同時に効果的に行う。提案手法を図解的アプリケーション選択で実証し,両アルゴリズムをコードで実装する。
論文参考訳（メタデータ） (2025-02-26T22:42:40Z)
Constrained Diffusion Models via Dual Training [80.03953599062365]
拡散プロセスは、トレーニングデータセットのバイアスを反映したサンプルを生成する傾向がある。所望の分布に基づいて拡散制約を付与し,制約付き拡散モデルを構築する。本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文参考訳（メタデータ） (2024-08-27T14:25:42Z)
Provable Statistical Rates for Consistency Diffusion Models [87.28777947976573]
最先端の性能にもかかわらず、拡散モデルは、多くのステップが伴うため、遅いサンプル生成で知られている。本稿では, 整合性モデルに関する最初の統計理論に寄与し, 分散不整合最小化問題としてトレーニングを定式化している。
論文参考訳（メタデータ） (2024-06-23T20:34:18Z)
Empirical Density Estimation based on Spline Quasi-Interpolation with applications to Copulas clustering modeling [0.0]
密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。本稿では,擬似補間による密度の単変量近似を提案する。提案アルゴリズムは人工データセットと実データセットで検証される。
論文参考訳（メタデータ） (2024-02-18T11:49:38Z)
Score Approximation, Estimation and Distribution Recovery of Diffusion Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文参考訳（メタデータ） (2023-02-14T17:02:35Z)
Unsupervised Learning of Sampling Distributions for Particle Filters [80.6716888175925]
観測結果からサンプリング分布を学習する4つの方法を提案する。実験により、学習されたサンプリング分布は、設計された最小縮退サンプリング分布よりも優れた性能を示すことが示された。
論文参考訳（メタデータ） (2023-02-02T15:50:21Z)
Statistical Model Criticism of Variational Auto-Encoders [15.005894753472894]
変分自動エンコーダ(VAE)の統計的評価のための枠組みを提案する。我々は、手書き文字のイメージと英文のコーパスをモデル化する文脈において、このフレームワークの2つの例をテストする。
論文参考訳（メタデータ） (2022-04-06T18:19:29Z)
BRIO: Bringing Order to Abstractive Summarization [107.97378285293507]
非決定論的分布を前提とした新しい学習パラダイムを提案する。提案手法は, CNN/DailyMail (47.78 ROUGE-1) と XSum (49.07 ROUGE-1) のデータセット上で, 最新の結果が得られる。
論文参考訳（メタデータ） (2022-03-31T05:19:38Z)
Comparing two samples through stochastic dominance: a graphical approach [2.867517731896504]
実世界のシナリオでは非決定論的測定が一般的である。推定累積分布関数に従って2つのサンプルを視覚的に比較するフレームワークを提案する。
論文参考訳（メタデータ） (2022-03-15T13:37:03Z)
Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文参考訳（メタデータ） (2021-10-20T12:25:22Z)
A likelihood approach to nonparametric estimation of a singular distribution using deep generative models [4.329951775163721]
深部生成モデルを用いた特異分布の非パラメトリック推定の可能性について検討する。我々は、インスタンスノイズでデータを摂動することで、新しい効果的な解が存在することを証明した。また、より深い生成モデルにより効率的に推定できる分布のクラスを特徴付ける。
論文参考訳（メタデータ） (2021-05-09T23:13:58Z)
How Faithful is your Synthetic Data? Sample-level Metrics for Evaluating and Auditing Generative Models [95.8037674226622]
ドメインに依存しない方法で生成モデルの忠実度,多様性,一般化性能を特徴付ける3次元評価指標を提案する。当社のメトリクスは、精度リコール分析により統計的発散測定を統合し、モデル忠実度と多様性のサンプルおよび分布レベルの診断を可能にします。
論文参考訳（メタデータ） (2021-02-17T18:25:30Z)
A similarity-based Bayesian mixture-of-experts model [0.5156484100374058]
多変量回帰問題に対する新しい非パラメトリック混合実験モデルを提案する。条件付きモデルを用いて、サンプル外入力の予測は、観測された各データポイントと類似性に基づいて行われる。混合物のパラメータと距離測定値に基づいて後部推論を行う。
論文参考訳（メタデータ） (2020-12-03T18:08:30Z)
The UU-test for Statistical Modeling of Unimodal Data [0.20305676256390928]
一次元データセットの一様性を決定するUUテスト(Unimodal Uniform test)手法を提案する。このアプローチのユニークな特徴は、一様性の場合、一様混合モデルという形でデータの統計モデルも提供することである。
論文参考訳（メタデータ） (2020-08-28T08:34:28Z)
Improving Maximum Likelihood Training for Text Generation with Density Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文参考訳（メタデータ） (2020-07-12T15:31:24Z)
Density of States Estimation for Out-of-Distribution Detection [69.90130863160384]
DoSEは状態推定器の密度である。我々は、他の教師なしOOD検出器に対するDoSEの最先端性能を実証する。
論文参考訳（メタデータ） (2020-06-16T16:06:25Z)
Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文参考訳（メタデータ） (2020-02-17T19:23:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。