論文の概要: Not all Jensen-Shannon Divergence Estimators are Equal
- arxiv url: http://arxiv.org/abs/2606.16411v1
- Date: Mon, 15 Jun 2026 08:49:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.248207
- Title: Not all Jensen-Shannon Divergence Estimators are Equal
- Title(参考訳): すべてのJensen-Shannon拡散推定器は等式ではない
- Authors: Alba Garrido, Alejandro Almodóvar, Mar Elizo, Patricia A. Apellániz, Santiago Zazo, Juan Parras,
- Abstract要約: 異なるプロトコルがJensen-Shannon発散に対して比較不可能な値が得られることを示す。
実験的なJensen-Shannon分散値が本質的にプロトコル依存であることを示し、有意な比較に必要な推定手順を明示する。
- 参考スコア(独自算出の注目度): 38.594313322631216
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The Jensen-Shannon divergence is widely reported as a scalar measure of fidelity for synthetic tabular data. Yet, in practice, it is estimated from finite samples using protocols that are often underspecified. This creates a measurement problem. Although the population divergence is well defined, the empirical value depends on the estimator family, sampling protocol, calibration, dimensionality, and class balance. We show that different protocols can yield non-comparable values: marginal-based estimators ignore dependencies in the joint distribution and can severely underestimate divergence, while classifier-based estimators capture joint structure but exhibit strong estimator dependence. We systematically study this behavior across controlled settings with reference divergences and real-world synthetic tabular benchmarks. Our analysis reveals dependence blindness in marginal estimators, prior-shift bias under class imbalance, and estimator sensitivity in high dimensions. To address prior shift, we derive a closed-form posterior correction for classifier-based Jensen-Shannon estimation. Our results show that empirical Jensen-Shannon divergence values are inherently protocol-dependent, making explicit specification of the estimation procedure necessary for meaningful comparison. We provide practical guidelines and an open-source tool for estimator-aware Jensen-Shannon evaluation.
- Abstract(参考訳): イェンセン=シャノンの発散は、合成表データに対する忠実度のスカラー尺度として広く報告されている。
しかし実際には、しばしば不特定なプロトコルを用いて有限標本から推定される。
これは測定問題を引き起こす。
人口のばらつきはよく定義されているが、経験的価値は推定器ファミリー、サンプリングプロトコル、キャリブレーション、次元性、クラスバランスに依存している。
辺縁型推定器は結合分布の依存性を無視し、偏差を極端に過小評価できる一方で、分類器型推定器は結合構造を捉えるが、強い推定器依存を示す。
我々は,この動作を,参照発散と実世界の合成表型ベンチマークを用いて,制御された設定にわたって体系的に研究する。
分析の結果,辺縁推定器における依存障害,クラス不均衡下での偏差,高次元における推定器の感度が明らかになった。
先行シフトに対処するために,分類器に基づくJensen-Shannon推定のための閉形式後方補正法を導出する。
本結果は,経験的ジェンセン・シャノン分岐値が本質的にプロトコルに依存していることを示す。
本稿では,Jensen-Shannon評価のための実践的ガイドラインとオープンソースツールを提供する。
関連論文リスト
- Beyond Consistency: Inference for the Relative risk functional in Deep Nonparametric Cox Models [7.2275111013288535]
Coxをベースとした最適化誤差が、部分的可能性の下で集団リスクにどのように伝播するかは明らかでない。
また、ポイントワイドバイアスがどのように制御できるのか、またアンサンブルに基づく不確実性が現実的な分散体制の下でどのように振る舞うのかも不明である。
これらの問題に対処するディープコックス推定器の分布理論を開発する。
論文 参考訳(メタデータ) (2026-03-25T01:43:12Z) - Robust Score Matching [1.2835555561822447]
本研究では,観測データが汚染された状況下で,一貫したパラメータ推定値が得られるロバストなスコアマッチング手法を開発した。
提案手法の特長は指数関数モデルにおける凸性を維持することである。
数値実験および降水データセットで支援回復について検討した。
論文 参考訳(メタデータ) (2025-01-09T09:46:27Z) - Label Shift Estimators for Non-Ignorable Missing Data [2.605549784939959]
ランダム変数 Y の平均を非無視的欠損(すなわち、不足メカニズムが Y に依存する場合)で推定する問題を考察する。
当社のアプローチは、無視できないアプローチと無視できないアプローチを比較して、大規模な健康調査を用いて、病気の有病率を推定するために使用します。
論文 参考訳(メタデータ) (2023-10-27T16:50:13Z) - The Representation Jensen-Shannon Divergence [0.0]
確率分布の違いの定量化は機械学習において重要である。
本研究は,従来のジェンセン・シャノン発散に触発された新しい尺度であるジェンセン・シャノン発散(RJSD)の表現を提案する。
本研究は, RJSDが2サンプル試験, 分散シフト検出, 教師なし領域適応において優れていることを示すものである。
論文 参考訳(メタデータ) (2023-05-25T19:44:36Z) - Multi-Fidelity Covariance Estimation in the Log-Euclidean Geometry [0.0]
対称正定値多様体の対数ユークリッド幾何学を利用する共分散行列の多値推定器を導入する。
固定予算が与えられた推定器の平均二乗誤差を最小化する最適サンプル割り当て方式を開発した。
物理アプリケーションからのデータによるアプローチの評価は、ベンチマークと比較すると、より正確なメトリック学習と1桁以上のスピードアップを示している。
論文 参考訳(メタデータ) (2023-01-31T16:33:46Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Estimating Gradients for Discrete Random Variables by Sampling without
Replacement [93.09326095997336]
我々は、置換のないサンプリングに基づいて、離散確率変数に対する期待値の偏りのない推定器を導出する。
推定器は3つの異なる推定器のラオ・ブラックウェル化として導出可能であることを示す。
論文 参考訳(メタデータ) (2020-02-14T14:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。