論文の概要: Semiparametric KSD test: unifying score and distance-based approaches for goodness-of-fit testing
- arxiv url: http://arxiv.org/abs/2512.20007v1
- Date: Tue, 23 Dec 2025 03:05:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.726604
- Title: Semiparametric KSD test: unifying score and distance-based approaches for goodness-of-fit testing
- Title(参考訳): 半パラメトリック KSD テスト : スコアの統一化と距離ベースによる適合性テストのためのアプローチ
- Authors: Zhihan Huang, Ziang Niu,
- Abstract要約: 評価値に基づくGoF(Goodness-of-fit)テストは,関数クラスによってインデックスされた積分確率指標(IPM)に基づくテストと等価であることを示す。
我々は、Steinの関数クラスによって誘導される特別なIMMクラスを通して、新しい非パラメトリックスコアベースのGoFテストを提案する。
提案手法は,Anderson-Darling や Lilliefors といったタスク固有の正規性テストに匹敵する能力を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Goodness-of-fit (GoF) tests are fundamental for assessing model adequacy. Score-based tests are appealing because they require fitting the model only once under the null. However, extending them to powerful nonparametric alternatives is difficult due to the lack of suitable score functions. Through a class of exponentially tilted models, we show that the resulting score-based GoF tests are equivalent to the tests based on integral probability metrics (IPMs) indexed by a function class. When the class is rich, the test is universally consistent. This simple yet insightful perspective enables reinterpretation of classical distance-based testing procedures-including those based on Kolmogorov-Smirnov distance, Wasserstein-1 distance, and maximum mean discrepancy-as arising from score-based constructions. Building on this insight, we propose a new nonparametric score-based GoF test through a special class of IPM induced by kernelized Stein's function class, called semiparametric kernelized Stein discrepancy (SKSD) test. Compared with other nonparametric score-based tests, the SKSD test is computationally efficient and accommodates general nuisance-parameter estimators, supported by a generic parametric bootstrap procedure. The SKSD test is universally consistent and attains Pitman efficiency. Moreover, SKSD test provides simple GoF tests for models with intractable likelihoods but tractable scores with the help of Stein's identity and we use two popular models, kernel exponential family and conditional Gaussian models, to illustrate the power of our method. Our method achieves power comparable to task-specific normality tests such as Anderson-Darling and Lilliefors, despite being designed for general nonparametric alternatives.
- Abstract(参考訳): GoF(Goodness-of-fit)テストは、モデルの妥当性を評価するための基本となる。
スコアベースのテストは、nullの下で一度だけモデルを適合させる必要があるため、魅力的である。
しかし、適切なスコア関数が欠如しているため、これらを強力な非パラメトリックな選択肢に拡張することは困難である。
指数傾斜モデルのクラスを通して、結果のスコアに基づくGoFテストは、関数クラスによってインデックスされた積分確率メトリクス(IPM)に基づくテストと等価であることを示す。
クラスがリッチであれば、テストは普遍的に一貫性がある。
この単純で洞察に富んだ視点は、スコアベースの構成から生じるコルモゴロフ-スミルノフ距離、ワッサーシュタイン-1距離、および最大平均誤差に基づく古典的な距離ベースの試験手順の再解釈を可能にする。
そこで本研究では,SKSD(Semiparametric kernelized Stein discrepancy)テスト(SKSD)と呼ばれる,Stein関数クラスによって誘導される特別なIMMクラスを介し,新しい非パラメトリックスコアベースのGoFテストを提案する。
他の非パラメトリックスコアベーステストと比較すると、SKSDテストは計算効率が良く、一般的なニュアンスパラメータ推定器に対応しており、一般的なパラメトリックブートストラップ手順でサポートされている。
SKSDテストは普遍的に一貫性があり、ピットマン効率を達成する。
さらに、SKSDテストは、ステインのアイデンティティの助けを借りて、抽出可能な確率を持つモデルに対する単純なGoFテストを提供し、我々は、我々の方法のパワーを説明するために、カーネル指数族と条件付きガウスモデルという2つの一般的なモデルを使用する。
本手法は、一般的な非パラメトリックな代替として設計されているにもかかわらず、Anderson-Darling や Lilliefors のようなタスク固有の正規性テストに匹敵する能力を実現する。
関連論文リスト
- Sample, Don't Search: Rethinking Test-Time Alignment for Language Models [55.2480439325792]
新しいテストタイムアライメントアプローチであるQAlignを紹介します。
テスト時間計算をスケールする際、QAlignは各プロンプトの最適配向分布からのサンプリングに収束する。
マルコフ連鎖モンテカルロのテキスト生成における最近の進歩を取り入れることで、基礎となるモデルを変更したり、ロジットアクセスを必要とせずに、より良い整合出力を可能にする。
論文 参考訳(メタデータ) (2025-04-04T00:41:40Z) - Context-Aware Testing: A New Paradigm for Model Testing with Large Language Models [49.06068319380296]
我々は,コンテキストを帰納バイアスとして用いて意味のあるモデル障害を探索するコンテキスト認識テスト(CAT)を導入する。
最初のCATシステムSMART Testingをインスタンス化し、大きな言語モデルを用いて、関連性があり、起こりうる失敗を仮説化します。
論文 参考訳(メタデータ) (2024-10-31T15:06:16Z) - Precise Error Rates for Computationally Efficient Testing [67.30044609837749]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Auto-Encoding Goodness of Fit [9.560668678348579]
We developed a new type of generative autoencoder called the Goodness-of-Fit Autoencoder (GoFAE)。
ミニバッチレベルでは、正規化の目的としてGoFテスト統計を使用する。
よりグローバルなレベルでは、より高い批判に基づいて正規化係数を選択する。
論文 参考訳(メタデータ) (2022-10-12T19:21:57Z) - A Simple Unified Approach to Testing High-Dimensional Conditional
Independences for Categorical and Ordinal Data [0.26651200086513094]
条件独立テスト(CI)は、因果推論におけるモデルテストと構造学習に多くのアプローチをとる。
分類データと順序データのための既存のCIテストは、条件変数によってサンプルを階層化し、各層で単純な独立テストを実行し、結果を組み合わせる。
本稿では,高次元における適切なキャリブレーションとパワーを維持するための,順序データと分類データに対する簡易な統合CIテストを提案する。
論文 参考訳(メタデータ) (2022-06-09T08:56:12Z) - Generalised Kernel Stein Discrepancy(GKSD): A Unifying Approach for
Non-parametric Goodness-of-fit Testing [5.885020100736158]
KSD(Non-parametric Goodness-of-fit testing procedure)は、一般的な非正規分布を検証するための有望なアプローチである。
我々は,KSDに基づく適合性テストの実行において,異なるStein演算子を理論的に比較・解釈するための統一フレームワークである一般化カーネルSteindisrepancy(GKSD)を提案する。
論文 参考訳(メタデータ) (2021-06-23T00:44:31Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。