論文の概要: Signature Maximum Mean Discrepancy Two-Sample Statistical Tests
- arxiv url: http://arxiv.org/abs/2506.01718v1
- Date: Mon, 02 Jun 2025 14:26:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.310292
- Title: Signature Maximum Mean Discrepancy Two-Sample Statistical Tests
- Title(参考訳): 有意な最大値差の2サンプル統計試験
- Authors: Andrew Alden, Blanka Horvath, Zacharia Issa,
- Abstract要約: この研究は、統計的ツールとしてsig-MMDを適用する際の可能性と課題を理解することを目的としている。
我々は,Sig-MMDの導入と解説を行い,その実用化のために容易にアクセス可能で検証可能な実例を提供する。
- 参考スコア(独自算出の注目度): 0.5461938536945723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maximum Mean Discrepancy (MMD) is a widely used concept in machine learning research which has gained popularity in recent years as a highly effective tool for comparing (finite-dimensional) distributions. Since it is designed as a kernel-based method, the MMD can be extended to path space valued distributions using the signature kernel. The resulting signature MMD (sig-MMD) can be used to define a metric between distributions on path space. Similarly to the original use case of the MMD as a test statistic within a two-sample testing framework, the sig-MMD can be applied to determine if two sets of paths are drawn from the same stochastic process. This work is dedicated to understanding the possibilities and challenges associated with applying the sig-MMD as a statistical tool in practice. We introduce and explain the sig-MMD, and provide easily accessible and verifiable examples for its practical use. We present examples that can lead to Type 2 errors in the hypothesis test, falsely indicating that samples have been drawn from the same underlying process (which generally occurs in a limited data setting). We then present techniques to mitigate the occurrence of this type of error.
- Abstract(参考訳): 最大平均離散性(英: Maximum Mean Discrepancy、MMD)は、機械学習研究において広く使われている概念であり、近年、(有限次元)分布を比較するための非常に効果的なツールとして人気を集めている。
カーネルベースの方法として設計されているため、MDDはシグネチャカーネルを使用して経路空間の値分布に拡張することができる。
結果として得られるシグネチャMD (sig-MMD) は、経路空間上の分布間の距離を定義するために用いられる。
2サンプルテストフレームワークにおけるテスト統計学としてのMDDの元々のユースケースと同様に、sig-MMDは、2組のパスが同じ確率過程から引き出されるかどうかを決定するために適用することができる。
この研究は、統計的ツールとしてsig-MMDを適用する際の可能性と課題を理解することを目的としている。
我々は,Sig-MMDの導入と解説を行い,その実用化のために容易にアクセス可能で検証可能な実例を提供する。
仮説テストでは, サンプルが同一のプロセス(一般的には限られたデータ設定で発生する)から引き出されたことを誤って示し, タイプ2の誤りにつながる例を示す。
次に,このようなエラーの発生を緩和する手法を提案する。
関連論文リスト
- An Efficient Permutation-Based Kernel Two-Sample Test [13.229867216847534]
2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-02-19T09:22:48Z) - Partial identification of kernel based two sample tests with mismeasured
data [5.076419064097733]
最大平均離散性(MMD)のような2サンプルテストは、機械学習アプリケーションにおける2つの分布の違いを検出するためにしばしば使用される。
我々は,1つの分布の非ランダムな$epsilon$%が互いに誤ってグループ化されるような,$epsilon$-contaminationに基づくMDDの推定について検討した。
そこで本研究では,これらの境界を推定する手法を提案し,サンプルサイズが大きくなるにつれてMDD上の最も鋭い限界に収束する推定値を示す。
論文 参考訳(メタデータ) (2023-08-07T13:21:58Z) - On Calibrating Diffusion Probabilistic Models [78.75538484265292]
拡散確率モデル(DPM)は様々な生成タスクにおいて有望な結果を得た。
そこで本研究では,任意の事前学習DPMを校正する簡単な方法を提案する。
キャリブレーション法は1回だけ行い, 得られたモデルをサンプリングに繰り返し使用することができる。
論文 参考訳(メタデータ) (2023-02-21T14:14:40Z) - A Permutation-free Kernel Two-Sample Test [36.50719125230106]
サンプル分割と学生化に基づく2次時間MDDテスト統計法を提案する。
大きなサンプルサイズの場合、我々の新しいクロスMMDはMDDよりも大幅にスピードアップし、わずかに電力を消費するだけである。
論文 参考訳(メタデータ) (2022-11-27T18:15:52Z) - Maximum Mean Discrepancy on Exponential Windows for Online Change Detection [3.1631981412766335]
MMDEW (Maximum Mean Discrepancy on Exponential Windows) と呼ばれる新しい変更検出アルゴリズムを提案する。
MMDEWは、MDDの利点と指数窓に基づく効率的な計算を組み合わせる。
MMDEWは多対数実行時と対数メモリの複雑さを満足しており、ベンチマークデータストリーム上でのテクニックの状態を実証的に上回ることを示す。
論文 参考訳(メタデータ) (2022-05-25T12:02:59Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Learning to Match Distributions for Domain Adaptation [116.14838935146004]
本稿では,ドメイン間分布マッチングを自動的に学習する学習 to Match (L2M)を提案する。
L2Mは、メタネットワークを用いてデータ駆動方式で分布整合損失を学習することにより、誘導バイアスを低減する。
公開データセットの実験は、SOTA法よりもL2Mの方が優れていることを裏付けている。
論文 参考訳(メタデータ) (2020-07-17T03:26:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。