論文の概要: Collaborative non-parametric two-sample testing
- arxiv url: http://arxiv.org/abs/2402.05715v1
- Date: Thu, 8 Feb 2024 14:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 14:39:58.752272
- Title: Collaborative non-parametric two-sample testing
- Title(参考訳): 協調的非パラメトリック2サンプル試験
- Authors: Alejandro de la Concha, Nicolas Vayatis, Argyris Kalogeratos
- Abstract要約: 目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
- 参考スコア(独自算出の注目度): 55.98760097296213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the multiple two-sample test problem in a
graph-structured setting, which is a common scenario in fields such as Spatial
Statistics and Neuroscience. Each node $v$ in fixed graph deals with a
two-sample testing problem between two node-specific probability density
functions (pdfs), $p_v$ and $q_v$. The goal is to identify nodes where the null
hypothesis $p_v = q_v$ should be rejected, under the assumption that connected
nodes would yield similar test outcomes. We propose the non-parametric
collaborative two-sample testing (CTST) framework that efficiently leverages
the graph structure and minimizes the assumptions over $p_v$ and $q_v$. Our
methodology integrates elements from f-divergence estimation, Kernel Methods,
and Multitask Learning. We use synthetic experiments and a real sensor network
detecting seismic activity to demonstrate that CTST outperforms
state-of-the-art non-parametric statistical tests that apply at each node
independently, hence disregard the geometry of the problem.
- Abstract(参考訳): 本稿では、空間統計学や神経科学などの分野において一般的なシナリオであるグラフ構造化環境での複数の2サンプルテスト問題に対処する。
固定グラフの各ノード$v$は、2つのノード固有の確率密度関数(pdfs)、$p_v$および$q_v$の間の2サンプルテスト問題を扱う。
目的は、接続ノードが同様のテスト結果をもたらすという仮定の下で、null仮説である$p_v = q_v$を拒否すべきノードを特定することである。
グラフ構造を効率的に活用し,$p_v$と$q_v$の仮定を最小化する,非パラメトリック協調型2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
我々は, 地震活動を検出する実センサネットワークと合成実験を用いて, CTSTが各ノードに独立して適用する非パラメトリック統計試験より優れていることを示す。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Network two-sample test for block models [16.597465729143813]
2組のネットワークが同じモデルに由来するかどうかを判定することを目的とするネットワークの2サンプルテスト問題を考える。
ネットワーク分布にブロックモデル(SBM)を適用するのは,その解釈可能性と,より一般的なモデルに近似する可能性からである。
推定されたネットワークパラメータにマッチする効率的なアルゴリズムを導入し、サンプル内およびサンプル間の情報を適切に組み合わせ、コントラスト化することで、強力なテストを実現する。
論文 参考訳(メタデータ) (2024-06-10T04:28:37Z) - Matching the Statistical Query Lower Bound for k-sparse Parity Problems with Stochastic Gradient Descent [83.85536329832722]
勾配勾配降下(SGD)は,$d$次元ハイパーキューブ上の$k$パリティ問題を効率的に解くことができることを示す。
次に、SGDでトレーニングされたニューラルネットワークがどのようにして、小さな統計的エラーで$k$-parityの問題を解決するかを実証する。
論文 参考訳(メタデータ) (2024-04-18T17:57:53Z) - Kernel-Based Tests for Likelihood-Free Hypothesis Testing [21.143798051525646]
2つのバランスの取れたクラスから$n$の観測が与えられたとき、追加の$m$入力をラベル付けするタスクを考える。
この問題の特別なケースはよく知られており、$m=1$はバイナリ分類に対応し、$mapprox n$は2サンプルテストに相当する。
最近の研究で、$m$と$n$の間に根本的なトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2023-08-17T15:24:03Z) - Collaborative likelihood-ratio estimation over graphs [55.98760097296213]
グラフに基づく相対的制約のない最小二乗重要度フィッティング(GRULSIF)
我々はこの考え方を、グラフベースの相対的非制約最小二乗重要度フィッティング(GRULSIF)と呼ばれる具体的な非パラメトリック手法で開発する。
我々は、ノード当たりの観測回数、グラフのサイズ、およびグラフ構造がタスク間の類似性をどの程度正確にエンコードしているかといった変数が果たす役割を強調する、協調的なアプローチの収束率を導出する。
論文 参考訳(メタデータ) (2022-05-28T15:37:03Z) - A Manifold Two-Sample Test Study: Integral Probability Metric with
Neural Networks [46.62713126719579]
2サンプルテストは、2つの観測コレクションが同じ分布に従うかどうかを判断する重要な領域である。
低次元多様体上に支持された高次元試料に対する積分確率距離(IPM)に基づく2サンプル試験を提案する。
提案手法は,データ次元ではなく本質的な次元に大きく依存するため,低次元の幾何学的構造に適応する。
論文 参考訳(メタデータ) (2022-05-04T13:03:31Z) - Distributed Sparse Feature Selection in Communication-Restricted
Networks [6.9257380648471765]
疎線形回帰と特徴選択のための新しい分散スキームを提案し,理論的に解析する。
データセット全体から因果次元を推定するために,ネットワーク内の情報共有をシンプルかつ効果的に行う手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T05:02:24Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。