論文の概要: A Fast and Effective Large-Scale Two-Sample Test Based on Kernels
- arxiv url: http://arxiv.org/abs/2110.03118v1
- Date: Thu, 7 Oct 2021 00:16:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 15:32:09.856670
- Title: A Fast and Effective Large-Scale Two-Sample Test Based on Kernels
- Title(参考訳): カーネルに基づく高速かつ効果的な大規模2サンプルテスト
- Authors: Hoseung Song and Hao Chen
- Abstract要約: 我々は,幅広い代替案に対して高い出力を示す新しい試験を提案する。
新しいテストは既存の方法よりも高次元に対して堅牢である。
新しいアプローチは、合成データと実世界のデータの両方でうまく機能する。
- 参考スコア(独自算出の注目度): 7.144716223629183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kernel two-sample tests have been widely used and the development of
efficient methods for high-dimensional large-scale data is gaining more and
more attention as we are entering the big data era. However, existing methods,
such as the maximum mean discrepancy (MMD) and recently proposed kernel-based
tests for large-scale data, are computationally intensive to implement and/or
ineffective for some common alternatives for high-dimensional data. In this
paper, we propose a new test that exhibits high power for a wide range of
alternatives. Moreover, the new test is more robust to high dimensions than
existing methods and does not require optimization procedures for the choice of
kernel bandwidth and other parameters by data splitting. Numerical studies show
that the new approach performs well in both synthetic and real world data.
- Abstract(参考訳): カーネル2サンプルテストは広く使われており、ビッグデータ時代に入るにつれて、高次元大規模データの効率的な手法の開発がますます注目されている。
しかし、近年提案された大規模データに対する最大平均差分法(MMD)やカーネルベースのテストのような既存の手法は、高次元データに対する一般的な代替案の実装や非効率化に重きを置いている。
本稿では,多種多様な代替品の高出力化を図った新しい試験法を提案する。
さらに、新しいテストは既存の方法よりも高次元に頑健であり、データ分割によるカーネル帯域幅や他のパラメータの選択の最適化手順を必要としない。
数値研究により、この新しいアプローチは合成データと実世界データの両方でうまく機能することが示された。
関連論文リスト
- AcceleratedLiNGAM: Learning Causal DAGs at the speed of GPUs [57.12929098407975]
既存の因果探索法を効率的に並列化することにより,数千次元まで拡張可能であることを示す。
具体的には、DirectLiNGAMの因果順序付けサブプロデューサに着目し、GPUカーネルを実装して高速化する。
これにより、遺伝子介入による大規模遺伝子発現データに対する因果推論にDirectLiNGAMを適用することで、競争結果が得られる。
論文 参考訳(メタデータ) (2024-03-06T15:06:11Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - MMD-FUSE: Learning and Combining Kernels for Two-Sample Testing Without
Data Splitting [28.59390881834003]
最大平均離散性(MMD)に基づく2サンプルテストのパワーを最大化する新しい統計法を提案する。
これらのカーネルは、データ分割を避けるために、よく校正されたテストで、データ依存だが置換に依存しない方法でどのように選択できるかを示す。
我々は,合成低次元および実世界の高次元データに対するMDD-FUSEテストの適用性を強調し,その性能を現状のカーネルテストと比較した。
論文 参考訳(メタデータ) (2023-06-14T23:13:03Z) - FaDIn: Fast Discretized Inference for Hawkes Processes with General
Parametric Kernels [82.53569355337586]
この研究は、有限なサポートを持つ一般パラメトリックカーネルを用いた時間点プロセス推論の効率的な解を提供する。
脳磁図(MEG)により記録された脳信号からの刺激誘発パターンの発生をモデル化し,その有効性を評価する。
その結果,提案手法により,最先端技術よりもパターン遅延の推定精度が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-10T12:35:02Z) - Asymmetric Scalable Cross-modal Hashing [51.309905690367835]
クロスモーダルハッシュは、大規模なマルチメディア検索問題を解決する方法として成功している。
これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
我々のASCMHは、最先端のクロスモーダルハッシュ法よりも精度と効率の点で優れています。
論文 参考訳(メタデータ) (2022-07-26T04:38:47Z) - Smooth densities and generative modeling with unsupervised random
forests [1.433758865948252]
密度推定器の重要な応用は合成データ生成である。
パラメータ制約を伴わない任意の次元における滑らかな密度を推定するための,教師なしランダム森林に基づく新しい手法を提案する。
提案手法の整合性を証明し,既存の木質密度推定器に対する利点を実証する。
論文 参考訳(メタデータ) (2022-05-19T09:50:25Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - High Performance Out-of-sample Embedding Techniques for Multidimensional
Scaling [0.5156484100374058]
我々は,大規模なデータに対するMDSアルゴリズムを拡張するために,サンプル外埋め込み(OSE)ソリューションを提案する。
我々は2つのOSE技術を提案する。1つは最適化アプローチに基づくもので、もう1つはニューラルネットワークモデルに基づくものである。
論文 参考訳(メタデータ) (2021-11-07T12:36:33Z) - Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。
私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文 参考訳(メタデータ) (2020-02-21T03:54:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。