Fugu-MT 論文翻訳(概要): Variable Selection for Kernel Two-Sample Tests

論文の概要: Variable Selection for Kernel Two-Sample Tests

arxiv url: http://arxiv.org/abs/2302.07415v4
Date: Fri, 20 Dec 2024 01:03:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 22:59:32.719921
Title: Variable Selection for Kernel Two-Sample Tests
Title（参考訳）: カーネル2サンプルテストの可変選択
Authors: Jie Wang, Santanu S. Dey, Yao Xie,
Abstract要約: 2サンプルテストの変数選択問題を考察する。カーネルの最大平均誤差(MMD)に基づく新しいフレームワークを提案する。提案手法は,分散正規化カーネルMDD統計量の最大化を図った,所定のサイズを持つ変数のサブセットを求める。
参考スコア（独自算出の注目度）: 9.581064100940381
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the variable selection problem for two-sample tests, aiming to select the most informative variables to determine whether two collections of samples follow the same distribution. To address this, we propose a novel framework based on the kernel maximum mean discrepancy (MMD). Our approach seeks a subset of variables with a pre-specified size that maximizes the variance-regularized kernel MMD statistic. We focus on three commonly used types of kernels: linear, quadratic, and Gaussian. From a computational perspective, we derive mixed-integer programming formulations and propose exact and approximation algorithms with performance guarantees to solve these formulations. From a statistical viewpoint, we derive the rate of testing power of our framework under appropriate conditions. These results show that the sample size requirements for the three kernels depend crucially on the number of selected variables, rather than the data dimension. Experimental results on synthetic and real datasets demonstrate the superior performance of our method, compared to other variable selection frameworks, particularly in high-dimensional settings.
Abstract（参考訳）: 2サンプルテストにおける変数選択問題を考察し,2つのサンプルのコレクションが同じ分布をたどるかどうかを決定するために,最も情報に富む変数を選択することを目的とする。そこで本研究では,カーネルの最大平均誤差(MMD)に基づく新しいフレームワークを提案する。提案手法は,分散正規化カーネルMDD統計量の最大化を図った,所定のサイズを持つ変数のサブセットを求める。我々は、線形、二次、ガウスの3つのよく使われるカーネルに焦点をあてる。計算的観点から、混合整数プログラミングの定式化を導出し、これらの定式化を解決するための性能保証付き正確かつ近似的なアルゴリズムを提案する。統計的観点から、適切な条件下でのフレームワークのテスト能力の速さを導出する。これらの結果は、3つのカーネルのサンプルサイズ要件がデータ次元ではなく、選択した変数の数に大きく依存していることを示している。合成および実データを用いた実験の結果,特に高次元設定において,他の変数選択フレームワークと比較して,提案手法の優れた性能を示した。

関連論文リスト

Minimax Optimal Kernel Two-Sample Tests with Random Features [8.030917052755195]
ランダムフーリエ特徴量(RFF)近似に基づくスペクトル正規化2サンプル試験を提案する。 RFFの近似順序が十分に大きい場合、提案した試験が最小限最適であることを示す。そこで本研究では,正規化パラメータとカーネルを選択するためのデータ適応型戦略を用いて,提案したテストの実用的実装可能な置換型バージョンを開発する。
論文参考訳（メタデータ） (2025-02-28T06:12:00Z)
A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.622435665395788]
本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。 2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文参考訳（メタデータ） (2024-07-23T15:04:38Z)
Optimal Kernel Choice for Score Function-based Causal Discovery [92.65034439889872]
本稿では,データに最も適合する最適なカーネルを自動的に選択する,一般化スコア関数内のカーネル選択手法を提案する。合成データと実世界のベンチマークの両方で実験を行い,提案手法がカーネル選択法より優れていることを示す。
論文参考訳（メタデータ） (2024-07-14T09:32:20Z)
Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文参考訳（メタデータ） (2023-12-19T13:17:43Z)
Variable Selection in Maximum Mean Discrepancy for Interpretable Distribution Comparison [9.12501922682336]
2サンプルテストは、同じ分布から2つのデータセットが生成されるかどうかを決定する。本稿では,2サンプルテストにおける変数選択について検討し,2つの分布の相違の原因となる変数を同定する。
論文参考訳（メタデータ） (2023-11-02T18:38:39Z)
DF2: Distribution-Free Decision-Focused Learning [53.2476224456902]
決定中心学習(DFL)は近年,予測最適化問題に対する強力なアプローチとして出現している。既存のエンドツーエンドDFL法は、モデル誤差、サンプル平均近似誤差、予測対象の分布に基づくパラメータ化の3つの重大なボトルネックによって妨げられている。 DF2は,これら3つのボトルネックに明示的に対処するために設計された,初となるテキストフリーな意思決定型学習手法である。
論文参考訳（メタデータ） (2023-08-11T00:44:46Z)
MMD-FUSE: Learning and Combining Kernels for Two-Sample Testing Without Data Splitting [28.59390881834003]
最大平均離散性(MMD)に基づく2サンプルテストのパワーを最大化する新しい統計法を提案する。これらのカーネルは、データ分割を避けるために、よく校正されたテストで、データ依存だが置換に依存しない方法でどのように選択できるかを示す。我々は,合成低次元および実世界の高次元データに対するMDD-FUSEテストの適用性を強調し,その性能を現状のカーネルテストと比較した。
論文参考訳（メタデータ） (2023-06-14T23:13:03Z)
Boosting the Power of Kernel Two-Sample Tests [4.07125466598411]
最大平均誤差(MMD)に基づくカーネル2サンプルテストは、一般的な距離空間上の2つの分布の違いを検出する最も一般的な方法の1つである。マハラノビス距離を用いて,複数のカーネル上でMDD推定値を組み合わせることで,カーネルテストのパワーを高める手法を提案する。
論文参考訳（メタデータ） (2023-02-21T14:14:30Z)
Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both Worlds in Stochastic and Deterministic Environments [48.96971760679639]
マルコフ決定過程(MDP)の分散依存的後悔境界について検討する。環境の微細な分散特性を特徴付けるための2つの新しい環境規範を提案する。モデルに基づく手法では、MVPアルゴリズムの変種を設計する。特に、この境界は極小かつ決定論的 MDP に対して同時に最適である。
論文参考訳（メタデータ） (2023-01-31T06:54:06Z)
Spectral Regularized Kernel Two-Sample Tests [7.915420897195129]
MMD (maximum mean discrepancy) two-sample test to be optimal to the terms of the separation boundary in the Hellinger distance。スペクトル正則化に基づくMDD試験の修正を提案し,MMD試験よりも分離境界が小さく,最小限の試験が最適であることを証明した。その結果,テストしきい値がエレガントに選択されるテストの置換変種が,サンプルの置換によって決定されることがわかった。
論文参考訳（メタデータ） (2022-12-19T00:42:21Z)
Variational Autoencoder Kernel Interpretation and Selection for Classification [59.30734371401315]
本研究では,変分オートエンコーダの畳み込みエンコーダによって生成された特徴に基づく確率的分類器のカーネル選択手法を提案する。提案した実装では、各カーネルに対して各分散が生成されるため、各潜伏変数を最終エンコーダの畳み込み層の単一カーネルに関連付けられた分布からサンプリングした。サンプル化された潜伏変数で関連する機能を選択することで、カーネルの選択を実行し、非形式的機能とカーネルをフィルタリングすることができる。
論文参考訳（メタデータ） (2022-09-10T17:22:53Z)
A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文参考訳（メタデータ） (2022-02-08T19:18:49Z)
Learning MDPs from Features: Predict-Then-Optimize for Sequential Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。 2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文参考訳（メタデータ） (2021-06-06T23:53:31Z)
Greedy Search Algorithms for Unsupervised Variable Selection: A Comparative Study [3.4888132404740797]
本稿では,非監視変数選択に基づく次元還元について述べる。本稿では,7つの非監視勾配変数選択アルゴリズムの臨界評価について述べる。本稿では,FSCA(Forward selection component analysis)アルゴリズムで説明された分散の遅延実装を初めて導入し,評価する。
論文参考訳（メタデータ） (2021-03-03T21:10:26Z)
Learning Deep Kernels for Non-Parametric Two-Sample Tests [50.92621794426821]
2組のサンプルが同じ分布から引き出されるかどうかを判定するカーネルベースの2サンプルテストのクラスを提案する。私たちのテストは、テストパワーを最大化するためにトレーニングされたディープニューラルネットワークによってパラメータ化されたカーネルから構築されます。
論文参考訳（メタデータ） (2020-02-21T03:54:23Z)
Distributed Averaging Methods for Randomized Second Order Optimization [54.51566432934556]
我々はヘッセン語の形成が計算的に困難であり、通信がボトルネックとなる分散最適化問題を考察する。我々は、ヘッセンのサンプリングとスケッチを用いたランダム化二階最適化のための非バイアスパラメータ平均化手法を開発した。また、不均一なコンピューティングシステムのための非バイアス分散最適化フレームワークを導入するために、二階平均化手法のフレームワークを拡張した。
論文参考訳（メタデータ） (2020-02-16T09:01:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。