論文の概要: Subsampling for supervised learning in reproducing kernel Hilbert spaces
- arxiv url: http://arxiv.org/abs/2606.21260v1
- Date: Fri, 19 Jun 2026 09:36:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 07:00:45.651471
- Title: Subsampling for supervised learning in reproducing kernel Hilbert spaces
- Title(参考訳): 再生核ヒルベルト空間における教師あり学習のためのサブサンプリング
- Authors: Eyal Vayness, Maxime Sangnier,
- Abstract要約: サブサンプリングは、推定ステップの計算コストと時間を削減することを目的としている。
この研究は、仮説セットが再生空間にある非パラメトリックな設定に焦点を当てている。
この推定器の特性を研究することにより、最適なサブサンプリング方式を明らかにし、プラグインを介して利用できることを示す。
- 参考スコア(独自算出の注目度): 0.40105987447353786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the era of big data, subsampling became a common practice in statistical learning. By selecting a subgroup of individuals based on which the learner is trained, subsampling aims at reducing the computational cost and time of the estimation step, and ideally leads to a decrease of its energy consumption and carbon footprint. This work focuses on a nonparametric setting, in which the hypotheses set lies in a reproducing kernel Hilbert space, and the estimator is a minimizer of an empirical risk reweighted à la Horvitz-Thompson. By studying the asymptotic properties of this estimator, we reveal an optimal subsampling scheme (regarding the trace of the covariance operator) and show that it can be used via plug-in. A numerical study on synthetic and real-world datasets shows the practicability and the benefit of the proposed approach.
- Abstract(参考訳): ビッグデータの時代、サブサンプリングは統計学習において一般的な実践となった。
学習者が訓練を受けたサブグループを選択することにより、サブサンプリングは、推定ステップの計算コストと時間を削減することを目的としており、理想的には、そのエネルギー消費と炭素フットプリントの減少につながる。
この研究は非パラメトリックな設定に焦点をあて、仮説集合は再生核ヒルベルト空間に置かれ、推定子は経験的リスク再重み付けされたア・ラ・ホルヴィッツ=トンプソンの最小値である。
この推定器の漸近特性を研究することにより、最適部分サンプリングスキーム(共分散作用素のトレースを無視する)を明らかにし、プラグインを介して利用できることを示す。
合成および実世界のデータセットに関する数値的研究は、提案手法の実践性と利点を示している。
関連論文リスト
- Federated Learning on Riemannian Manifolds: A Gradient-Free Projection-Based Approach [5.33725915743382]
フェデレートラーニング(FL)は、分散クライアント間の協調モデルトレーニングのための強力なパラダイムとして登場した。
既存のFLアルゴリズムは主に、厳密な勾配情報を持つ制約のない最適化問題に重点を置いている。
論文 参考訳(メタデータ) (2025-07-30T17:24:27Z) - Prior shift estimation for positive unlabeled data through the lens of kernel embedding [0.3568466510804538]
本研究は, 原産地と異なる可能性のある未ラベル対象標本のクラス推定について検討した。
両集団における後部確率の推定を回避した,クラス前の新しい直接推定手法を提案する。
この提案は、競合他社と同等かそれ以上に一貫して機能することを示す。
論文 参考訳(メタデータ) (2025-02-28T16:12:53Z) - Off-policy estimation with adaptively collected data: the power of online learning [20.023469636707635]
適応的に収集したデータを用いて, 処理効果の線形関数を推定する。
本稿では,オンライン学習を通じて治療効果の一連の推定を生成できる一般還元方式を提案する。
論文 参考訳(メタデータ) (2024-11-19T10:18:27Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A Tale of Sampling and Estimation in Discounted Reinforcement Learning [50.43256303670011]
割引平均推定問題に対して最小値の最小値を求める。
マルコフ過程の割引されたカーネルから直接サンプリングすることで平均を推定すると、説得力のある統計的性質が得られることを示す。
論文 参考訳(メタデータ) (2023-04-11T09:13:17Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。