論文の概要: Oversampling Divide-and-conquer for Response-skewed Kernel Ridge
Regression
- arxiv url: http://arxiv.org/abs/2107.05834v1
- Date: Tue, 13 Jul 2021 04:01:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 14:53:45.081439
- Title: Oversampling Divide-and-conquer for Response-skewed Kernel Ridge
Regression
- Title(参考訳): 応答歪カーネルリッジ回帰のためのオーバーサンプリング除算器
- Authors: Jingyi Zhang and Xiaoxiao Sun
- Abstract要約: 本研究では,分割・分散手法の限界を克服するために,新しい応答適応分割戦略を開発する。
提案手法は, 従来のダックKRR推定値よりも小さい平均二乗誤差(AMSE)を有することを示す。
- 参考スコア(独自算出の注目度): 20.00435452480056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The divide-and-conquer method has been widely used for estimating large-scale
kernel ridge regression estimates. Unfortunately, when the response variable is
highly skewed, the divide-and-conquer kernel ridge regression (dacKRR) may
overlook the underrepresented region and result in unacceptable results. We
develop a novel response-adaptive partition strategy to overcome the
limitation. In particular, we propose to allocate the replicates of some
carefully identified informative observations to multiple nodes (local
processors). The idea is analogous to the popular oversampling technique.
Although such a technique has been widely used for addressing discrete label
skewness, extending it to the dacKRR setting is nontrivial. We provide both
theoretical and practical guidance on how to effectively over-sample the
observations under the dacKRR setting. Furthermore, we show the proposed
estimate has a smaller asymptotic mean squared error (AMSE) than that of the
classical dacKRR estimate under mild conditions. Our theoretical findings are
supported by both simulated and real-data analyses.
- Abstract(参考訳): 分割・対数法は大規模カーネルリッジ回帰推定に広く用いられている。
残念なことに、応答変数が非常に歪んだ場合、分割・分割カーネルリッジ回帰 (dackrr) は、未表示領域を見落とし、受け入れられない結果をもたらす可能性がある。
この制限を克服するために,新しい応答適応分割戦略を開発した。
特に,複数のノード(ローカルプロセッサ)に注意深く識別された情報観測の複製を割り当てる手法を提案する。
そのアイデアは一般的なオーバーサンプリング手法に似ています。
このようなテクニックは、離散ラベルの歪に対処するために広く用いられてきたが、dacKRR設定に拡張することは簡単ではない。
我々は,dacKRR設定下での観測を効果的にオーバーサンプリングする方法に関する理論的および実践的なガイダンスを提供する。
さらに,提案した推定値の漸近平均二乗誤差(AMSE)は,軽度条件下での古典的ダックKRR推定値よりも小さいことを示す。
我々の理論的な知見はシミュレーションと実データ解析の両方で裏付けられている。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Fine-grained analysis of non-parametric estimation for pairwise learning [9.676007573960383]
ペアワイズ学習における非パラメトリック推定の一般化性能について検討する。
我々の結果は、ランキング、AUC、ペアワイズ回帰、メートル法、類似性学習など、幅広いペアワイズ学習問題に対処するために利用できる。
論文 参考訳(メタデータ) (2023-05-31T08:13:14Z) - Kernel Ridge Regression Inference [7.066496204344619]
カーネルリッジ回帰のための均一な推論と信頼バンドを提供する。
我々は、KRRに対して、一般回帰器に対して、ほぼミニマックス速度で縮小するシャープで均一な信頼セットを構築する。
我々は,学校の課題におけるマッチング効果の新たなテストを構築するために,我々の手順を利用する。
論文 参考訳(メタデータ) (2023-02-13T18:26:36Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Scalable Variational Gaussian Processes via Harmonic Kernel
Decomposition [54.07797071198249]
汎用性を維持しつつ高い忠実度近似を提供する,スケーラブルな変分ガウス過程近似を導入する。
様々な回帰問題や分類問題において,本手法は変換やリフレクションなどの入力空間対称性を活用できることを実証する。
提案手法は, 純粋なGPモデルのうち, CIFAR-10 の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-10T18:17:57Z) - Uncertainty quantification for distributed regression [2.28438857884398]
平均推定器の不確かさを定量化する完全データ駆動手法を提案する。
すなわち、所定の決定論的予測セットに基づいて、平均推定器によって得られる予測に対して、同時的要素単位の信頼バンドを構築する。
また,本解析の副産物として,分割・分散型カーネルリッジ回帰に対するsup-norm整合性結果を得る。
論文 参考訳(メタデータ) (2021-05-24T17:33:19Z) - Adversarial Estimation of Riesz Representers [21.510036777607397]
一般関数空間を用いてRiesz表現子を推定する逆フレームワークを提案する。
臨界半径(Critical radius)と呼ばれる抽象的な量で非漸近平均平方レートを証明し、ニューラルネットワーク、ランダムな森林、カーネルヒルベルト空間を主要なケースとして再現する。
論文 参考訳(メタデータ) (2020-12-30T19:46:57Z) - Compressing Large Sample Data for Discriminant Analysis [78.12073412066698]
判別分析フレームワーク内での大きなサンプルサイズに起因する計算問題を考察する。
線形および二次判別分析のためのトレーニングサンプル数を削減するための新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2020-05-08T05:09:08Z) - Imputation for High-Dimensional Linear Regression [8.841513006680886]
LASSOは乱数設定において最小推定率を保持することを示す。
この設定では、共同根源は未成年のままである。
論文 参考訳(メタデータ) (2020-01-24T19:54:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。