論文の概要: FKreg: A MATLAB toolbox for fast Multivariate Kernel Regression
- arxiv url: http://arxiv.org/abs/2204.07716v1
- Date: Sat, 16 Apr 2022 04:52:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-19 17:05:06.501987
- Title: FKreg: A MATLAB toolbox for fast Multivariate Kernel Regression
- Title(参考訳): FKreg: 高速多変量カーネル回帰のためのMATLABツールボックス
- Authors: Ying Wang, Min Li, Deirel Paz-Linares, Maria L. Bringas Vega, Pedro A.
Vald\'es-Sosa
- Abstract要約: 非一様FFT(NUFFT)を用いた高速多変量カーネル回帰のための新しいツールボックスを提案する。
NUFFTは$Oleft(N+Mlog M right)$複雑さと精度制御性を備えた$M$グリッドポイントのアルゴリズムを実装している。
帯域幅選択問題は、Fast Monte-Carloを用いて自由度を推定する。
- 参考スコア(独自算出の注目度): 5.090316990822874
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Kernel smooth is the most fundamental technique for data density and
regression estimation. However, time-consuming is the biggest obstacle for the
application that the direct evaluation of kernel smooth for $N$ samples needs
${O}\left( {{N}^{2}} \right)$ operations. People have developed fast smooth
algorithms using the idea of binning with FFT. Unfortunately, the accuracy is
not controllable, and the implementation for multivariable and its bandwidth
selection for the fast method is not available. Hence, we introduce a new
MATLAB toolbox for fast multivariate kernel regression with the idea of
non-uniform FFT (NUFFT), which implemented the algorithm for $M$ gridding
points with ${O}\left( N+M\log M \right)$ complexity and accuracy
controllability. The bandwidth selection problem utilizes the Fast Monte-Carlo
algorithm to estimate the degree of freedom (DF), saving enormous
cross-validation time even better when data share the same grid space for
multiple regression. Up to now, this is the first toolbox for fast-binning
high-dimensional kernel regression. Moreover, the estimation for local
polynomial regression, the conditional variance for the heteroscedastic model,
and the complex-valued datasets are also implemented in this toolbox. The
performance is demonstrated with simulations and an application on the
quantitive EEG.
- Abstract(参考訳): カーネルスムーズはデータ密度と回帰推定の最も基本的な手法である。
しかし、n$のサンプルに対してカーネルを直接スムースに評価するには${o}\left( {{n}^{2}} \right)$演算が必要である。
fftによるバイナリ化というアイデアを駆使して,高速スムースアルゴリズムを開発した。
残念ながら、精度は制御不可能であり、マルチ変数の実装と高速メソッドの帯域幅選択は利用できない。
したがって、高速多変量カーネルレグレッションのための新しいMATLABツールボックス(NUFFT)を導入し、${O}\left(N+M\log M \right)$複雑性と精度制御性を備えた$M$グリッドポイントのアルゴリズムを実装した。
帯域幅選択問題は、Fast Monte-Carloアルゴリズムを用いて自由度(DF)を推定し、データが複数の回帰のために同じグリッド空間を共有する場合、膨大なクロスバリデーション時間を節約する。
これまでのところ、これは高次元カーネル回帰を高速にバイナリ化するための最初のツールボックスである。
さらに, このツールボックスでは, 局所多項式回帰の推定, ヘテロシドスティックモデルの条件分散, 複素値データセットも実装されている。
その性能はシミュレーションと定量脳波の応用によって実証される。
関連論文リスト
- Suboptimality bounds for trace-bounded SDPs enable a faster and scalable low-rank SDP solver SDPLR+ [3.7507283158673212]
半定プログラム(SDP)は、機械学習とデータサイエンスに多くの応用がある強力なツールである。
SDPソルバは、正の半定値決定変数がn×n$密度行列であるため、困難である。
20年前、Burer氏とMonteiro氏は、完全な行列の代わりに低ランクの分解を最適化したSDPソルバを開発した。
論文 参考訳(メタデータ) (2024-06-14T20:31:22Z) - The fast committor machine: Interpretable prediction with kernels [0.0]
本稿では,高速コミッタマシン(FCM)と呼ばれる,コミッタの効率的な近似アルゴリズムを提案する。
カーネル関数は、$A$から$B$遷移を最適に記述する低次元部分空間を強調するように構成される。
FCMは精度が高く、同じ数のパラメータを持つニューラルネットワークよりも速くトレーニングする。
論文 参考訳(メタデータ) (2024-05-16T19:22:49Z) - A Specialized Semismooth Newton Method for Kernel-Based Optimal
Transport [92.96250725599958]
カーネルベース最適輸送(OT)推定器は、サンプルからOT問題に対処するための代替的機能的推定手順を提供する。
SSN法は, 標準正規性条件下でのグローバル収束率$O (1/sqrtk)$, 局所二次収束率を達成できることを示す。
論文 参考訳(メタデータ) (2023-10-21T18:48:45Z) - Globally Convergent Accelerated Algorithms for Multilinear Sparse
Logistic Regression with $\ell_0$-constraints [2.323238724742687]
多重線形ロジスティック回帰は多次元データ解析の強力なツールである。
本稿では,$ell_0$-MLSRを解くために,アクセラレーションされた近位置換最小値MLSRモデルを提案する。
また、APALM$+$が一階臨界点に大域収束し、クルディ・ロジャシエヴィチ性質を用いて収束を確立することも示している。
論文 参考訳(メタデータ) (2023-09-17T11:05:08Z) - Simulation-free Schr\"odinger bridges via score and flow matching [89.4231207928885]
シミュレーションフリースコアとフローマッチング([SF]$2$M)を提案する。
本手法は,拡散モデルのトレーニングに使用するスコアマッチング損失と,連続流のトレーニングに使用されるフローマッチング損失の両方を一般化する。
特に、[SF]$2$Mは、高次元の細胞動態を正確にモデル化し、既知の遺伝子制御ネットワークをシミュレートする最初の方法である。
論文 参考訳(メタデータ) (2023-07-07T15:42:35Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - Efficient and robust high-dimensional sparse logistic regression via
nonlinear primal-dual hybrid gradient algorithms [0.0]
弾性ネットペナルティによって正規化されるロジスティック回帰問題に対する解を確実に計算する反復アルゴリズムを提案する。
この結果は、一階最適化法に対して$O(min(m2n,mn2)log (1/epsilon))$の既知の複雑性境界を改善する。
論文 参考訳(メタデータ) (2021-11-30T14:16:48Z) - Asynchronous Stochastic Optimization Robust to Arbitrary Delays [54.61797739710608]
遅延勾配の最適化を考えると、ステップt$毎に、アルゴリズムは古い計算を使って更新する - d_t$ for arbitrary delay $d_t gradient。
本実験は,遅延分布が歪んだり重くなったりした場合のアルゴリズムの有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2021-06-22T15:50:45Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Fractional ridge regression: a fast, interpretable reparameterization of
ridge regression [0.0]
リッジ回帰(RR)は、線形回帰における係数のL2-ノルムをペナライズする正規化手法である。
我々は、FRRを解くアルゴリズムと、Pythonのオープンソースソフトウェア実装を提供する。
論文 参考訳(メタデータ) (2020-05-07T03:12:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。