論文の概要: Kernel Interpolation of High Dimensional Scattered Data
- arxiv url: http://arxiv.org/abs/2009.01514v2
- Date: Mon, 27 Sep 2021 07:51:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 08:00:18.168919
- Title: Kernel Interpolation of High Dimensional Scattered Data
- Title(参考訳): 高次元散乱データのカーネル補間
- Authors: Shao-Bo Lin, Xiangyu Chang, Xingping Sun
- Abstract要約: 高次元問題から選択されたデータサイトは、非父性的な方法で散在することが多い。
本稿では,基礎となるカーネル行列のスペクトルによる有界近似誤差を特徴とする,高次元データのカーネルを解析するための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 22.857190042428922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data sites selected from modeling high-dimensional problems often appear
scattered in non-paternalistic ways. Except for sporadic clustering at some
spots, they become relatively far apart as the dimension of the ambient space
grows. These features defy any theoretical treatment that requires local or
global quasi-uniformity of distribution of data sites. Incorporating a
recently-developed application of integral operator theory in machine learning,
we propose and study in the current article a new framework to analyze kernel
interpolation of high dimensional data, which features bounding stochastic
approximation error by the spectrum of the underlying kernel matrix. Both
theoretical analysis and numerical simulations show that spectra of kernel
matrices are reliable and stable barometers for gauging the performance of
kernel-interpolation methods for high dimensional data.
- Abstract(参考訳): 高次元問題から選択されたデータサイトは、非父性的な方法で散在することが多い。
散発的クラスタリングを除いては、周囲空間の次元が大きくなるにつれて比較的遠く離れている。
これらの特徴は、データサイトの分布の局所的あるいは大域的準均一性を必要とする理論的な処理に反する。
本稿では,最近開発された積分作用素理論を機械学習に適用し,その基礎となるカーネル行列のスペクトルによる確率近似誤差を特徴とする高次元データのカーネル補間を解析するための新しいフレームワークを提案する。
理論解析と数値シミュレーションの両方により、カーネル行列のスペクトルは信頼性が高く、高次元データに対するカーネル補間法の性能を測定するための安定なバロメーターであることが示されている。
関連論文リスト
- Diffusion-based Semi-supervised Spectral Algorithm for Regression on Manifolds [2.0649432688817444]
本研究では,高次元データの回帰解析に挑戦する拡散スペクトルアルゴリズムを提案する。
本手法では,熱カーネルの局所的推定特性を用いて,この障害を克服するための適応型データ駆動型アプローチを提案する。
我々のアルゴリズムは完全にデータ駆動方式で動作し、データ固有の多様体構造内で直接動作する。
論文 参考訳(メタデータ) (2024-10-18T15:29:04Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Weighted Spectral Filters for Kernel Interpolation on Spheres: Estimates
of Prediction Accuracy for Noisy Data [21.67168506689593]
我々は、カーネル行列の条件数を減らし、カーネルを安定化するための重み付きスペクトルフィルタ手法を提案する。
球面データ解析のために最近開発された積分作用素アプローチを用いて,提案した重み付きスペクトルフィルタアプローチがカーネルのボトルネックを突破することに成功したことを理論的に証明した。
提案手法は,予測精度を損なわないことを示すため,新しい手法の最適近似速度を提供する。
論文 参考訳(メタデータ) (2024-01-16T13:46:10Z) - Weighted Riesz Particles [0.0]
対象分布を、パラメータの無限次元空間が多くの決定論的部分多様体からなる写像と考える。
我々は、Rieszと呼ばれる点の性質を研究し、それをシーケンシャルMCMCに埋め込む。
低い評価で高い受け入れ率が得られることが分かりました。
論文 参考訳(メタデータ) (2023-12-01T14:36:46Z) - Manifold Learning with Sparse Regularised Optimal Transport [0.17205106391379024]
実世界のデータセットはノイズの多い観測とサンプリングを受けており、基礎となる多様体に関する情報を蒸留することが大きな課題である。
本稿では,2次正規化を用いた最適輸送の対称版を利用する多様体学習法を提案する。
得られたカーネルは連続的な極限においてLaplace型演算子と整合性を証明し、ヘテロスケダスティックノイズに対する堅牢性を確立し、これらの結果をシミュレーションで示す。
論文 参考訳(メタデータ) (2023-07-19T08:05:46Z) - Higher-order topological kernels via quantum computation [68.8204255655161]
トポロジカルデータ分析(TDA)は、複雑なデータから意味のある洞察を抽出する強力なツールとして登場した。
本稿では,ベッチ曲線の次数増加に基づくBettiカーネルの量子的定義法を提案する。
論文 参考訳(メタデータ) (2023-07-14T14:48:52Z) - Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z) - Tensor Laplacian Regularized Low-Rank Representation for Non-uniformly
Distributed Data Subspace Clustering [2.578242050187029]
低ランク表現(LRR)は、サブスペースクラスタリングにおけるデータポイントの局所性情報を破棄する。
本稿では,隣接ノードの変動数を容易にし,データの局所性情報を組み込むハイパーグラフモデルを提案する。
人工および実データを用いた実験により,提案手法の精度と精度が向上した。
論文 参考訳(メタデータ) (2021-03-06T08:22:24Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。