論文の概要: Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling
- arxiv url: http://arxiv.org/abs/2209.08004v2
- Date: Tue, 11 Jul 2023 02:46:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 19:17:49.181590
- Title: Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling
- Title(参考訳): 二重確率スケーリングによる多様体密度と幾何学のロバスト推定
- Authors: Boris Landa and Xiuyuan Cheng
- Abstract要約: 我々は高次元雑音下で頑健な推論のためのツールを開発する。
提案手法は, セルタイプにまたがる技術的ノイズレベルの変動に頑健であることを示す。
- 参考スコア(独自算出の注目度): 8.271859911016719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Gaussian kernel and its traditional normalizations (e.g., row-stochastic)
are popular approaches for assessing similarities between data points. Yet,
they can be inaccurate under high-dimensional noise, especially if the noise
magnitude varies considerably across the data, e.g., under heteroskedasticity
or outliers. In this work, we investigate a more robust alternative -- the
doubly stochastic normalization of the Gaussian kernel. We consider a setting
where points are sampled from an unknown density on a low-dimensional manifold
embedded in high-dimensional space and corrupted by possibly strong,
non-identically distributed, sub-Gaussian noise. We establish that the doubly
stochastic affinity matrix and its scaling factors concentrate around certain
population forms, and provide corresponding finite-sample probabilistic error
bounds. We then utilize these results to develop several tools for robust
inference under general high-dimensional noise. First, we derive a robust
density estimator that reliably infers the underlying sampling density and can
substantially outperform the standard kernel density estimator under
heteroskedasticity and outliers. Second, we obtain estimators for the pointwise
noise magnitudes, the pointwise signal magnitudes, and the pairwise Euclidean
distances between clean data points. Lastly, we derive robust graph Laplacian
normalizations that accurately approximate various manifold Laplacians,
including the Laplace Beltrami operator, improving over traditional
normalizations in noisy settings. We exemplify our results in simulations and
on real single-cell RNA-sequencing data. For the latter, we show that in
contrast to traditional methods, our approach is robust to variability in
technical noise levels across cell types.
- Abstract(参考訳): ガウス核とその伝統的な正規化(例えば行確率)は、データポイント間の類似性を評価するための一般的なアプローチである。
しかし、高次元雑音下では不正確であり、特にヘテロスケダスティック性や外れ値の下では、データ間でノイズの等級がかなり異なる場合である。
本研究では,ガウス核の2倍確率正規化という,より堅牢な方法を検討する。
高次元空間に埋もれた低次元多様体上の未知の密度から点をサンプリングし、おそらく強く、非同定的に分布する部分ガウス雑音によって崩壊する設定を考える。
二重確率的親和性行列とそのスケーリング因子は、ある集団形式の周りに集中し、対応する有限個の確率的誤差境界を与える。
これらの結果を用いて,高次元雑音下でのロバスト推論のためのツールを開発した。
まず,基礎となるサンプリング密度を確実に推定するロバストな密度推定器を導出し,標準核密度推定器をヘテロスケキスティック性および異常値下で実質的に上回ることができる。
第2に, クリーンデータ点間における点音の大きさ, 点音信号の大きさ, 対方向ユークリッド距離に対する推定値を求める。
最後に、Laplace Beltrami演算子を含む様々な多様体ラプラシアンを正確に近似するロバストグラフラプラシアン正規化を導出し、ノイズのある設定で従来の正規化よりも改善する。
シミュレーションや実単細胞rnaシークエンシングデータでの結果を例示する。
後者の場合、従来の手法とは対照的に、我々のアプローチはセルタイプ間での技術的ノイズレベルの変化に対して堅牢であることを示す。
関連論文リスト
- A quasi-Bayesian sequential approach to deconvolution density estimation [7.10052009802944]
密度デコンボリューションは、データからランダム信号の未知の密度関数$f$を推定する。
我々は、ノイズの多いデータが徐々に到着するストリーミングやオンライン環境での密度デコンボリューションの問題を考察する。
準ベイズ的シーケンシャルアプローチを頼りにすると、容易に評価できる$f$の推定値が得られる。
論文 参考訳(メタデータ) (2024-08-26T16:40:04Z) - A Bayesian Approach Toward Robust Multidimensional Ellipsoid-Specific Fitting [0.0]
本研究は, ノイズおよび外周波の汚染における散乱データに多次元楕円体を適合させる, 新規で効果的な方法を提案する。
楕円体領域内でのプリミティブパラメータの探索を制約するために、均一な事前分布を組み込む。
本研究では, 顕微鏡細胞計数, 3次元再構成, 幾何学的形状近似, 磁力計の校正タスクなど, 幅広い応用に応用する。
論文 参考訳(メタデータ) (2024-07-27T14:31:51Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - Sobolev Space Regularised Pre Density Models [51.558848491038916]
本研究では,ソボレフ法則の正則化に基づく非パラメトリック密度推定法を提案する。
この方法は統計的に一貫したものであり、帰納的検証モデルを明確かつ一貫したものにしている。
論文 参考訳(メタデータ) (2023-07-25T18:47:53Z) - Anomaly Detection with Variance Stabilized Density Estimation [49.46356430493534]
本稿では, 観測試料の確率を最大化するための分散安定化密度推定問題を提案する。
信頼性の高い異常検知器を得るために,分散安定化分布を学習するための自己回帰モデルのスペクトルアンサンブルを導入する。
我々は52のデータセットで広範なベンチマークを行い、我々の手法が最先端の結果につながることを示した。
論文 参考訳(メタデータ) (2023-06-01T11:52:58Z) - Optimizing the Noise in Self-Supervised Learning: from Importance
Sampling to Noise-Contrastive Estimation [80.07065346699005]
GAN(Generative Adversarial Networks)のように、最適な雑音分布はデータ分布に等しくなると広く想定されている。
我々は、この自己教師型タスクをエネルギーベースモデルの推定問題として基礎づけるノイズ・コントラスト推定に目を向ける。
本研究は, 最適雑音のサンプリングは困難であり, 効率性の向上は, データに匹敵する雑音分布を選択することに比べ, 緩やかに行うことができると結論付けた。
論文 参考訳(メタデータ) (2023-01-23T19:57:58Z) - The Optimal Noise in Noise-Contrastive Learning Is Not What You Think [80.07065346699005]
この仮定から逸脱すると、実際により良い統計的推定結果が得られることが示される。
特に、最適な雑音分布は、データと異なり、また、別の家族からさえも異なる。
論文 参考訳(メタデータ) (2022-03-02T13:59:20Z) - Heavy-tailed denoising score matching [5.371337604556311]
ランゲヴィン力学における複数のノイズレベルを連続的に初期化する反復的雑音スケーリングアルゴリズムを開発した。
実用面では、重み付きDSMを用いることで、スコア推定、制御可能なサンプリング収束、不均衡データセットに対するよりバランスのない非条件生成性能が改善される。
論文 参考訳(メタデータ) (2021-12-17T22:04:55Z) - Consistency Regularization for Certified Robustness of Smoothed
Classifiers [89.72878906950208]
最近のランダムな平滑化技術は、最悪の$ell$-robustnessを平均ケースのロバストネスに変換することができることを示している。
その結果,スムーズな分類器の精度と信頼性の高いロバスト性とのトレードオフは,ノイズに対する予測一貫性の規則化によって大きく制御できることが判明した。
論文 参考訳(メタデータ) (2020-06-07T06:57:43Z) - Doubly-Stochastic Normalization of the Gaussian Kernel is Robust to
Heteroskedastic Noise [3.5429774642987915]
ガウス核の主対角がゼロの二重確率正規化はヘテロスケダティックノイズに対して頑健であることを示す。
本報告では,本態性ヘテロスケダスティック性を有する単一細胞RNA配列のシミュレートおよび実験例を示す。
論文 参考訳(メタデータ) (2020-05-31T01:31:10Z) - Nearest Neighbor Dirichlet Mixtures [3.3194866396158]
計算上の欠点を伴わずにベイズ的アプローチの強みのほとんどを維持するために、近傍のディリクレ混合のクラスを提案する。
単純で恥ずかしい並列なモンテカルロアルゴリズムが提案され、結果の擬似ポストから未知の密度をサンプリングする。
論文 参考訳(メタデータ) (2020-03-17T21:39:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。