論文の概要: Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling
- arxiv url: http://arxiv.org/abs/2209.08004v1
- Date: Fri, 16 Sep 2022 15:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 12:14:31.158479
- Title: Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling
- Title(参考訳): 二重確率スケーリングによる多様体密度と幾何学のロバスト推定
- Authors: Boris Landa and Xiuyuan Cheng
- Abstract要約: 我々は高次元雑音下で頑健な推論のためのツールを開発する。
提案する正規化は,異なる細胞タイプに関連する技術的変動に対して堅牢であることを示す。
- 参考スコア(独自算出の注目度): 8.271859911016719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Gaussian kernel and its traditional normalizations (e.g., row-stochastic)
are popular approaches for assessing similarities between data points, commonly
used for manifold learning and clustering, as well as supervised and
semi-supervised learning on graphs. In many practical situations, the data can
be corrupted by noise that prohibits traditional affinity matrices from
correctly assessing similarities, especially if the noise magnitudes vary
considerably across the data, e.g., under heteroskedasticity or outliers. An
alternative approach that provides a more stable behavior under noise is the
doubly stochastic normalization of the Gaussian kernel. In this work, we
investigate this normalization in a setting where points are sampled from an
unknown density on a low-dimensional manifold embedded in high-dimensional
space and corrupted by possibly strong, non-identically distributed,
sub-Gaussian noise. We establish the pointwise concentration of the doubly
stochastic affinity matrix and its scaling factors around certain population
forms. We then utilize these results to develop several tools for robust
inference. First, we derive a robust density estimator that can substantially
outperform the standard kernel density estimator under high-dimensional noise.
Second, we provide estimators for the pointwise noise magnitudes, the pointwise
signal magnitudes, and the pairwise Euclidean distances between clean data
points. Lastly, we derive robust graph Laplacian normalizations that
approximate popular manifold Laplacians, including the Laplace Beltrami
operator, showing that the local geometry of the manifold can be recovered
under high-dimensional noise. We exemplify our results in simulations and on
real single-cell RNA-sequencing data. In the latter, we show that our proposed
normalizations are robust to technical variability associated with different
cell types.
- Abstract(参考訳): ガウス核とその伝統的な正規化(例えば行確率)は、グラフ上の教師付きおよび半教師付き学習と同様に、多様体学習とクラスタリングに一般的に使用されるデータポイント間の類似性を評価するための一般的なアプローチである。
多くの現実的な状況において、従来の親和性行列が類似性を正しく評価することを禁じるノイズによってデータを破損させることができる。
ノイズの下でより安定な振る舞いを提供する別のアプローチは、ガウス核の二重確率正規化である。
本研究では, 高次元空間に埋もれた低次元多様体上の未知の密度から点をサンプリングし, 潜在的に強く, 非同定的に分布する部分ガウス雑音により破れてしまうような条件下で, この正規化について検討する。
二重確率的親和性行列のポイントワイズ濃度とその特定の集団形態のスケーリング係数を定式化する。
次に、これらの結果を利用して、堅牢な推論のためのツールを開発します。
まず,高次元雑音下での標準核密度推定器を実質的に上回るロバスト密度推定器を導出する。
第2に、クリーンなデータポイント間の点方向の雑音等級、点方向の信号等級、対方向のユークリッド距離を推定する。
最後に、ラプラスベルトラミ作用素を含む一般的な多様体ラプラシアンを近似するロバストグラフラプラシアン正規化を導出し、高次元雑音下では多様体の局所幾何を復元できることを示した。
シミュレーションや実単細胞rnaシークエンシングデータでの結果を例示する。
後者では,提案する正規化は異なる細胞タイプに関連する技術的変動に頑健であることを示す。
関連論文リスト
- A quasi-Bayesian sequential approach to deconvolution density estimation [7.10052009802944]
密度デコンボリューションは、データからランダム信号の未知の密度関数$f$を推定する。
我々は、ノイズの多いデータが徐々に到着するストリーミングやオンライン環境での密度デコンボリューションの問題を考察する。
準ベイズ的シーケンシャルアプローチを頼りにすると、容易に評価できる$f$の推定値が得られる。
論文 参考訳(メタデータ) (2024-08-26T16:40:04Z) - A Bayesian Approach Toward Robust Multidimensional Ellipsoid-Specific Fitting [0.0]
本研究は, ノイズおよび外周波の汚染における散乱データに多次元楕円体を適合させる, 新規で効果的な方法を提案する。
楕円体領域内でのプリミティブパラメータの探索を制約するために、均一な事前分布を組み込む。
本研究では, 顕微鏡細胞計数, 3次元再構成, 幾何学的形状近似, 磁力計の校正タスクなど, 幅広い応用に応用する。
論文 参考訳(メタデータ) (2024-07-27T14:31:51Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - Sobolev Space Regularised Pre Density Models [51.558848491038916]
本研究では,ソボレフ法則の正則化に基づく非パラメトリック密度推定法を提案する。
この方法は統計的に一貫したものであり、帰納的検証モデルを明確かつ一貫したものにしている。
論文 参考訳(メタデータ) (2023-07-25T18:47:53Z) - Anomaly Detection with Variance Stabilized Density Estimation [49.46356430493534]
本稿では, 観測試料の確率を最大化するための分散安定化密度推定問題を提案する。
信頼性の高い異常検知器を得るために,分散安定化分布を学習するための自己回帰モデルのスペクトルアンサンブルを導入する。
我々は52のデータセットで広範なベンチマークを行い、我々の手法が最先端の結果につながることを示した。
論文 参考訳(メタデータ) (2023-06-01T11:52:58Z) - Optimizing the Noise in Self-Supervised Learning: from Importance
Sampling to Noise-Contrastive Estimation [80.07065346699005]
GAN(Generative Adversarial Networks)のように、最適な雑音分布はデータ分布に等しくなると広く想定されている。
我々は、この自己教師型タスクをエネルギーベースモデルの推定問題として基礎づけるノイズ・コントラスト推定に目を向ける。
本研究は, 最適雑音のサンプリングは困難であり, 効率性の向上は, データに匹敵する雑音分布を選択することに比べ, 緩やかに行うことができると結論付けた。
論文 参考訳(メタデータ) (2023-01-23T19:57:58Z) - The Optimal Noise in Noise-Contrastive Learning Is Not What You Think [80.07065346699005]
この仮定から逸脱すると、実際により良い統計的推定結果が得られることが示される。
特に、最適な雑音分布は、データと異なり、また、別の家族からさえも異なる。
論文 参考訳(メタデータ) (2022-03-02T13:59:20Z) - Heavy-tailed denoising score matching [5.371337604556311]
ランゲヴィン力学における複数のノイズレベルを連続的に初期化する反復的雑音スケーリングアルゴリズムを開発した。
実用面では、重み付きDSMを用いることで、スコア推定、制御可能なサンプリング収束、不均衡データセットに対するよりバランスのない非条件生成性能が改善される。
論文 参考訳(メタデータ) (2021-12-17T22:04:55Z) - Consistency Regularization for Certified Robustness of Smoothed
Classifiers [89.72878906950208]
最近のランダムな平滑化技術は、最悪の$ell$-robustnessを平均ケースのロバストネスに変換することができることを示している。
その結果,スムーズな分類器の精度と信頼性の高いロバスト性とのトレードオフは,ノイズに対する予測一貫性の規則化によって大きく制御できることが判明した。
論文 参考訳(メタデータ) (2020-06-07T06:57:43Z) - Doubly-Stochastic Normalization of the Gaussian Kernel is Robust to
Heteroskedastic Noise [3.5429774642987915]
ガウス核の主対角がゼロの二重確率正規化はヘテロスケダティックノイズに対して頑健であることを示す。
本報告では,本態性ヘテロスケダスティック性を有する単一細胞RNA配列のシミュレートおよび実験例を示す。
論文 参考訳(メタデータ) (2020-05-31T01:31:10Z) - Nearest Neighbor Dirichlet Mixtures [3.3194866396158]
計算上の欠点を伴わずにベイズ的アプローチの強みのほとんどを維持するために、近傍のディリクレ混合のクラスを提案する。
単純で恥ずかしい並列なモンテカルロアルゴリズムが提案され、結果の擬似ポストから未知の密度をサンプリングする。
論文 参考訳(メタデータ) (2020-03-17T21:39:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。