論文の概要: Robust Topological Inference in the Presence of Outliers
- arxiv url: http://arxiv.org/abs/2206.01795v1
- Date: Fri, 3 Jun 2022 19:45:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 16:34:57.113539
- Title: Robust Topological Inference in the Presence of Outliers
- Title(参考訳): 外れ値の存在下でのロバストな位相推論
- Authors: Siddharth Vishwanath, Bharath K. Sriperumbudur, Kenji Fukumizu and
Satoshi Kuriki
- Abstract要約: コンパクト集合への距離関数は、位相データ解析のパラダイムにおいて重要な役割を果たす。
ハウスドルフ距離における摂動に対する安定性にもかかわらず、永続ホモロジーは外れ値に対して非常に敏感である。
距離関数(textsfMoM Dist$)の$textitmedian-of-means$変種を提案し、その統計特性を確立する。
- 参考スコア(独自算出の注目度): 18.6112824677157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The distance function to a compact set plays a crucial role in the paradigm
of topological data analysis. In particular, the sublevel sets of the distance
function are used in the computation of persistent homology -- a backbone of
the topological data analysis pipeline. Despite its stability to perturbations
in the Hausdorff distance, persistent homology is highly sensitive to outliers.
In this work, we develop a framework of statistical inference for persistent
homology in the presence of outliers. Drawing inspiration from recent
developments in robust statistics, we propose a $\textit{median-of-means}$
variant of the distance function ($\textsf{MoM Dist}$), and establish its
statistical properties. In particular, we show that, even in the presence of
outliers, the sublevel filtrations and weighted filtrations induced by
$\textsf{MoM Dist}$ are both consistent estimators of the true underlying
population counterpart, and their rates of convergence in the bottleneck metric
are controlled by the fraction of outliers in the data. Finally, we demonstrate
the advantages of the proposed methodology through simulations and
applications.
- Abstract(参考訳): コンパクト集合への距離関数は、位相データ解析のパラダイムにおいて重要な役割を果たす。
特に、距離関数の部分レベル集合は、位相的データ解析パイプラインのバックボーンである永続ホモロジーの計算に使用される。
ハウスドルフ距離の摂動に対する安定性にもかかわらず、永続ホモロジーは外れ値に対して非常に敏感である。
本研究では,外乱の存在下での持続的ホモロジーに対する統計的推論の枠組みを開発する。
最近の統計学の発展から着想を得て、距離関数の$\textit{median-of-means}$変種($\textsf{MoM Dist}$)を提案し、その統計的性質を確立する。
特に、外れ値が存在する場合でも、$\textsf{mom dist}$ によって引き起こされる下位レベルの濾過と重み付き濾過は、どちらも真に根底にある人口の一貫した推定値であり、ボトルネックメトリックにおける収束率はデータの外れ値の分数によって制御される。
最後に,シミュレーションと応用を通して提案手法の利点を実証する。
関連論文リスト
- Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Persistent Classification: A New Approach to Stability of Data and Adversarial Examples [6.469716438197741]
本研究では,自然点と逆点の補間点に沿った持続的測定値の相違について検討する。
敵の例は、大きなニューラルネットワークの自然な例よりも持続性が著しく低いことを示す。
我々は、この永続性の欠如を、決定境界に関する補間物の角度を測定することによって、決定境界幾何学と結び付ける。
論文 参考訳(メタデータ) (2024-04-11T18:13:42Z) - Learn2Extend: Extending sequences by retaining their statistical
properties with mixture models [7.15769102504304]
本稿では,実数列の一般有限列を実数列の部分区間内で拡張するという課題に対処する。
我々の焦点は、これらの点集合のギャップ分布とペア相関関数を保存することにある。
本稿では,ポイントプロセスに適用されたディープラーニングの進歩を活用し,自動回帰テキストシーケンス拡張混合モデルの利用について検討する。
論文 参考訳(メタデータ) (2023-12-03T21:05:50Z) - Non-isotropic Persistent Homology: Leveraging the Metric Dependency of
PH [5.70896453969985]
連続ホモロジーを単一距離関数に制限する場合、点雲の情報が失われることを示す。
非等方的永続ホモロジーは、ランダムに生成された点雲の向き、向きのばらつき、スケーリングに関する情報を抽出できることを数値的に示す。
論文 参考訳(メタデータ) (2023-10-25T08:03:17Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Online Statistical Inference for Nonlinear Stochastic Approximation with
Markovian Data [22.59079286063505]
マルコフデータの単一軌跡を用いた非線形近似アルゴリズムの統計的推定について検討した。
本手法は,自動回帰データや非同期Q-Learningにおけるグラディエント・Descent (SGD) など,様々なシナリオで実用化されている。
論文 参考訳(メタデータ) (2023-02-15T14:31:11Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - $\beta$-Cores: Robust Large-Scale Bayesian Data Summarization in the
Presence of Outliers [14.918826474979587]
古典的ベイズ推定の質は、観測結果が推定データ生成モデルに適合するかどうかに大きく依存する。
本稿では,大容量データセットに同時スケール可能な変分推論手法を提案する。
多様なシミュレーションおよび実データ、および様々な統計モデルにおいて、我々のアプローチの適用性について説明する。
論文 参考訳(メタデータ) (2020-08-31T13:47:12Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Distributional Robustness and Regularization in Reinforcement Learning [62.23012916708608]
経験値関数の新しい正規化器を導入し、ワッサーシュタイン分布のロバストな値関数を下限とすることを示す。
強化学習における$textitexternalな不確実性に対処するための実用的なツールとして正規化を使用することを提案する。
論文 参考訳(メタデータ) (2020-03-05T19:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。