論文の概要: Computable Stability for Persistence Rank Function Machine Learning
- arxiv url: http://arxiv.org/abs/2307.02904v1
- Date: Thu, 6 Jul 2023 10:34:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 14:26:43.128692
- Title: Computable Stability for Persistence Rank Function Machine Learning
- Title(参考訳): パーシステンスランク関数機械学習のための計算安定性
- Authors: Qiquan Wang, In\'es Garc\'ia-Redondo, Pierre Faug\`ere, Anthea Monod,
Gregory Henselman-Petrusek
- Abstract要約: 機能的推論統計学および機械学習におけるランク関数の性能をシミュレーションデータと実データの両方を用いて検討する。
階数関数によって捕捉される永続的ホモロジーの使用は、既存のアプローチよりも明らかな改善をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Persistent homology barcodes and diagrams are a cornerstone of topological
data analysis. Widely used in many real data settings, they relate variation in
topological information (as measured by cellular homology) with variation in
data, however, they are challenging to use in statistical settings due to their
complex geometric structure. In this paper, we revisit the persistent homology
rank function -- an invariant measure of ``shape" that was introduced before
barcodes and persistence diagrams and captures the same information in a form
that is more amenable to data and computation. In particular, since they are
functions, techniques from functional data analysis -- a domain of statistics
adapted for functions -- apply directly to persistent homology when represented
by rank functions. Rank functions, however, have been less popular than
barcodes because they face the challenge that stability -- a property that is
crucial to validate their use in data analysis -- is difficult to guarantee,
mainly due to metric concerns on rank function space. However, rank functions
extend more naturally to the increasingly popular and important case of
multiparameter persistent homology. In this paper, we study the performance of
rank functions in functional inferential statistics and machine learning on
both simulated and real data, and in both single and multiparameter persistent
homology. We find that the use of persistent homology captured by rank
functions offers a clear improvement over existing approaches. We then provide
theoretical justification for our numerical experiments and applications to
data by deriving several stability results for single- and multiparameter
persistence rank functions under various metrics with the underlying aim of
computational feasibility and interpretability.
- Abstract(参考訳): 永続的ホモロジーバーコードとダイアグラムは、トポロジカルデータ分析の基盤である。
多くの実データ設定で広く使われているが、トポロジ情報の変化(細胞ホモロジーによって測定される)とデータの変動を関連付けるが、複雑な幾何学的構造のために統計的設定での使用は困難である。
In this paper, we revisit the persistent homology rank function -- an invariant measure of ``shape" that was introduced before barcodes and persistence diagrams and captures the same information in a form that is more amenable to data and computation. In particular, since they are functions, techniques from functional data analysis -- a domain of statistics adapted for functions -- apply directly to persistent homology when represented by rank functions. Rank functions, however, have been less popular than barcodes because they face the challenge that stability -- a property that is crucial to validate their use in data analysis -- is difficult to guarantee, mainly due to metric concerns on rank function space.
しかし、ランク関数はより自然に、多パラメータ持続ホモロジーの人気の高まりと重要なケースにまで拡張される。
本稿では,シミュレーションデータと実データの両方,および単一および多パラメータ持続ホモロジーにおいて,関数推論統計および機械学習におけるランク関数の性能について検討する。
階数関数によって捕捉される永続的ホモロジーの使用は、既存のアプローチよりも明らかな改善をもたらす。
次に, 計算可能性と解釈可能性という基礎的な目的から, 各種指標を用いた単パラメータ・多パラメータ永続ランク関数の安定性を導出し, 数値実験とデータへの適用を理論的に正当化する。
関連論文リスト
- SymbolFit: Automatic Parametric Modeling with Symbolic Regression [1.2662552408022727]
シンボリック回帰を用いてパラメトリックモデリングを自動化するフレームワークであるSybolFitを導入し,データに適合する関数の機械探索を行う。
本手法はCERN大型ハドロン衝突型加速器における高エネルギー物理実験におけるデータ解析応用において実証された。
論文 参考訳(メタデータ) (2024-11-15T00:09:37Z) - ASGNet: Adaptive Semantic Gate Networks for Log-Based Anomaly Diagnosis [6.399472066185473]
本稿では,統計的特徴と意味的特徴を組み合わせた適応意味ゲートネットワーク(ASGNet)を提案する。
ASGNetは変分符号化モジュールを介して統計的特徴を符号化し、よく設計された適応的セマンティックしきい値機構を通じて有用な情報を融合する。
論文 参考訳(メタデータ) (2024-02-19T05:08:44Z) - A Functional approach for Two Way Dimension Reduction in Time Series [13.767812547998735]
機能的エンコーダと機能的デコーダからなる非線形関数オンファンクション手法を提案する。
提案手法は,関数が観測される時間点だけでなく,機能的特徴の数を減らし,低次元の潜在表現を与える。
論文 参考訳(メタデータ) (2023-01-01T06:09:15Z) - Offline Reinforcement Learning with Differentiable Function
Approximation is Provably Efficient [65.08966446962845]
歴史的データを用いて意思決定戦略を最適化することを目的としたオフライン強化学習は、現実の応用に広く適用されている。
微分関数クラス近似(DFA)を用いたオフライン強化学習の検討から一歩踏み出した。
最も重要なことは、悲観的な適合Q-ラーニングアルゴリズムを解析することにより、オフライン微分関数近似が有効であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T07:59:42Z) - Robust Topological Inference in the Presence of Outliers [18.6112824677157]
コンパクト集合への距離関数は、位相データ解析のパラダイムにおいて重要な役割を果たす。
ハウスドルフ距離における摂動に対する安定性にもかかわらず、永続ホモロジーは外れ値に対して非常に敏感である。
距離関数(textsfMoM Dist$)の$textitmedian-of-means$変種を提案し、その統計特性を確立する。
論文 参考訳(メタデータ) (2022-06-03T19:45:43Z) - Data-Driven Reachability analysis and Support set Estimation with
Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。
生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。
到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文 参考訳(メタデータ) (2021-12-18T20:25:34Z) - Learning PSD-valued functions using kernel sums-of-squares [94.96262888797257]
PSDコーンの値を取る関数に対して,カーネルの総和モデルを導入する。
PSD関数の普遍近似を構成することを示し、サブサンプル等式制約の場合の固有値境界を導出する。
次に、この結果を凸関数のモデル化に応用し、ヘッセンのカーネル和-二乗表現を強制する。
論文 参考訳(メタデータ) (2021-11-22T16:07:50Z) - Removing Bias in Multi-modal Classifiers: Regularization by Maximizing
Functional Entropies [88.0813215220342]
いくつかのモダリティは、他のものよりも分類結果に容易に寄与することができる。
機能的エントロピーと機能的フィッシャー情報とを結合した対数ソボレフの不等式に基づく手法を開発した。
VQA-CPv2 と SocialIQ の2つの挑戦的マルチモーダルデータセットに対して,より均一にモダリティを活用しながら,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-10-21T07:40:33Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。