論文の概要: Computable Stability for Persistence Rank Function Machine Learning
- arxiv url: http://arxiv.org/abs/2307.02904v1
- Date: Thu, 6 Jul 2023 10:34:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 14:26:43.128692
- Title: Computable Stability for Persistence Rank Function Machine Learning
- Title(参考訳): パーシステンスランク関数機械学習のための計算安定性
- Authors: Qiquan Wang, In\'es Garc\'ia-Redondo, Pierre Faug\`ere, Anthea Monod,
Gregory Henselman-Petrusek
- Abstract要約: 機能的推論統計学および機械学習におけるランク関数の性能をシミュレーションデータと実データの両方を用いて検討する。
階数関数によって捕捉される永続的ホモロジーの使用は、既存のアプローチよりも明らかな改善をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Persistent homology barcodes and diagrams are a cornerstone of topological
data analysis. Widely used in many real data settings, they relate variation in
topological information (as measured by cellular homology) with variation in
data, however, they are challenging to use in statistical settings due to their
complex geometric structure. In this paper, we revisit the persistent homology
rank function -- an invariant measure of ``shape" that was introduced before
barcodes and persistence diagrams and captures the same information in a form
that is more amenable to data and computation. In particular, since they are
functions, techniques from functional data analysis -- a domain of statistics
adapted for functions -- apply directly to persistent homology when represented
by rank functions. Rank functions, however, have been less popular than
barcodes because they face the challenge that stability -- a property that is
crucial to validate their use in data analysis -- is difficult to guarantee,
mainly due to metric concerns on rank function space. However, rank functions
extend more naturally to the increasingly popular and important case of
multiparameter persistent homology. In this paper, we study the performance of
rank functions in functional inferential statistics and machine learning on
both simulated and real data, and in both single and multiparameter persistent
homology. We find that the use of persistent homology captured by rank
functions offers a clear improvement over existing approaches. We then provide
theoretical justification for our numerical experiments and applications to
data by deriving several stability results for single- and multiparameter
persistence rank functions under various metrics with the underlying aim of
computational feasibility and interpretability.
- Abstract(参考訳): 永続的ホモロジーバーコードとダイアグラムは、トポロジカルデータ分析の基盤である。
多くの実データ設定で広く使われているが、トポロジ情報の変化(細胞ホモロジーによって測定される)とデータの変動を関連付けるが、複雑な幾何学的構造のために統計的設定での使用は困難である。
In this paper, we revisit the persistent homology rank function -- an invariant measure of ``shape" that was introduced before barcodes and persistence diagrams and captures the same information in a form that is more amenable to data and computation. In particular, since they are functions, techniques from functional data analysis -- a domain of statistics adapted for functions -- apply directly to persistent homology when represented by rank functions. Rank functions, however, have been less popular than barcodes because they face the challenge that stability -- a property that is crucial to validate their use in data analysis -- is difficult to guarantee, mainly due to metric concerns on rank function space.
しかし、ランク関数はより自然に、多パラメータ持続ホモロジーの人気の高まりと重要なケースにまで拡張される。
本稿では,シミュレーションデータと実データの両方,および単一および多パラメータ持続ホモロジーにおいて,関数推論統計および機械学習におけるランク関数の性能について検討する。
階数関数によって捕捉される永続的ホモロジーの使用は、既存のアプローチよりも明らかな改善をもたらす。
次に, 計算可能性と解釈可能性という基礎的な目的から, 各種指標を用いた単パラメータ・多パラメータ永続ランク関数の安定性を導出し, 数値実験とデータへの適用を理論的に正当化する。
関連論文リスト
- A Framework for Fast and Stable Representations of Multiparameter
Persistent Homology Decompositions [2.76240219662896]
本稿では,複数パラメータの持続的ホモロジーのエム分解における最近の結果を活用する,新しい汎用表現フレームワークを提案する。
我々は,この枠組みの下で理論安定性の保証と,実用的な計算のための効率的なアルゴリズムを確立する。
いくつかの実データに対して,統計的収束,予測精度,高速実行時間を示す数値実験により,安定性とアルゴリズムの検証を行った。
論文 参考訳(メタデータ) (2023-06-19T21:28:53Z) - Basis Function Encoding of Numerical Features in Factorization Machines
for Improved Accuracy [2.3022070933226217]
FM変種に数値的特徴を組み込む体系的・理論的に最適化された方法を提案する。
提案手法は,選択した関数の集合にまたがる数値特徴の分数化関数を学習するモデルであることを示す。
本手法は,高速な学習と推論を保存し,FMモデルの計算グラフのわずかな修正しか必要としない。
論文 参考訳(メタデータ) (2023-05-23T21:10:17Z) - Equivariance with Learned Canonicalization Functions [77.32483958400282]
正規化を行うために小さなニューラルネットワークを学習することは、事前定義を使用することよりも優れていることを示す。
実験の結果,正準化関数の学習は多くのタスクで同変関数を学習する既存の手法と競合することがわかった。
論文 参考訳(メタデータ) (2022-11-11T21:58:15Z) - Robust Topological Inference in the Presence of Outliers [18.6112824677157]
コンパクト集合への距離関数は、位相データ解析のパラダイムにおいて重要な役割を果たす。
ハウスドルフ距離における摂動に対する安定性にもかかわらず、永続ホモロジーは外れ値に対して非常に敏感である。
距離関数(textsfMoM Dist$)の$textitmedian-of-means$変種を提案し、その統計特性を確立する。
論文 参考訳(メタデータ) (2022-06-03T19:45:43Z) - Data-Driven Reachability analysis and Support set Estimation with
Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。
生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。
到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文 参考訳(メタデータ) (2021-12-18T20:25:34Z) - Smart Vectorizations for Single and Multiparameter Persistence [8.504400925390296]
本稿では,single and multi-persistence persistenceのための2つの新しいトポロジ的サマリー,すなわち saw 関数と multi-persistence grid 関数を導入する。
これらの新しい位相的要約は、濾過によって決定される進化する部分空間の複雑性測度と見なすことができる。
新しいソーおよびマルチ永続グリッド関数の安定性に関する理論的保証を導出し、グラフ分類タスクへの適用性を示す。
論文 参考訳(メタデータ) (2021-04-10T15:09:31Z) - Removing Bias in Multi-modal Classifiers: Regularization by Maximizing
Functional Entropies [88.0813215220342]
いくつかのモダリティは、他のものよりも分類結果に容易に寄与することができる。
機能的エントロピーと機能的フィッシャー情報とを結合した対数ソボレフの不等式に基づく手法を開発した。
VQA-CPv2 と SocialIQ の2つの挑戦的マルチモーダルデータセットに対して,より均一にモダリティを活用しながら,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-10-21T07:40:33Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。