論文の概要: Resampling and averaging coordinates on data
- arxiv url: http://arxiv.org/abs/2408.01379v1
- Date: Fri, 2 Aug 2024 16:37:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 12:48:28.936230
- Title: Resampling and averaging coordinates on data
- Title(参考訳): データ上の座標のサンプリングと平均化
- Authors: Andrew J. Blumberg, Mathieu Carriere, Jun Hou Fung, Michael A. Mandell,
- Abstract要約: 点雲上の固有座標を頑健に計算するアルゴリズムを導入する。
候補座標の集合をクラスタリングし、位相データ解析から形状記述子を用いて代表埋め込みのサブセットを同定する。
最終的な出力は、一般化されたProcrustes解析を用いて代表埋め込みの平均として得られる埋め込みである。
- 参考スコア(独自算出の注目度): 1.660242118349614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce algorithms for robustly computing intrinsic coordinates on point clouds. Our approach relies on generating many candidate coordinates by subsampling the data and varying hyperparameters of the embedding algorithm (e.g., manifold learning). We then identify a subset of representative embeddings by clustering the collection of candidate coordinates and using shape descriptors from topological data analysis. The final output is the embedding obtained as an average of the representative embeddings using generalized Procrustes analysis. We validate our algorithm on both synthetic data and experimental measurements from genomics, demonstrating robustness to noise and outliers.
- Abstract(参考訳): 点雲上の固有座標を頑健に計算するアルゴリズムを導入する。
我々のアプローチは、埋め込みアルゴリズム(例えば、多様体学習)のデータと様々なハイパーパラメータをサブサンプリングすることで、多くの候補座標を生成することに依存している。
次に、候補座標の集合をクラスタリングし、トポロジカルデータ解析から形状記述子を用いて代表埋め込みのサブセットを同定する。
最終的な出力は、一般化されたProcrustes解析を用いて代表埋め込みの平均として得られる埋め込みである。
提案アルゴリズムは, ゲノミクスによる合成データと実験的測定の両方で検証し, ノイズや外れ値に対するロバスト性を実証した。
関連論文リスト
- Samplet basis pursuit: Multiresolution scattered data approximation with sparsity constraints [0.0]
我々は,$ell_1$-regularization を用いたサンプルト座標における分散データ近似について検討する。
Riesz isometry を用いて、標本を再現されたカーネルヒルベルト空間に埋め込む。
組込みサンプルベースに対してスパースな信号のクラスは、カーネル翻訳の基盤に関してスパースな信号のクラスよりもかなり大きいと論じる。
論文 参考訳(メタデータ) (2023-06-16T21:20:49Z) - Topological Quality of Subsets via Persistence Matching Diagrams [0.196629787330046]
我々は、トポロジカルデータ解析技術を用いて、そのデータセットに関するサブセットの品質を測定する。
特に,本手法では,選択したサブセットが教師付き学習モデルの貧弱な性能をもたらす可能性がある理由を説明することができる。
論文 参考訳(メタデータ) (2023-06-04T17:08:41Z) - Data Clustering as an Emergent Consensus of Autonomous Agents [0.0]
本稿では,1次密度誘導コンセンサスプロトコルに基づくデータセグメンテーション手法を提案する。
データセグメンテーションの停止基準につながるコンセンサスモデルを数学的に厳密に分析する。
論文 参考訳(メタデータ) (2022-04-22T09:11:35Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - A Gradient Sampling Algorithm for Stratified Maps with Applications to
Topological Data Analysis [0.0]
我々は、よく知られた勾配サンプリング手法を拡張した新しい勾配降下アルゴリズムを提案する。
次に、低星フィルタ上で計算された永続ホモロジー写像に基づいて、目的関数に本手法を適用する。
論文 参考訳(メタデータ) (2021-09-01T14:07:44Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Learning High Dimensional Wasserstein Geodesics [55.086626708837635]
高次元の2つの確率分布の間のワッサーシュタイン測地線を計算するための新しい定式化と学習戦略を提案する。
ラグランジュ乗算器の手法を最適輸送(OT)問題の動的定式化に適用することにより、サドル点がワッサーシュタイン測地線であるミニマックス問題を導出する。
次に、深層ニューラルネットワークによる関数のパラメータ化を行い、トレーニングのためのサンプルベースの双方向学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-02-05T04:25:28Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。