論文の概要: Opening the black-box of Neighbor Embedding with Hotelling's T2
statistic and Q-residuals
- arxiv url: http://arxiv.org/abs/2209.01984v1
- Date: Mon, 5 Sep 2022 14:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 12:58:29.064220
- Title: Opening the black-box of Neighbor Embedding with Hotelling's T2
statistic and Q-residuals
- Title(参考訳): hotellingのt2統計とq-residualsによる隣人のブラックボックスの開放
- Authors: Roman Josef Rainer, Michael Mayr, Johannes Himmelbauer, Ramin
Nikzad-Langerodi
- Abstract要約: 隣接埋め込み(NE)技術は、高次元データの局所構造やトポロジーをよりよく保存する傾向がある。
しかし、局所的な構造を維持する能力は、解釈可能性の犠牲となる。
本稿では,データポイント群間の差別的特徴を識別する手法について述べる。
- 参考スコア(独自算出の注目度): 1.6058099298620425
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In contrast to classical techniques for exploratory analysis of
high-dimensional data sets, such as principal component analysis (PCA),
neighbor embedding (NE) techniques tend to better preserve the local
structure/topology of high-dimensional data. However, the ability to preserve
local structure comes at the expense of interpretability: Techniques such as
t-Distributed Stochastic Neighbor Embedding (t-SNE) or Uniform Manifold
Approximation and Projection (UMAP) do not give insights into which input
variables underlie the topological (cluster) structure seen in the
corresponding embedding. We here propose different "tricks" from the
chemometrics field based on PCA, Q-residuals and Hotelling's T2 contributions
in combination with novel visualization approaches to derive local and global
explanations of neighbor embedding. We show how our approach is capable of
identifying discriminatory features between groups of data points that remain
unnoticed when exploring NEs using standard univariate or multivariate
approaches.
- Abstract(参考訳): 主成分分析(PCA)のような高次元データセットの探索的解析のための古典的手法とは対照的に、隣接埋め込み(NE)技術は高次元データの局所構造やトポロジーをよりよく保存する傾向がある。
t-Distributed Stochastic Neighbor Embedding (t-SNE) や Uniform Manifold Approximation and Projection (UMAP) のような手法は、入力変数が対応する埋め込みで見られるトポロジカル(クラスタ)構造をどの部分で満たすかについての洞察を与えない。
そこで我々は,PCA,Q-Residuals,HotellingのT2コントリビューションと,近隣の埋め込みに関する局所的およびグローバルな説明を導出するための新しい可視化手法を組み合わせた,化学計測分野からの「トリック」を提案する。
我々は、標準の非変量的または多変量的アプローチを用いて、nesを探索する際に気づかないデータポイント群間で識別可能なアプローチを示す。
関連論文リスト
- K-Nearest-Neighbors Induced Topological PCA for scRNA Sequence Data
Analysis [0.3683202928838613]
永続ラプラシアン(PL)法とL$_2,1$ノルム正規化を組み合わせたトポロジカルプライマリコンポーネント分析(tPCA)法を提案する。
さらに, k-Nearest-Neighbor (kNN) の永続ラプラス的手法を導入し, 永続ラプラス的手法の堅牢性を向上させる。
提案したtPCA法とkNN-tPCA法の有効性を,11種類のscRNA-seqデータセット上で検証した。
論文 参考訳(メタデータ) (2023-10-23T03:07:50Z) - Anchor-based Multi-view Subspace Clustering with Hierarchical Feature
Descent [50.283640069991]
マルチビュークラスタリングは、様々なソースから情報を集約する能力によって、注目を集めている。
階層的特徴Descentを用いたアンカーベースマルチビューサブスペースクラスタリングを提案する。
提案手法は最先端技術より一貫して優れている。
論文 参考訳(メタデータ) (2023-10-11T03:29:13Z) - Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Preserving local densities in low-dimensional embeddings [37.278617643507815]
tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。
しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。
局所密度をほぼ保存するdtSNEを提案する。
論文 参考訳(メタデータ) (2023-01-31T16:11:54Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Hierarchical Optimal Transport for Unsupervised Domain Adaptation [0.0]
本稿では,最適輸送,学習確率測定,教師なし学習の概念を関連づけた,教師なし領域適応のための新しいアプローチを提案する。
提案手法であるHOT-DAは最適輸送の階層的な定式化に基づいている。
制御可能な複雑さを持つ玩具データセットと、2つの挑戦的な視覚適応データセットの実験は、最先端技術よりも提案されたアプローチの優位性を示している。
論文 参考訳(メタデータ) (2021-12-03T18:37:23Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [64.0476282000118]
HUMAPは、局所的・大域的構造と階層的探索を通してのメンタルマップの保存に柔軟に設計された、新しい階層的次元削減技術である。
本手法の優位性を示す実証的な証拠を,現在の階層的アプローチと比較し,その強みを示す2つのケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Seismic horizon detection with neural networks [62.997667081978825]
本稿では,複数の実地震立方体上での地平線検出にバイナリセグメンテーションを適用し,予測モデルのキューブ間一般化に着目したオープンソースの研究である。
本研究の主な貢献は,複数実地震立方体における地平線検出にバイナリセグメンテーションを適用し,予測モデルのキューブ間一般化に着目したオープンソースの研究である。
論文 参考訳(メタデータ) (2020-01-10T11:30:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。