論文の概要: CO-SNE: Dimensionality Reduction and Visualization for Hyperbolic Data
- arxiv url: http://arxiv.org/abs/2111.15037v1
- Date: Tue, 30 Nov 2021 00:21:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 06:04:19.845973
- Title: CO-SNE: Dimensionality Reduction and Visualization for Hyperbolic Data
- Title(参考訳): CO-SNE:双曲データの次元化と可視化
- Authors: Yunhui Guo, Haoran Guo, Stella Yu
- Abstract要約: ユークリッド空間可視化ツール t-SNE を双曲空間に拡張した CO-SNE を提案する。
ユークリッド空間とは異なり、双曲空間は不均一であり、体積は原点から遠く離れた位置にある多くの点を含むことができる。
我々は高次元双曲生物データと教師なし学習双曲表現にCO-SNEを適用した。
- 参考スコア(独自算出の注目度): 10.618060176686916
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperbolic space can embed tree metric with little distortion, a desirable
property for modeling hierarchical structures of real-world data and semantics.
While high-dimensional embeddings often lead to better representations, most
hyperbolic models utilize low-dimensional embeddings, due to non-trivial
optimization as well as the lack of a visualization for high-dimensional
hyperbolic data.
We propose CO-SNE, extending the Euclidean space visualization tool, t-SNE,
to hyperbolic space. Like t-SNE, it converts distances between data points to
joint probabilities and tries to minimize the Kullback-Leibler divergence
between the joint probabilities of high-dimensional data $X$ and
low-dimensional embeddings $Y$. However, unlike Euclidean space, hyperbolic
space is inhomogeneous: a volume could contain a lot more points at a location
far from the origin. CO-SNE thus uses hyperbolic normal distributions for $X$
and hyberbolic \underline{C}auchy instead of t-SNE's Student's t-distribution
for $Y$, and it additionally attempts to preserve $X$'s individual distances to
the \underline{O}rigin in $Y$.
We apply CO-SNE to high-dimensional hyperbolic biological data as well as
unsupervisedly learned hyperbolic representations. Our results demonstrate that
CO-SNE deflates high-dimensional hyperbolic data into a low-dimensional space
without losing their hyperbolic characteristics, significantly outperforming
popular visualization tools such as PCA, t-SNE, UMAP, and HoroPCA, the last of
which is specifically designed for hyperbolic data.
- Abstract(参考訳): 双曲空間は、実世界のデータと意味論の階層構造をモデル化するのに望ましい性質である、歪みの少ない木メトリックを埋め込むことができる。
高次元埋め込みはしばしばより良い表現をもたらすが、ほとんどの双曲モデルは、非自明な最適化と高次元双曲データの可視化の欠如により低次元埋め込みを用いる。
ユークリッド空間可視化ツール t-SNE を双曲空間に拡張した CO-SNE を提案する。
t-SNE と同様に、データポイント間の距離を結合確率に変換し、高次元データの結合確率 $X$ と低次元埋め込み $Y$ のKullback-Leibler 差を最小化しようとする。
しかし、ユークリッド空間とは異なり、双曲空間は不均一であり、体積は原点から遠く離れた場所に多くの点を含むことができる。
したがって CO-SNE は t-SNE の t-distribution の代わりに $X$ と hyberbolic \underline{C}auchy の双曲正規分布を使い、さらに$Y$ で $X$ の個々の距離を \underline{O}rigin に保存しようとする。
高次元双曲生物データと教師なし学習双曲表現にco-sneを適用する。
以上の結果から,CO-SNEは高次元双曲データを低次元空間にデフレし,その双曲特性を損なわずにデフレし,PCA,t-SNE,UMAP,HoroPCAなどの一般的な可視化ツールを著しく上回った。
関連論文リスト
- Hyperbolic Delaunay Geometric Alignment [52.835250875177756]
双曲空間におけるデータセットの比較のための類似度スコアを提案する。
中心となる考え方は、与えられた集合をまたいだデータポイントを接続する双曲デラウネーグラフのエッジを数えることである。
人工および実生活の生物学的データに関する実証的研究を行い、HyperDGAが集合間の古典的距離の双曲バージョンより優れていることを示す。
論文 参考訳(メタデータ) (2024-04-12T17:14:58Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Hyperbolic vs Euclidean Embeddings in Few-Shot Learning: Two Sides of
the Same Coin [49.12496652756007]
この結果から, 共通の双曲半径での双曲埋め込みが達成できることが示唆された。
従来のベンチマーク結果とは対照的に、ユークリッド計量を備えた固定半径エンコーダにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-18T14:51:46Z) - Tight and fast generalization error bound of graph embedding in metric
space [54.279425319381374]
非ユークリッド計量空間へのグラフ埋め込みは、既存の有界よりもはるかに少ない訓練データを持つユークリッド空間におけるグラフ埋め込みよりも優れていることを示す。
我々の新しい上限は、既存の上限よりもかなり強く速く、最大で$R$と$O(frac1S)$に指数関数できる。
論文 参考訳(メタデータ) (2023-05-13T17:29:18Z) - FFHR: Fully and Flexible Hyperbolic Representation for Knowledge Graph
Completion [45.470475498688344]
双曲空間におけるいくつかの重要な操作は、まだ良い定義を欠いているため、既存の方法では双曲空間の利点を十分に活用できない。
我々は,近年のユークリッド対応の進歩を双曲空間に転送できるtextbfFully と textbfFlexible textbfHyperbolic textbfRepresentation フレームワーク (textbfFFHR) を開発した。
論文 参考訳(メタデータ) (2023-02-07T14:50:28Z) - HRCF: Enhancing Collaborative Filtering via Hyperbolic Geometric
Regularization [52.369435664689995]
HRCF (textitHyperbolic Regularization powered Collaborative Filtering) を導入し,幾何認識型双曲正規化器を設計する。
具体的には、ルートアライメントとオリジン認識ペナルティによる最適化手順を強化する。
提案手法は,双曲的凝集による過度な平滑化問題に対処でき,モデルの識別能力も向上する。
論文 参考訳(メタデータ) (2022-04-18T06:11:44Z) - Nested Hyperbolic Spaces for Dimensionality Reduction and Hyperbolic NN
Design [8.250374560598493]
ハイパーボリックニューラルネットワークは、階層的なデータセットを効率的かつ効率的に表現できることから、近年人気がある。
これらのネットワークを開発する際の課題は、埋め込み空間、すなわち双曲空間の非線形性にある。
本稿では, 射影(埋め込み)の概念と, 内在的な凝集, 双曲空間内の非線形性を併用した, 完全双曲型ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T03:20:27Z) - Highly Scalable and Provably Accurate Classification in Poincare Balls [40.82908295137667]
我々は、スケーラブルで単純な双曲型線形分類器を証明可能な性能保証で学習するための統一的なフレームワークを構築した。
提案手法は,新しい双曲型および二階型パーセプトロンアルゴリズムと,双曲型サポートベクトルマシン分類器の効率的かつ高精度な凸最適化設定を含む。
数百万の点からなる合成データセットと、シングルセルRNA-seq式測定、CIFAR10、Fashion-MNIST、mini-ImageNetのような複雑な実世界のデータセットの性能評価を行う。
論文 参考訳(メタデータ) (2021-09-08T16:59:39Z) - Unit Ball Model for Hierarchical Embeddings in Complex Hyperbolic Space [28.349200177632852]
双曲空間における階層構造を持つデータの表現を学習することは近年注目を集めている。
複素双曲空間の単位球モデルにおいてグラフ埋め込みを学ぶことを提案する。
論文 参考訳(メタデータ) (2021-05-09T16:09:54Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。