論文の概要: In search of the most efficient and memory-saving visualization of high
dimensional data
- arxiv url: http://arxiv.org/abs/2303.05455v1
- Date: Mon, 27 Feb 2023 20:56:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-12 03:32:37.207200
- Title: In search of the most efficient and memory-saving visualization of high
dimensional data
- Title(参考訳): 高次元データの最も効率的かつメモリ節約な可視化の探索
- Authors: Bartosz Minch
- Abstract要約: 多次元データの可視化は、非次元近傍グラフの2方向埋め込みをよく近似していると論じる。
既存のリダクション手法は遅すぎるため、インタラクティブな操作ができない。
高品質な埋め込みは、最小限の時間とメモリの複雑さで生成されることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive exploration of large, multidimensional datasets plays a very
important role in various scientific fields. It makes it possible not only to
identify important structural features and forms, such as clusters of vertices
and their connection patterns, but also to evaluate their interrelationships in
terms of position, distance, shape and connection density. We argue that the
visualization of multidimensional data is well approximated by the problem of
two-dimensional embedding of undirected nearest-neighbor graphs. The size of
complex networks is a major challenge for today's computer systems and still
requires more efficient data embedding algorithms. Existing reduction methods
are too slow and do not allow interactive manipulation. We show that
high-quality embeddings are produced with minimal time and memory complexity.
We present very efficient IVHD algorithms (CPU and GPU) and compare them with
the latest and most popular dimensionality reduction methods. We show that the
memory and time requirements are dramatically lower than for base codes. At the
cost of a slight degradation in embedding quality, IVHD preserves the main
structural properties of the data well with a much lower time budget. We also
present a meta-algorithm that allows the use of any unsupervised data embedding
method in a supervised manner.
- Abstract(参考訳): 大規模多次元データセットのインタラクティブな探索は、様々な科学分野で非常に重要な役割を果たす。
これにより、頂点のクラスタや接続パターンなどの重要な構造的特徴や形態を識別できるだけでなく、位置、距離、形状、接続密度の観点からそれらの相互関係を評価することができる。
多次元データの可視化は、非指向的近距離グラフの二次元埋め込み問題によってよく近似される。
複雑なネットワークのサイズは、今日のコンピュータシステムにとって大きな課題であり、さらに効率的なデータ埋め込みアルゴリズムを必要とする。
既存の削減方法は遅すぎるため、対話的な操作ができない。
高品質な組込みは最小限の時間とメモリの複雑さで生成される。
我々は、非常に効率的なIVHDアルゴリズム(CPUとGPU)を提案し、それらを最新の最も一般的な次元削減手法と比較する。
メモリと時間要件がベースコードよりも劇的に低いことを示す。
ivhdは、埋め込み品質のわずかな低下のコストで、データの主な構造的特性をはるかに低い時間予算で保存する。
また,教師なしデータ埋め込みメソッドを教師あり方式で使用可能にするメタアルゴリズムを提案する。
関連論文リスト
- Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Streaming Encoding Algorithms for Scalable Hyperdimensional Computing [12.829102171258882]
超次元コンピューティング(Hyperdimensional Computing、HDC)は、計算神経科学を起源とするデータ表現と学習のパラダイムである。
そこで本研究では,ハッシュに基づくストリーミング符号化手法のファミリについて検討する。
我々は,これらの手法が既存の代替手段よりもはるかに効率的でありながら,学習アプリケーションの性能に匹敵する保証を享受できることを正式に示す。
論文 参考訳(メタデータ) (2022-09-20T17:25:14Z) - Hierarchical Nearest Neighbor Graph Embedding for Efficient
Dimensionality Reduction [25.67957712837716]
元の空間における1-アレスト近傍グラフ上に構築された階層構造に基づく新しい手法を提案する。
この提案は、t-SNE と UMAP の最新バージョンと競合する最適化のないプロジェクションである。
そこで本論文では,提案手法の健全性について論じ,28~16Kの範囲で1Kから1100万のサンプルと寸法の異なるデータセットの多種多様なコレクション上で評価を行った。
論文 参考訳(メタデータ) (2022-03-24T11:41:16Z) - Scalable semi-supervised dimensionality reduction with GPU-accelerated
EmbedSOM [0.0]
BlosSOMは高次元データセットの対話型ユーザステアブル可視化のための高性能半教師付き次元減少ソフトウェアである。
現実的なデータセットにBlosSOMを適用することで、ユーザが指定したレイアウトを組み込んだ高品質な視覚化と、特定の機能に集中することが可能になる。
論文 参考訳(メタデータ) (2022-01-03T15:06:22Z) - Revisiting Point Cloud Simplification: A Learnable Feature Preserving
Approach [57.67932970472768]
MeshとPoint Cloudの単純化手法は、3Dモデルの複雑さを低減しつつ、視覚的品質と関連する健全な機能を維持することを目的としている。
そこで本研究では,正解点の標本化を学習し,高速点雲の簡易化手法を提案する。
提案手法は、入力空間から任意のユーザ定義の点数を選択し、視覚的知覚誤差を最小限に抑えるために、その位置を再配置するよう訓練されたグラフニューラルネットワークアーキテクチャに依存する。
論文 参考訳(メタデータ) (2021-09-30T10:23:55Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Supervised Visualization for Data Exploration [9.742277703732187]
本稿では,無作為な森林確率と拡散に基づく次元減少に基づく新しい可視化手法について述べる。
我々のアプローチはノイズやパラメータのチューニングに頑健であり、データ探索のための信頼性の高い可視化を作成しながら、簡単に使用できる。
論文 参考訳(メタデータ) (2020-06-15T19:10:17Z) - NCVis: Noise Contrastive Approach for Scalable Visualization [79.44177623781043]
NCVisはノイズコントラスト推定の音響統計的基礎の上に構築された高性能次元減少法である。
NCVisは,他の手法の表現品質を保ちながら,速度の観点から最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-30T15:43:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。