Fugu-MT 論文翻訳(概要): Towards a comprehensive visualization of structure in data

論文の概要: Towards a comprehensive visualization of structure in data

arxiv url: http://arxiv.org/abs/2111.15506v2
Date: Wed, 1 Dec 2021 07:50:38 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-03 12:20:00.869813
Title: Towards a comprehensive visualization of structure in data
Title（参考訳）: データの構造を包括的に可視化する
Authors: Joan Garriga and Frederic Bartumeus
Abstract要約: 本研究では,単一制御パラメータ,すなわちパープレキシティを用いた簡易パラメータ設定により,局所的および大域的データ構造の可視化を効果的に両立させることができることを示す。また、t-SNEを効率的に並列化し、広範囲にわたるデータ構造を探索するチャンク&ミックスプロトコルを設計した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Dimensional data reduction methods are fundamental to explore and visualize large data sets. Basic requirements for unsupervised data exploration are simplicity, flexibility and scalability. However, current methods show complex parameterizations and strong computational limitations when exploring large data structures across scales. Here, we focus on the t-SNE algorithm and show that a simplified parameter setup with a single control parameter, namely the perplexity, can effectively balance local and global data structure visualization. We also designed a chunk\&mix protocol to efficiently parallelize t-SNE and explore data structure across a much wide range of scales than currently available. Our parallel version of the BH-tSNE, namely pt-SNE, converges to good global embedding, comparable to state-of-the-art solutions, though the chunk\&mix protocol adds little noise and decreases the accuracy at the local scale. Nonetheless, we show that simple post-processing can efficiently restore local scale visualization, without any loss of precision at the global scales. We expect the same approach to apply to faster embedding algorithms other than BH-tSNE, like FIt-SNE or UMAP, thus, extending the state-of-the-art and leading to more comprehensive data structure visualization and analysis.
Abstract（参考訳）: 次元データ削減法は,大規模データセットの探索と可視化に不可欠である。教師なしデータ探索の基本的な要件は、単純さ、柔軟性、スケーラビリティである。しかし、現在の手法では、大規模データ構造を探索する際に複雑なパラメータ化と強い計算限界を示す。本稿では,t-sneアルゴリズムに着目し,単一の制御パラメータ,すなわちパープレキシティを用いた簡易パラメータ設定により,局所的および大域的なデータ構造の可視化を効果的にバランスできることを示す。また、t-SNEを効率的に並列化し、データ構造を現在よりも広い範囲にわたって探索するチャンク&ミックスプロトコルを設計した。我々の並列バージョンのBH-tSNE、すなわちpt-SNEは、最先端のソリューションに匹敵する優れたグローバルな埋め込みに収束する。それにもかかわらず、簡単な後処理により、グローバルスケールでの精度を失うことなく、ローカルスケールの可視化を効率的に復元できることを示す。我々は、FIT-SNEやUMAPのようなBH-tSNE以外の高速な埋め込みアルゴリズムに適用するために、同じアプローチを期待している。

関連論文リスト

Lighter-X: An Efficient and Plug-and-play Strategy for Graph-based Recommendation through Decoupled Propagation [49.865020394064096]
我々は,既存のGNNベースのレコメンデータアーキテクチャとシームレスに統合可能な,効率的かつモジュール化されたフレームワークである textbfLighter-X を提案する。提案手法は,基本モデルの理論的保証と経験的性能を保ちながら,パラメータサイズと計算複雑性を大幅に低減する。実験の結果、Lighter-Xはパラメータが大幅に少ないベースラインモデルに匹敵するパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-10-11T08:33:08Z)
GBSK: Skeleton Clustering via Granular-ball Computing and Multi-Sampling for Large-Scale Data [62.363178614776295]
本稿では,大規模データセットのクラスタリング処理を行うために,GBSKというスケーラブルなスケルトンクラスタリングアルゴリズムを提案する。データセットのマルチサンプリングと多粒度グラニュラーボールの構築により、GBSKは徐々に統計的「骨格」を発見さらに,ユーザビリティの向上と現実シナリオへの展開を容易にするため,パラメータ設定を簡略化した適応型AGBSKを導入する。
論文参考訳（メタデータ） (2025-09-28T08:41:15Z)
Dimensionality reduction for homological stability and global structure preservation [49.84018914962972]
本稿では,UMAP や tSNE といった従来の手法が直面する課題に対処するために,新しい次元削減ツールキットを提案する。 JAXフレームワーク上に構築されたDiReは、現代的なハードウェアアクセラレーションを活用し、複雑なデータ構造を視覚化するための効率的でスケーラブルで解釈可能なソリューションを提供する。このツールキットは、最先端の UMAP や tSNE の実装と比較して、データ内のローカル構造とグローバル構造の両方を保存することにかなり有望である。
論文参考訳（メタデータ） (2025-03-05T03:56:01Z)
Scalable Graph Attention-based Instance Selection via Mini-Batch Sampling and Hierarchical Hashing [0.24578723416255752]
インスタンス選択(IS)は、機械学習において重要な特徴を保持しながらデータセットのサイズを減らすために重要である。本稿では,アテンション機構を用いてインフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・セクション(GAIS)法を提案する。本稿では,戦略バッチ処理による距離ベースのミニバッチサンプリング手法と,ランダムプロジェクションによる効率的な類似性を実現する階層的ハッシュ手法の2つの方法を提案する。
論文参考訳（メタデータ） (2025-02-27T17:17:53Z)
FedNE: Surrogate-Assisted Federated Neighbor Embedding for Dimensionality Reduction [47.336599393600046]
textscFedNEは、textscFedAvgフレームワークと対照的なNEテクニックを統合する新しいアプローチである。我々は、合成データセットと実世界のデータセットの両方について包括的な実験を行う。
論文参考訳（メタデータ） (2024-09-17T19:23:24Z)
Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering [13.638434337947302]
FSSMSCは、既存のアプローチで一般的に見られる高い計算複雑性に対する新しいソリューションである。この手法は、各データポイントを選択されたランドマークの疎線型結合として表現し、すべてのビューにまたがるコンセンサスアンカーグラフを生成する。 FSSMSCの有効性と効率は、様々なスケールの複数のベンチマークデータセットに対する広範な実験を通して検証される。
論文参考訳（メタデータ） (2024-08-11T06:54:00Z)
Efficient Multi-View Graph Clustering with Local and Global Structure Preservation [59.49018175496533]
局所・グローバル構造保存を用いた効率的なマルチビューグラフクラスタリング(EMVGC-LG)という,アンカーベースのマルチビューグラフクラスタリングフレームワークを提案する。具体的には、EMVGC-LGがクラスタリング品質を向上させるために、アンカー構築とグラフ学習を共同で最適化する。さらに、EMVGC-LGはサンプル数に関する既存のAMVGCメソッドの線形複雑性を継承する。
論文参考訳（メタデータ） (2023-08-31T12:12:30Z)
Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文参考訳（メタデータ） (2022-08-25T05:47:39Z)
Design of Compressed Sensing Systems via Density-Evolution Framework for Structure Recovery in Graphical Models [10.667885727418705]
観測データからベイズネットワークの構造を学習することはNP-Hard問題であることが示されている。圧縮線形測定システムを最適化するための新しい密度進化に基づくフレームワークを提案する。 GBNの構造は実際に圧縮された測定結果から復元可能であることを示す。
論文参考訳（メタデータ） (2022-03-17T22:16:38Z)
ExClus: Explainable Clustering on Low-dimensional Data Representations [9.496898312608307]
次元の減少とクラスタリング技術は複雑なデータセットの分析に頻繁に使用されるが、それらの結果は容易には解釈できないことが多い。本研究では, 直接解釈できない散乱プロット上で, クラスタ構造を解釈する際のユーザ支援について検討する。本稿では,解釈可能なクラスタリングを自動的に計算する新しい手法を提案し,その説明は元の高次元空間にあり,クラスタリングは低次元射影においてコヒーレントである。
論文参考訳（メタデータ） (2021-11-04T21:24:01Z)
Clustered Federated Learning via Generalized Total Variation Minimization [83.26141667853057]
本研究では,分散ネットワーク構造を持つローカルデータセットの局所的(あるいはパーソナライズされた)モデルを学習するための最適化手法について検討する。我々の主要な概念的貢献は、総変動最小化(GTV)としてフェデレーション学習を定式化することである。私たちのアルゴリズムの主な貢献は、完全に分散化されたフェデレーション学習アルゴリズムです。
論文参考訳（メタデータ） (2021-05-26T18:07:19Z)
Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。提案されたSSCAGは最先端のアプローチと競合する。
論文参考訳（メタデータ） (2021-04-24T08:09:27Z)
Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文参考訳（メタデータ） (2020-12-29T04:08:38Z)
Visualizing the Finer Cluster Structure of Large-Scale and High-Dimensional Data [7.400745342582259]
一般化されたシグモイド関数を用いて高次元空間と低次元空間の距離類似性をモデル化する。本研究では,シミュレーションと実世界の両方のデータセットを用いて,一様多様体の近似と投影に匹敵する可視化結果が得られることを示す。
論文参考訳（メタデータ） (2020-07-17T01:36:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。