論文の概要: Contrastive analysis for scatter plot-based representations of
dimensionality reduction
- arxiv url: http://arxiv.org/abs/2101.12044v1
- Date: Tue, 26 Jan 2021 01:16:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:38:38.656591
- Title: Contrastive analysis for scatter plot-based representations of
dimensionality reduction
- Title(参考訳): 散乱プロットに基づく次元還元表現のコントラスト解析
- Authors: Wilson E. Marc\'ilio-Jr, Danilo M. Eler, Rog\'erio E. Garcia
- Abstract要約: 本稿では,マルチ次元データセットを探索し,クラスタの形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exploring multidimensional datasets is a ubiquitous part of the ones working
with data, where interpreting clusters is one of the main tasks. These
multidimensional datasets are usually encoded using scatter-plots
representations, where spatial proximity encodes similarity among data samples.
In the literature, techniques try to understand the scatter plot organization
by visualizing the importance of the features for clusters definition with
interaction and layout enrichment strategies. However, the approaches used to
interpret dimensionality reduction usually do not differentiate clusters well,
which hampers analysis where the focus is to understand the differences among
clusters. This paper introduces a methodology to visually explore
multidimensional datasets and interpret clusters' formation based on the
contrastive analysis. We also introduce a bipartite graph to visually interpret
and explore the relationship between the statistical variables used to
understand how the attributes influenced cluster formation. Our methodology is
validated through case studies. We explore a multivariate dataset of patients
with vertebral problems and two document collections, one related to news
articles and other related to tweets about COVID-19 symptoms. Finally, we also
validate our approach through quantitative results to demonstrate how it can be
robust enough to support multidimensional analysis.
- Abstract(参考訳): マルチ次元データセットの探索は、クラスタの解釈が主なタスクの1つであるデータを扱うもののユビキタスな部分です。
これらの多次元データセットは、通常、空間近接がデータサンプル間の類似性を符号化する散乱プロット表現を用いて符号化される。
文献では、相互作用とレイアウト強化戦略を用いてクラスタ定義の機能の重要性を視覚化することにより、散乱プロットの組織を理解する手法を試みている。
しかし、次元減少を解釈するために用いられるアプローチは、通常クラスターをよく区別しないため、クラスタ間の差異を理解することに焦点を当てる解析が妨げられる。
本稿では,多次元データセットを視覚的に探索し,コントラスト分析に基づくクラスタ形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
我々の方法論はケーススタディを通じて検証される。
脊椎疾患患者と2つの文書集の多変量データセットについて検討した。1つはニュース記事に関連するもの、もう1つはcovid-19の症状に関するツイートに関するもの。
最後に,多次元解析に十分頑健な方法を示すために,定量的な結果を用いて,そのアプローチを検証する。
関連論文リスト
- Comparing the information content of probabilistic representation spaces [3.7277730514654555]
確率的表現空間は、データセットに関する情報を伝達し、トレーニング損失やネットワークアーキテクチャなどの要因の影響を理解するために、そのような空間の情報内容を比較する。
ここでは、ポイントベースの比較尺度に基づいて構築する代わりに、ハードクラスタリングに関する文献から古典的な手法に基づいて構築する。
本稿では,データセットのサンプルを用いて表現空間をフィンガープリントする手法を提案する。
論文 参考訳(メタデータ) (2024-05-31T17:33:07Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.972599673048582]
汎用データのためのエンドツーエンドのディープラーニングベースのMVCフレームワークを提案する。
我々のアプローチは、新しい置換に基づく正準相関目標を用いて有意義な融合データ表現を学習することである。
10つのMVCベンチマークデータセットを用いて、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - One for all: A novel Dual-space Co-training baseline for Large-scale
Multi-View Clustering [42.92751228313385]
我々は、Dual-space Co-training Large-scale Multi-view Clustering (DSCMC)という新しいマルチビュークラスタリングモデルを提案する。
提案手法の主な目的は,2つの異なる空間における協調学習を活用することにより,クラスタリング性能を向上させることである。
我々のアルゴリズムは近似線形計算複雑性を持ち、大規模データセットへの適用が成功することを保証している。
論文 参考訳(メタデータ) (2024-01-28T16:30:13Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Metric Distribution to Vector: Constructing Data Representation via
Broad-Scale Discrepancies [15.40538348604094]
本稿では,各データに対するベクトル表現に分布特性を抽出するために, $mathbfMetricDistribution2vec$ という新しい埋め込み方式を提案する。
本研究では,広範囲な実世界構造グラフデータセット上での教師付き予測タスクにおける表現法の適用と有効性を示す。
論文 参考訳(メタデータ) (2022-10-02T03:18:30Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - Explaining dimensionality reduction results using Shapley values [0.0]
次元還元(dr)技術は様々な応用において一貫して高次元データ分析をサポートする。
DR技法を解釈するために設計された現在の文献的アプローチは、低次元表現のみに焦点を当てたり、特徴間の関係を考慮しないため、特徴の寄与をうまく説明できない。
本稿では,これらの問題に対処するために,Shapley値を用いて次元削減手法の説明を生成し,クラスタ指向解析を用いてこれらのアルゴリズムを解釈する。
論文 参考訳(メタデータ) (2021-03-09T19:28:10Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。