論文の概要: Dimension Reduction with Locally Adjusted Graphs
- arxiv url: http://arxiv.org/abs/2412.15426v1
- Date: Thu, 19 Dec 2024 22:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:23:21.716505
- Title: Dimension Reduction with Locally Adjusted Graphs
- Title(参考訳): 局所調整グラフによる次元削減
- Authors: Yingfan Wang, Yiyang Sun, Haiyang Huang, Cynthia Rudin,
- Abstract要約: LocalMAPは、この課題に対処するためにグラフを動的かつ局所的に調整する次元削減アルゴリズムである。
生物データセットのケーススタディを通じて、ローカルマップの利点を実証する。
- 参考スコア(独自算出の注目度): 20.06041784058165
- License:
- Abstract: Dimension reduction (DR) algorithms have proven to be extremely useful for gaining insight into large-scale high-dimensional datasets, particularly finding clusters in transcriptomic data. The initial phase of these DR methods often involves converting the original high-dimensional data into a graph. In this graph, each edge represents the similarity or dissimilarity between pairs of data points. However, this graph is frequently suboptimal due to unreliable high-dimensional distances and the limited information extracted from the high-dimensional data. This problem is exacerbated as the dataset size increases. If we reduce the size of the dataset by selecting points for a specific sections of the embeddings, the clusters observed through DR are more separable since the extracted subgraphs are more reliable. In this paper, we introduce LocalMAP, a new dimensionality reduction algorithm that dynamically and locally adjusts the graph to address this challenge. By dynamically extracting subgraphs and updating the graph on-the-fly, LocalMAP is capable of identifying and separating real clusters within the data that other DR methods may overlook or combine. We demonstrate the benefits of LocalMAP through a case study on biological datasets, highlighting its utility in helping users more accurately identify clusters for real-world problems.
- Abstract(参考訳): 次元減少(DR)アルゴリズムは大規模高次元データセットの洞察を得るのに非常に有用であることが証明されている。
これらのDR法の初期フェーズでは、しばしば元の高次元データをグラフに変換する。
このグラフでは、各エッジはデータポイントのペア間の類似性または相似性を表す。
しかし、このグラフは信頼できない高次元距離と高次元データから抽出された限られた情報により、しばしば準最適である。
この問題はデータセットのサイズが大きくなるにつれて悪化する。
埋め込みの特定の部分の点を選択することでデータセットのサイズを縮小すると、抽出した部分グラフがより信頼性が高いため、DRを通して観測されたクラスタはより分離可能である。
本稿では,この課題に対処するために,グラフを動的かつ局所的に調整する新しい次元削減アルゴリズムであるLocalMAPを紹介する。
サブグラフを動的に抽出し、グラフをオンザフライで更新することで、LocalMAPは、他のDRメソッドが見落としたり、組み合わせたりする可能性のあるデータ内の実際のクラスタを識別し、分離することができる。
生物データセットのケーススタディを通じてLocalMAPの利点を実証し,実世界の問題に対するクラスタをより正確に識別する上で,その有用性を強調した。
関連論文リスト
- Noncommutative Model Selection for Data Clustering and Dimension Reduction Using Relative von Neumann Entropy [0.0]
教師なし分類と次元削減のためのデータ駆動型アルゴリズムのペアを提案する。
我々の実験では、クラスタリングアルゴリズムは、非自明な幾何学とトポロジを持つデータセット上の$k$-meansクラスタリングよりも優れています。
論文 参考訳(メタデータ) (2024-11-29T18:04:11Z) - Locally Regularized Sparse Graph by Fast Proximal Gradient Descent [6.882546996728011]
本稿では,SRSG を短縮した新しい正規化スパースグラフを提案する。
スパースグラフは高次元データのクラスタリングに有効であることが示されている。
SRSGは他のクラスタリング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-09-25T16:57:47Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - Visual Cluster Separation Using High-Dimensional Sharpened
Dimensionality Reduction [65.80631307271705]
高次元シャープ化DR(HD-SDR)は、合成データセットと実世界のデータセットの両方で試験される。
提案手法は,高品質(品質指標による測定)を達成し,大規模高次元データを用いて計算的に精度よくスケールする。
具体的な応用を説明するため,近年の天文カタログにHD-SDRを適用した。
論文 参考訳(メタデータ) (2021-10-01T11:13:51Z) - Measuring inter-cluster similarities with Alpha Shape TRIangulation in
loCal Subspaces (ASTRICS) facilitates visualization and clustering of
high-dimensional data [0.0]
高次元(HD)データのクラスタリングと可視化は、様々な分野において重要なタスクである。
HDデータをクラスタリングする最も効果的なアルゴリズムは、グラフ内のノードによってデータを表現することに基づいている。
本稿では,HDデータポイントのクラスタ間の類似性を計測するASTRICSという手法を提案する。
論文 参考訳(メタデータ) (2021-07-15T20:51:06Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Dimensionality Reduction via Diffusion Map Improved with Supervised
Linear Projection [1.7513645771137178]
本稿では、データサンプルが1つの基礎となる滑らかな多様体上に存在すると仮定する。
ペアワイズローカルカーネル距離を用いてクラス内およびクラス間類似性を定義する。
クラス内類似度を最大化し、クラス間類似度を同時に最小化する線形射影を求める。
論文 参考訳(メタデータ) (2020-08-08T04:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。