論文の概要: Measuring inter-cluster similarities with Alpha Shape TRIangulation in
loCal Subspaces (ASTRICS) facilitates visualization and clustering of
high-dimensional data
- arxiv url: http://arxiv.org/abs/2107.07603v1
- Date: Thu, 15 Jul 2021 20:51:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 00:29:52.493240
- Title: Measuring inter-cluster similarities with Alpha Shape TRIangulation in
loCal Subspaces (ASTRICS) facilitates visualization and clustering of
high-dimensional data
- Title(参考訳): 高次元データの可視化とクラスタリングを容易にするloCal Subspaces(ASTRICS)におけるAlpha Shape triangulationによるクラスタ間類似度の測定
- Authors: Joshua M. Scurll
- Abstract要約: 高次元(HD)データのクラスタリングと可視化は、様々な分野において重要なタスクである。
HDデータをクラスタリングする最も効果的なアルゴリズムは、グラフ内のノードによってデータを表現することに基づいている。
本稿では,HDデータポイントのクラスタ間の類似性を計測するASTRICSという手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering and visualizing high-dimensional (HD) data are important tasks in
a variety of fields. For example, in bioinformatics, they are crucial for
analyses of single-cell data such as mass cytometry (CyTOF) data. Some of the
most effective algorithms for clustering HD data are based on representing the
data by nodes in a graph, with edges connecting neighbouring nodes according to
some measure of similarity or distance. However, users of graph-based
algorithms are typically faced with the critical but challenging task of
choosing the value of an input parameter that sets the size of neighbourhoods
in the graph, e.g. the number of nearest neighbours to which to connect each
node or a threshold distance for connecting nodes. The burden on the user could
be alleviated by a measure of inter-node similarity that can have value 0 for
dissimilar nodes without requiring any user-defined parameters or thresholds.
This would determine the neighbourhoods automatically while still yielding a
sparse graph. To this end, I propose a new method called ASTRICS to measure
similarity between clusters of HD data points based on local dimensionality
reduction and triangulation of critical alpha shapes. I show that my ASTRICS
similarity measure can facilitate both clustering and visualization of HD data
by using it in Stage 2 of a three-stage pipeline: Stage 1 = perform an initial
clustering of the data by any method; Stage 2 = let graph nodes represent
initial clusters instead of individual data points and use ASTRICS to
automatically define edges between nodes; Stage 3 = use the graph for further
clustering and visualization. This trades the critical task of choosing a graph
neighbourhood size for the easier task of essentially choosing a resolution at
which to view the data. The graph and consequently downstream clustering and
visualization are then automatically adapted to the chosen resolution.
- Abstract(参考訳): 高次元(HD)データのクラスタリングと可視化は、様々な分野において重要なタスクである。
例えば、バイオインフォマティクスでは、質量サイトメトリー(CyTOF)データのような単細胞データの解析に重要である。
hdデータをクラスタリングするための最も効果的なアルゴリズムは、グラフ内のノードによるデータ表現に基づいており、エッジは類似度や距離の尺度に従って隣接ノードを接続している。
しかし、グラフベースのアルゴリズムのユーザは一般的に、グラフ内の近傍のサイズを設定する入力パラメータの値を選択するという、批判的だが難しい課題に直面している。
ノードを接続するための各ノードまたは閾値距離を接続する最も近い隣人の数。
ユーザに対する負担は、ユーザ定義パラメータやしきい値を必要としない、異種ノードの値0を持つノード間の類似度の測定によって軽減される可能性がある。
これは、スパースグラフを産み出しながら自動的に近隣を判断する。
そこで本研究では, 局所次元減少と臨界アルファ形状の三角測量に基づくHDデータポイントのクラスタ間類似度を測定するASTRICSという手法を提案する。
ステージ1 = 任意の方法でデータの初期クラスタリングを実行し、ステージ2 = 個々のデータポイントの代わりにグラフノードを初期クラスタとして表現し、ノード間のエッジを自動的に定義するためにastricsを使用します。
これは、データを見るための解決法を本質的に選択するより簡単なタスクのために、グラフ近傍のサイズを選択するという重要なタスクを交換する。
グラフとダウンストリームのクラスタリングと視覚化は、選択した解像度に自動的に適応される。
関連論文リスト
- Cluster-based Graph Collaborative Filtering [55.929052969825825]
グラフ畳み込みネットワーク(GCN)は、レコメンデーションシステムのためのユーザおよびアイテム表現の学習に成功している。
既存のGCNベースのほとんどのメソッドは、高階グラフ畳み込みを実行しながら、ユーザの複数の関心事を見落としている。
クラスタベースグラフ協調フィルタリング(ClusterGCF)と呼ばれる新しいGCNベースのレコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2024-04-16T07:05:16Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Learning Optimal Graph Filters for Clustering of Attributed Graphs [20.810096547938166]
多くの現実世界のシステムは、システム内の異なるエンティティがノードによって表現され、エッジによって相互作用するグラフとして表現することができる。
グラフィカルな構造を持つ大規模なデータセットを研究する上で重要なタスクはグラフクラスタリングである。
本稿では,FIR(Finite Impulse Response)およびARMA(Autoregressive moving Average)グラフフィルタのパラメータをクラスタリングに最適化したグラフ信号処理手法を提案する。
論文 参考訳(メタデータ) (2022-11-09T01:49:23Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - Seeing All From a Few: Nodes Selection Using Graph Pooling for Graph
Clustering [37.68977275752782]
ノイズの多いエッジとグラフのノードは、クラスタリング結果を悪化させる可能性がある。
ノイズの多いノードやエッジに対するグラフクラスタリングの堅牢性を改善するために,新しいデュアルグラフ埋め込みネットワーク(DGEN)を提案する。
3つのベンチマークグラフデータセットの実験は、いくつかの最先端アルゴリズムと比較して優位性を示す。
論文 参考訳(メタデータ) (2021-04-30T06:51:51Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Graph InfoClust: Leveraging cluster-level node information for
unsupervised graph representation learning [12.592903558338444]
本稿では,グラフ InfoClust というグラフ表現学習手法を提案する。
同社はさらに、クラスタレベルの情報コンテンツをキャプチャしようとしている。
この最適化により、ノード表現はよりリッチな情報とノイズ相互作用をキャプチャし、それによって品質が向上する。
論文 参考訳(メタデータ) (2020-09-15T09:33:20Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。