論文の概要: Explainable Graph Spectral Clustering of Text Documents
- arxiv url: http://arxiv.org/abs/2308.00504v1
- Date: Tue, 1 Aug 2023 12:39:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 14:11:36.827181
- Title: Explainable Graph Spectral Clustering of Text Documents
- Title(参考訳): テキスト文書の説明可能なグラフスペクトルクラスタリング
- Authors: Bart{\l}omiej Starosta, Mieczys{\l}aw A. K{\l}opotek, S{\l}awomir T.
Wierzcho\'n
- Abstract要約: 本稿では,ラプラシアン系グラフスペクトルクラスタリングの結果を説明することを提案する。
これはラプラシアン埋め込み(英語版)、$K$-埋め込み(この論文で提案されている)および項ベクトル空間埋め込み(英語版)の同値性(近似)を示すことに基づいている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spectral clustering methods are known for their ability to represent clusters
of diverse shapes, densities etc. However, results of such algorithms, when
applied e.g. to text documents, are hard to explain to the user, especially due
to embedding in the spectral space which has no obvious relation to document
contents. Therefore there is an urgent need to elaborate methods for explaining
the outcome of the clustering. This paper presents a contribution towards this
goal. We present a proposal of explanation of results of combinatorial
Laplacian based graph spectral clustering. It is based on showing (approximate)
equivalence of combinatorial Laplacian embedding, $K$-embedding (proposed in
this paper) and term vector space embedding. Hence a bridge is constructed
between the textual contents and the clustering results. We provide theoretical
background for this approach. We performed experimental study showing that
$K$-embedding approximates well Laplacian embedding under favourable block
matrix conditions and show that approximation is good enough under other
conditions.
- Abstract(参考訳): スペクトルクラスタリング法は、様々な形状や密度のクラスタを表現できることで知られている。
しかし、例えばテキスト文書に適用した場合、特に文書の内容と明確な関係を持たないスペクトル空間に埋め込まれているため、そのようなアルゴリズムの結果をユーザに説明するのは難しい。
そのため、クラスタリングの結果を説明するための詳細な方法が必要不可欠である。
本稿では,この目標への貢献について述べる。
本稿では,組合せラプラシアン系グラフスペクトルクラスタリングの結果について考察する。
これは組合せラプラシアン埋め込み、$K$-埋め込み(この論文で提案されている)および項ベクトル空間埋め込みの同値性を示すことに基づいている。
したがって、テキストの内容とクラスタリング結果との間にブリッジが構築される。
このアプローチの理論的背景を提供する。
k$-embedding は好適なブロック行列条件下でのラプラシアン埋め込みをよく示し、他の条件下では近似が十分であることを示した。
関連論文リスト
- Reliable Node Similarity Matrix Guided Contrastive Graph Clustering [51.23437296378319]
我々は、新しいフレームワーク、Reliable Node similarity Matrix Guided Contrastive Graph Clustering (NS4GC)を紹介した。
本手法は,ノード近傍のアライメントとセマンティック・アウェア・スパリフィケーションを導入し,ノード類似度行列が正確かつ効率的にスパースであることを保証する。
論文 参考訳(メタデータ) (2024-08-07T13:36:03Z) - Label Learning Method Based on Tensor Projection [82.51786483693206]
テンソルプロジェクション(LLMTP)に基づくラベル学習手法を提案する。
行列射影変換をテンソル射影に拡張し、ビュー間の空間構造情報を活用できるようにする。
さらに、テンソルのSchatten $p$-norm正規化を導入し、異なるビューのクラスタリングラベル行列を可能な限り一貫性を持たせる。
論文 参考訳(メタデータ) (2024-02-26T13:03:26Z) - The Manifold Hypothesis for Gradient-Based Explanations [55.01671263121624]
勾配に基づく説明アルゴリズムは知覚的に整合した説明を提供する。
特徴属性がデータの接する空間と一致しているほど、知覚的に一致している傾向にあることを示す。
説明アルゴリズムは、その説明をデータ多様体と整合させるよう積極的に努力すべきである。
論文 参考訳(メタデータ) (2022-06-15T08:49:24Z) - Nonbacktracking spectral clustering of nonuniform hypergraphs [2.408714894793063]
非一様ハイパーグラフに対するスペクトルクラスタリングをハイパーグラフ非追跡演算子を用いて検討する。
本稿では,線形化された信念伝達を用いたハイパーグラフブロックモデルにおける推論の交互化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-27T01:14:06Z) - On consistency of constrained spectral clustering under
representation-aware stochastic block model [20.6072287343024]
制約付きスペクトルクラスタリングは、与えられたテクスト類似性グラフ$mathcalG$でバランスの取れたクラスタを見つけることを目的として研究される。
この環境では、スペクトルクラスタリングの非正規化および正規化の変種を開発する。
これらのアルゴリズムは$mathcalR$を使用して、提案された制約をほぼ満たした$mathcalG$のクラスタを見つける。
論文 参考訳(メタデータ) (2022-03-03T20:41:14Z) - Spectral-Spatial Global Graph Reasoning for Hyperspectral Image
Classification [50.899576891296235]
畳み込みニューラルネットワークは、ハイパースペクトル画像分類に広く応用されている。
近年の手法は空間トポロジのグラフ畳み込みによってこの問題に対処しようとしている。
論文 参考訳(メタデータ) (2021-06-26T06:24:51Z) - Towards Clustering-friendly Representations: Subspace Clustering via
Graph Filtering [16.60975509085194]
本稿では,スムーズな表現を実現するグラフフィルタリング手法を提案する。
画像および文書クラスタリングデータセットの実験により、我々の手法は最先端のサブスペースクラスタリング技術により改善されていることを示す。
アブレーション研究では、グラフフィルタリングがノイズを除去し、画像の構造を保存し、クラスの分離性を高めることが示されている。
論文 参考訳(メタデータ) (2021-06-18T02:21:36Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Deep Descriptive Clustering [24.237000220172906]
本稿では,解釈可能なタグを用いた説明を同時に生成しながら,複雑なデータに対してクラスタリングを行うための新しい設定について検討する。
我々は,入力に対する経験的分布と,クラスタリング目的に対して誘導されたクラスタリングラベルの相互情報を最大化することにより,優れたクラスタを形成する。
公開データによる実験結果から,クラスタリング性能の競争ベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2021-05-24T21:40:16Z) - The Mathematics Behind Spectral Clustering And The Equivalence To PCA [0.16447597767676655]
本稿では、グラフラプラシアンが完全連結であるか否かに基づいて、スペクトルクラスタリングを2つのカテゴリに分けて説明する。
本稿では,完全連結グラフに対して,対象関数を提供することで次元縮小部を示す。
マルチコネクテッドグラフの場合、この論文は、適切な $k$ の場合、最初の $k$ eigenvectors が接続されたコンポーネントの指標であることを証明します。
論文 参考訳(メタデータ) (2021-03-01T03:42:38Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。