論文の概要: Efficient Algorithms for Generating Provably Near-Optimal Cluster
Descriptors for Explainability
- arxiv url: http://arxiv.org/abs/2002.02487v1
- Date: Thu, 6 Feb 2020 19:49:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 13:04:30.917746
- Title: Efficient Algorithms for Generating Provably Near-Optimal Cluster
Descriptors for Explainability
- Title(参考訳): 説明可能なクラスタ記述子を生成するための効率的なアルゴリズム
- Authors: Prathyush Sambaturu, Aparna Gupta, Ian Davidson, S. S. Ravi, Anil
Vullikanti, Andrew Warren
- Abstract要約: 本稿では,クラスタに対する簡潔な表現を構築するための最近のアプローチを拡張して,クラスタをより解釈しやすくする問題について検討する。
我々は,その問題に対する性能保証を証明可能な近似アルゴリズムを開発した。
また、異なる脅威レベルを表すゲノム配列のクラスタを含むデータセットからのクラスタを説明するアプリケーションを示す。
- 参考スコア(独自算出の注目度): 36.11663695534294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Improving the explainability of the results from machine learning methods has
become an important research goal. Here, we study the problem of making
clusters more interpretable by extending a recent approach of [Davidson et al.,
NeurIPS 2018] for constructing succinct representations for clusters. Given a
set of objects $S$, a partition $\pi$ of $S$ (into clusters), and a universe
$T$ of tags such that each element in $S$ is associated with a subset of tags,
the goal is to find a representative set of tags for each cluster such that
those sets are pairwise-disjoint and the total size of all the representatives
is minimized. Since this problem is NP-hard in general, we develop
approximation algorithms with provable performance guarantees for the problem.
We also show applications to explain clusters from datasets, including clusters
of genomic sequences that represent different threat levels.
- Abstract(参考訳): 機械学習手法による結果の説明可能性の向上は重要な研究目標となっている。
本稿では,クラスタの簡潔な表現を構築するための[Davidson et al., NeurIPS 2018]の最近のアプローチを拡張して,クラスタをより解釈しやすいものにする問題について検討する。
オブジェクトのセット$s$、パーティション$\pi$ of $s$(クラスタ内)、および、$s$の各要素がタグのサブセットに関連付けられるようなタグのユニバース$t$が与えられたとき、これらのセットがペアワイズに分離され、すべての代表者の合計サイズが最小になるように、各クラスタの代表的なタグセットを見つけることが目標である。
この問題は一般にnpハードであるため,問題に対する性能保証が可能な近似アルゴリズムを開発した。
また、異なる脅威レベルを表すゲノム配列のクラスタを含むデータセットからのクラスタを説明するアプリケーションを示す。
関連論文リスト
- Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Convex Clustering through MM: An Efficient Algorithm to Perform
Hierarchical Clustering [1.0589208420411012]
本稿では,クラスタ融合と高効率更新方式を用いた反復アルゴリズムCCMMによる凸クラスタリングを提案する。
現在のデスクトップコンピュータでは、CCMMは、7次元空間に100万以上のオブジェクトを含む凸クラスタリング問題を効率的に解決する。
論文 参考訳(メタデータ) (2022-11-03T15:07:51Z) - Towards Practical Explainability with Cluster Descriptors [3.899688920770429]
本稿では,クラスタ記述子を解析することにより,クラスタをより説明しやすいものにすることの課題について検討する。
目標は、クラスタディスクリプタと呼ばれる各クラスタの代表的なタグセットを見つけることだ。
本稿では,説明可能性に寄与せず,クラスタを十分に区別しないタグが最適記述子に追加されないような,従来のモデルを強化する新しい説明可能性モデルを提案する。
論文 参考訳(メタデータ) (2022-10-18T01:53:43Z) - How to Find a Good Explanation for Clustering? [7.951746797489421]
Moshkovitz氏、Dasgupta氏、Rashtchian氏、Frost氏(ICML 2020)は、説明可能な$k$-meansと$k$-medianクラスタリングのエレガントなモデルを提案した。
説明可能なクラスタリングに関する2つの自然なアルゴリズム的問題について検討する。
厳密なアルゴリズム分析では、入力サイズ、データの寸法、外乱数、クラスタ数、近似比といったパラメータが、説明可能なクラスタリングの計算複雑性に与える影響について光を当てています。
論文 参考訳(メタデータ) (2021-12-13T11:48:38Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Exact Recovery of Mangled Clusters with Same-Cluster Queries [20.03712152278538]
半教師付きアクティブクラスタリングフレームワークにおけるクラスタリカバリ問題について検討する。
我々は、$n$ポイントを$k$クラスタに分割するアルゴリズムを設計し、$O(k3 ln k ln n)$oracleクエリと$tildeO(kn + k3)$でクラスタを非分類エラーで復元する。
論文 参考訳(メタデータ) (2020-06-08T15:27:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。