論文の概要: TANGO: Clustering with Typicality-Aware Nonlocal Mode-Seeking and Graph-Cut Optimization
- arxiv url: http://arxiv.org/abs/2408.10084v2
- Date: Thu, 05 Jun 2025 06:47:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.170563
- Title: TANGO: Clustering with Typicality-Aware Nonlocal Mode-Seeking and Graph-Cut Optimization
- Title(参考訳): TANGO: 通常性を考慮した非局所モード探索とグラフカット最適化によるクラスタリング
- Authors: Haowen Ma, Zhiguo Long, Hua Meng,
- Abstract要約: 密度に基づくモード探索法は,低密度点から高密度近傍への遠心依存性を生成する。
両言語の観点から, 局所的に定義された依存関係を探索することにより, 固有性という新しい概念を導入する。
我々は,グローバルビューの典型性を利用して,モードを効果的かつ効率的に識別するアルゴリズムを考案する。
- 参考スコア(独自算出の注目度): 2.4783546111391215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Density-based mode-seeking methods generate a \emph{density-ascending dependency} from low-density points towards higher-density neighbors. Current mode-seeking methods identify modes by breaking some dependency connections, but relying heavily on local data characteristics, requiring case-by-case threshold settings or human intervention to be effective for different datasets. To address this issue, we introduce a novel concept called \emph{typicality}, by exploring the \emph{locally defined} dependency from a \emph{global} perspective, to quantify how confident a point would be a mode. We devise an algorithm that effectively and efficiently identifies modes with the help of the global-view typicality. To implement and validate our idea, we design a clustering method called TANGO, which not only leverages typicality to detect modes, but also utilizes graph-cut with an improved \emph{path-based similarity} to aggregate data into the final clusters. Moreover, this paper also provides some theoretical analysis on the proposed algorithm. Experimental results on several synthetic and extensive real-world datasets demonstrate the effectiveness and superiority of TANGO. The code is available at https://github.com/SWJTU-ML/TANGO_code.
- Abstract(参考訳): 密度に基づくモード探索法は、低密度点から高密度近傍への 'emph{density- Ascending dependency} を生成する。
現在のモード検索方法は、いくつかの依存関係接続を壊すことでモードを識別するが、異なるデータセットに有効であるためには、ケースバイケースのしきい値の設定や人間の介入を必要とする、ローカルなデータ特性に大きく依存する。
この問題に対処するために、ある点がモードであるかどうかを定量化するために、 \emph{locally defined} の依存関係を \emph{global} の観点から探索することで、 \emph{typicality} という新しい概念を導入する。
我々は,グローバルビューの典型性を利用して,モードを効果的かつ効率的に識別するアルゴリズムを考案する。
提案手法の実装と検証のために,TANGOと呼ばれるクラスタリング手法を設計し,モード検出に典型性を活用するだけでなく,改良された 'emph{path-based similarity} でグラフカットを用いて最終クラスタにデータを集約する。
さらに,提案手法の理論的解析も行う。
いくつかの人工的および広範囲な実世界のデータセットの実験結果は、TANGOの有効性と優位性を示している。
コードはhttps://github.com/SWJTU-ML/TANGO_codeで公開されている。
関連論文リスト
- Graph-based Semi-supervised and Unsupervised Methods for Local Clustering [0.0]
局所クラスタリングは、グラフ全体の知識を必要とせずに、大きなグラフ内の特定のサブ構造を特定することを目的としている。
まず,ラベル付きデータが少ない場合に特定局所クラスタを特定する手法を提案し,これを半教師付き局所クラスタリングと呼ぶ。
次に、ラベルに関する事前情報がない場合に、このアプローチを教師なしの設定に拡張します。
論文 参考訳(メタデータ) (2025-04-28T02:10:18Z) - Towards Learnable Anchor for Deep Multi-View Clustering [49.767879678193005]
本稿では,線形時間でクラスタリングを行うDeep Multi-view Anchor Clustering (DMAC)モデルを提案する。
最適なアンカーを用いて、全サンプルグラフを計算し、クラスタリングのための識別的埋め込みを導出する。
いくつかのデータセットの実験では、最先端の競合に比べてDMACの性能と効率が優れていることが示されている。
論文 参考訳(メタデータ) (2025-03-16T09:38:11Z) - Graph Probability Aggregation Clustering [5.377020739388736]
本稿では,グローバルクラスタリング対象関数と局所クラスタリング制約を統一するグラフベースのファジィクラスタリングアルゴリズムを提案する。
GPACフレームワーク全体は多制約最適化問題として定式化され、ラグランジアン法を用いて解くことができる。
合成,実世界,ディープラーニングのデータセットを用いて行った実験は,GPACがクラスタリング性能において既存の最先端手法を超えるだけでなく,計算効率も優れていることを示した。
論文 参考訳(メタデータ) (2025-02-27T09:11:32Z) - ACTGNN: Assessment of Clustering Tendency with Synthetically-Trained Graph Neural Networks [4.668678950572517]
ACTGNNは、データのグラフ表現を利用してクラスタリング傾向を評価するために設計されたグラフベースのフレームワークである。
グラフニューラルネットワーク(GNN)は、合成データセットのみにトレーニングされており、クラスタ構造を堅牢に学習することができる。
その結果,提案手法の一般化性と有効性を強調し,ロバストなクラスタリング傾向評価のための有望なツールとなった。
論文 参考訳(メタデータ) (2025-01-30T03:31:26Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Clustering by Mining Density Distributions and Splitting Manifold Structure [2.3759432635713895]
近年,スペクトルクラスタリングの効率向上のためのトップダウン手法が提案されている。
本稿では,局所構造からマイクロクラスターを得る方法を提案する。
その後、最終的なスペクトルクラスタリングのために、マイクロクラスタ間の新しい類似度尺度が提案される。
論文 参考訳(メタデータ) (2024-08-20T02:22:59Z) - Rethinking Clustered Federated Learning in NOMA Enhanced Wireless
Networks [60.09912912343705]
本研究では,新しいクラスタ化フェデレーション学習(CFL)アプローチと,非独立かつ同一に分散した(非IID)データセットを統合することのメリットについて検討する。
データ分布における非IIDの度合いを測定する一般化ギャップの詳細な理論的解析について述べる。
非IID条件によって引き起こされる課題に対処する解決策は、特性の分析によって提案される。
論文 参考訳(メタデータ) (2024-03-05T17:49:09Z) - Deep Embedding Clustering Driven by Sample Stability [16.53706617383543]
サンプル安定性(DECS)により駆動されるディープ埋め込みクラスタリングアルゴリズムを提案する。
具体的には、まずオートエンコーダで初期特徴空間を構築し、次にサンプル安定性に制約されたクラスタ指向の埋め込み機能を学ぶ。
5つのデータセットに対する実験結果から,提案手法は最先端のクラスタリング手法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-01-29T09:19:49Z) - Graph-based Semi-supervised Local Clustering with Few Labeled Nodes [6.493238575291165]
局所クラスタリングは、グラフ構造全体を知る必要なく、グラフ内の局所構造を抽出することを目的としている。
少数のラベル付きノードを用いた半教師付き局所クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2022-11-20T22:55:07Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Clustered Federated Learning via Generalized Total Variation
Minimization [83.26141667853057]
本研究では,分散ネットワーク構造を持つローカルデータセットの局所的(あるいはパーソナライズされた)モデルを学習するための最適化手法について検討する。
我々の主要な概念的貢献は、総変動最小化(GTV)としてフェデレーション学習を定式化することである。
私たちのアルゴリズムの主な貢献は、完全に分散化されたフェデレーション学習アルゴリズムです。
論文 参考訳(メタデータ) (2021-05-26T18:07:19Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Locally induced Gaussian processes for large-scale simulation
experiments [0.0]
本稿では,ポイントの配置とその多さを病理学的に抑制できることを示す。
提案手法は,グローバルなインジェクションポイントとデータサブセットに基づく局所GP近似をハイブリダイズする。
計算効率のフロンティアにおいて,局所誘導点がグローバルおよびデータサブセットの構成要素を拡張していることを示す。
論文 参考訳(メタデータ) (2020-08-28T21:37:46Z) - CycleCluster: Modernising Clustering Regularisation for Deep
Semi-Supervised Classification [0.0]
深層半教師付き分類のための新しいフレームワークであるCycleClusterを提案する。
我々のコア最適化は、グラフベースの擬似ラベルと共有深層ネットワークとともに、新たなクラスタリングベースの正規化によって推進されます。
論文 参考訳(メタデータ) (2020-01-15T13:34:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。