論文の概要: Forest Fire Clustering: Cluster-oriented Label Propagation Clustering
and Monte Carlo Verification Inspired by Forest Fire Dynamics
- arxiv url: http://arxiv.org/abs/2103.11802v1
- Date: Mon, 22 Mar 2021 13:02:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 01:05:24.937714
- Title: Forest Fire Clustering: Cluster-oriented Label Propagation Clustering
and Monte Carlo Verification Inspired by Forest Fire Dynamics
- Title(参考訳): 森林火災のクラスタリング:森林火災のダイナミクスに触発されたクラスター指向ラベル伝播クラスタリングとモンテカルロ検証
- Authors: Zhanlin Chen, Philip Tuckman, Jing Zhang, Mark Gerstein
- Abstract要約: 本稿では,ロバストクラスタを見つけるだけでなく,各データポイントのラベルに対する信頼性スコアを提供する新しい手法を提案する。
具体的には,森林火災後のモデルにラベル伝播クラスタリングを再構成した。
- 参考スコア(独自算出の注目度): 4.645676097881571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering methods group data points together and assign them group-level
labels. However, it has been difficult to evaluate the confidence of the
clustering results. Here, we introduce a novel method that could not only find
robust clusters but also provide a confidence score for the labels of each data
point. Specifically, we reformulated label-propagation clustering to model
after forest fire dynamics. The method has only one parameter - a fire
temperature term describing how easily one label propagates from one node to
the next. Through iteratively starting label propagations through a graph, we
can discover the number of clusters in a dataset with minimum prior
assumptions. Further, we can validate our predictions and uncover the posterior
probability distribution of the labels using Monte Carlo simulations. Lastly,
our iterative method is inductive and does not need to be retrained with the
arrival of new data. Here, we describe the method and provide a summary of how
the method performs against common clustering benchmarks.
- Abstract(参考訳): クラスタリングメソッドはデータポイントをグループ化し、グループレベルのラベルを割り当てる。
しかし,クラスタリング結果の信頼性を評価することは困難であった。
本稿では,ロバストなクラスタを見つけるだけでなく,各データポイントのラベルに対する信頼度スコアを提供する手法を提案する。
具体的には,森林火災後のモデルにラベル伝播クラスタリングを再構成した。
この方法は1つのパラメータしか持たず、1つのラベルが1つのノードから次のノードへいかに簡単に伝播するかを記述する火温度用語である。
グラフを通してラベルの伝播を反復的に開始することで、最小の事前仮定でデータセット内のクラスタ数を発見できる。
さらに, モンテカルロシミュレーションを用いて, 我々の予測を検証し, ラベルの後方確率分布を明らかにする。
最後に,本手法は帰納的であり,新データの到着時に再学習する必要はない。
本稿では,本手法が一般的なクラスタリングベンチマークに対してどのように機能するかを概説する。
関連論文リスト
- Graph Contrastive Learning via Cluster-refined Negative Sampling for Semi-supervised Text Classification [22.476289610168056]
グラフコントラスト学習(GCL)はテキスト分類タスクに広く応用されている。
既存のGCLベースのテキスト分類手法は、しばしば負のサンプリングバイアスに悩まされる。
本稿では,クラスタ教師付き負サンプリングによるグラフコントラスト学習の革新的なGCL手法を提案する。
論文 参考訳(メタデータ) (2024-10-18T16:03:49Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Local Graph Clustering with Noisy Labels [8.142265733890918]
本稿では,ノード情報追加のプロキシとしてノイズの多いノードラベルを用いた局所グラフクラスタリングを提案する。
この設定では、ノードはクラスタのアフィリエイトに基づいて初期バイナリラベルを受け取る。
属性グラフから数個のサンプルを用いて,信頼性の高いノードラベルが得られることを示す。
論文 参考訳(メタデータ) (2023-10-12T04:37:15Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Actively Supervised Clustering for Open Relation Extraction [42.114747195195655]
本稿では,OpenREのためのアクティブなクラスタリングという,新しい設定を提案する。
設定の鍵は、どのインスタンスにラベルを付けるかを選択することである。
本稿では,未知の関係のクラスタを動的に発見する手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T06:55:02Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Out-of-Distribution Detection without Class Labels [29.606812876314386]
異常検出方法は、データセットの正常な振る舞いから逸脱するサンプルを識別する。
現在の方法は、複数のクラスで構成されるがラベルを持たないトレーニングデータに直面すると苦労する。
まず,自己教師付き手法を用いて画像のクラスタ化を行い,各画像のクラスタラベルを取得する。
クラスタラベルによる画像の分類作業において,事前学習した特徴を微調整する。
論文 参考訳(メタデータ) (2021-12-14T18:58:32Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。