論文の概要: R-Shiny Applications for Local Clustering to be Included in the growclusters for R Package
- arxiv url: http://arxiv.org/abs/2304.06145v2
- Date: Mon, 29 Apr 2024 18:22:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-01 20:17:07.626482
- Title: R-Shiny Applications for Local Clustering to be Included in the growclusters for R Package
- Title(参考訳): ローカルクラスタリングのためのR-ShinyのRパッケージ用グロークラスタへの応用
- Authors: Randall Powers, Wendy Martinez, Terrance Savitsky,
- Abstract要約: 本稿では、クラスタリング手法を実装し、既知のグループ構造を持つデータセットをシミュレートするR Shinyアプリケーションに焦点を当てる。
これらのアプリケーションはクラスタリングの結果を可視化する新しい方法を実装している。
労働統計局(BLS)による2000-2013年記事の収集から得られたデータは、R-Shinyの応用を説明するために使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: growclusters for R is a package that estimates a partition structure for multivariate data. It does this by implementing a hierarchical version of k-means clustering that accounts for possible known dependencies in a collection of datasets, where each set draws its cluster means from a single, global partition. Each component data set in the collection corresponds to a known group in the data. This paper focuses on R Shiny applications that implement the clustering methodology and simulate data sets with known group structures. These Shiny applications implement novel ways of visualizing the results of the clustering. These visualizations include scatterplots of individual data sets in the context of the entire collection and cluster distributions versus component (or sub-domain) datasets. Data obtained from a collection of 2000-2013 articles from the Bureau of Labor Statistics (BLS) Monthly Labor Review (MLR) will be used to illustrate the R-Shiny applications. Here, the known grouping in the collection is the year of publication.
- Abstract(参考訳): growclusters for Rは、多変量データのパーティション構造を推定するパッケージである。
k-meansクラスタリングの階層的なバージョンを実装し、データセットの集合において既知の依存関係を考慮し、各セットがそのクラスタをひとつのグローバルパーティションから引き出す。
コレクションに設定された各コンポーネントデータセットは、データ内の既知のグループに対応する。
本稿では、クラスタリング手法を実装し、既知のグループ構造を持つデータセットをシミュレートするR Shinyアプリケーションに焦点を当てる。
これらのShinyアプリケーションは、クラスタリングの結果を可視化する新しい方法を実装している。
これらの視覚化には、コレクション全体のコンテキストにおける個々のデータセットの散乱と、コンポーネント(またはサブドメイン)データセットに対するクラスタ分散が含まれる。
労働統計局(BLS)による2000-2013年記事の収集から得られたデータは、R-Shinyの応用を説明するために使用される。
ここでは、コレクション内の既知のグループ化が出版年である。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - ClusterNet: A Perception-Based Clustering Model for Scattered Data [16.326062082938215]
クラスタ分離は、一般的に広く使用されているクラスタリング技術によって取り組まれるタスクである。
本稿では,分散データを直接操作する学習戦略を提案する。
私たちは、ポイントベースのディープラーニングモデルであるClusterNetをトレーニングし、クラスタ分離性に対する人間の認識を反映するように訓練します。
論文 参考訳(メタデータ) (2023-04-27T13:41:12Z) - repliclust: Synthetic Data for Cluster Analysis [0.0]
repliclustは、クラスタで合成データセットを生成するPythonパッケージである。
プロジェクトのWebページである repliclust.org は、簡潔なユーザガイドと詳細なドキュメントを提供する。
論文 参考訳(メタデータ) (2023-03-24T23:45:27Z) - Cluster Explanation via Polyhedral Descriptions [0.0]
クラスタリングは教師なしの学習問題であり、競合しないデータポイントを同様の機能を持つグループに分割することを目的としている。
従来のクラスタリングアルゴリズムは、グループ割り当ての解釈可能性ではなく、正確性に重点を置いているため、グループに対する限られた洞察を提供する。
本稿では,各クラスタのまわりにポリヘドラを配置し,結果として生じるポリヘドラの複雑さを最小化して,クラスタを説明するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-10-17T07:26:44Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - A framework for benchmarking clustering algorithms [2.900810893770134]
クラスタリングアルゴリズムは、さまざまなベンチマーク問題でテストできる。
多くの研究論文や大学院論文では、少数のデータセットしか考慮していない。
我々はクラスタリングアルゴリズムをテストする一貫した方法論を導入することを目的としたフレームワークを開発した。
論文 参考訳(メタデータ) (2022-09-20T06:10:41Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。