論文の概要: Performance Evaluation of Linear Regression Algorithm in Cluster
Environment
- arxiv url: http://arxiv.org/abs/2009.06497v1
- Date: Mon, 14 Sep 2020 14:58:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 13:11:03.747396
- Title: Performance Evaluation of Linear Regression Algorithm in Cluster
Environment
- Title(参考訳): クラスタ環境における線形回帰アルゴリズムの性能評価
- Authors: Cinantya Paramita, Fauzi Adi Rafrastara, Usman Sudibyo, R.I.W. Agung
Wibowo
- Abstract要約: クラスタ環境におけるデータマイニング手法の1つを実行することにより,クラスタコンピューティングの性能を評価する。
その結果、同一仕様のクラスタ環境に5台のPCを組み込むことで、スタンドアロンのPCに比べて39.76%の計算性能が向上することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cluster computing was introduced to replace the superiority of super
computers. Cluster computing is able to overcome the problems that cannot be
effectively dealt with supercomputers. In this paper, we are going to evaluate
the performance of cluster computing by executing one of data mining techniques
in the cluster environment. The experiment will attempt to predict the flight
delay by using linear regression algorithm with apache spark as a framework for
cluster computing. The result shows that, by involving 5 PCs in cluster
environment with equal specifications can increase the performance of
computation up to 39.76% compared to the standalone one. Attaching more nodes
to the cluster can make the process become faster significantly.
- Abstract(参考訳): クラスタコンピューティングはスーパーコンピュータの優位性を置き換えるために導入された。
クラスタコンピューティングは、スーパーコンピュータに効果的に対処できない問題を克服することができる。
本稿では,クラスタ環境におけるデータマイニング手法の1つを実行することにより,クラスタコンピューティングの性能を評価する。
この実験では、アパッチスパークをクラスタコンピューティングのフレームワークとする線形回帰アルゴリズムを用いて、飛行遅延の予測を試みる。
その結果、同一仕様のクラスタ環境に5pcを投入することで、スタンドアロン環境と比較して計算性能が39.76%向上することが示された。
クラスタにより多くのノードをアタッチすると、プロセスが大幅に速くなります。
関連論文リスト
- Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Dink-Net: Neural Clustering on Large Graphs [59.10189693120368]
ディープグラフクラスタリング法 (Dink-Net) は, 拡張と縮小という概念を用いて提案される。
ノードを識別することにより、拡張によって劣化しても、表現は自己教師された方法で学習される。
クラスタリング分布は、提案したクラスタ拡張損失とクラスタ縮小損失を最小化することにより最適化される。
ランナアップと比較して、Dink-Net 9.62%は1100万ノードと16億エッジを持つogbn-papers100MデータセットでNMIの改善を実現している。
論文 参考訳(メタデータ) (2023-05-28T15:33:24Z) - Distributed Silhouette Algorithm: Evaluating Clustering on Big Data [4.240260323968493]
本稿では,Silhouetteメトリックを線形複雑で計算し,分散環境で容易に並列に実行できるアルゴリズムを提案する。
その実装はApache Spark MLライブラリで無料で利用できる。
論文 参考訳(メタデータ) (2023-03-24T16:10:43Z) - Convex Clustering through MM: An Efficient Algorithm to Perform
Hierarchical Clustering [1.0589208420411012]
本稿では,クラスタ融合と高効率更新方式を用いた反復アルゴリズムCCMMによる凸クラスタリングを提案する。
現在のデスクトップコンピュータでは、CCMMは、7次元空間に100万以上のオブジェクトを含む凸クラスタリング問題を効率的に解決する。
論文 参考訳(メタデータ) (2022-11-03T15:07:51Z) - Learning-Augmented $k$-means Clustering [44.06375788674942]
予測器を付加した$k$-means問題を考えると、任意の点で、そのクラスタラベルを、何らかの、おそらくは逆のエラーまで、ほぼ最適なクラスタリングで返します。
精度の高い予測器に従えば、高いクラスタリングコストがもたらされるが、予測器の精度とともに性能が向上するアルゴリズムを提案する。
我々は、実際のデータセット上でアルゴリズムを評価し、クラスタリングの品質を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2021-10-27T00:11:49Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - A New Parallel Adaptive Clustering and its Application to Streaming Data [0.0]
本稿では,適切な数のクラスを同時に選択しながら,自動的にデータを分類する並列適応クラスタリング(pac)アルゴリズムを提案する。
並列スレッドの結果を効率よくクラスタリングする正規化セット mik-means を開発した。
提案手法の性能を特徴付けるための理論的解析と数値実験を行う。
論文 参考訳(メタデータ) (2021-04-06T17:18:56Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - Probabilistic Partitive Partitioning (PPP) [0.0]
クラスタリングアルゴリズムは一般に2つの一般的な問題に直面している。
彼らは異なる初期条件で異なる設定に収束する。
クラスタの数は、事前に任意に決めなければならない。
論文 参考訳(メタデータ) (2020-03-09T19:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。