論文の概要: Improved Multi-objective Data Stream Clustering with Time and Memory
Optimization
- arxiv url: http://arxiv.org/abs/2201.05079v1
- Date: Thu, 13 Jan 2022 17:05:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 15:10:59.403782
- Title: Improved Multi-objective Data Stream Clustering with Time and Memory
Optimization
- Title(参考訳): 時間とメモリ最適化によるマルチ目的データストリームクラスタリングの改善
- Authors: Mohammed Oualid Attaoui, Hanene Azzag, Mustapha Lebbah, and Nabil
Keskes
- Abstract要約: 本稿では,新しいデータストリームクラスタリング手法(IMOC-Stream)を提案する。
2つの異なる目的関数を使用して、データの異なる側面をキャプチャする。
実験により, 任意の形状, コンパクト, 分離されたクラスタにデータストリームを分割できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The analysis of data streams has received considerable attention over the
past few decades due to sensors, social media, etc. It aims to recognize
patterns in an unordered, infinite, and evolving stream of observations.
Clustering this type of data requires some restrictions in time and memory.
This paper introduces a new data stream clustering method (IMOC-Stream). This
method, unlike the other clustering algorithms, uses two different objective
functions to capture different aspects of the data. The goal of IMOC-Stream is
to: 1) reduce computation time by using idle times to apply genetic operations
and enhance the solution. 2) reduce memory allocation by introducing a new tree
synopsis. 3) find arbitrarily shaped clusters by using a multi-objective
framework. We conducted an experimental study with high dimensional stream
datasets and compared them to well-known stream clustering techniques. The
experiments show the ability of our method to partition the data stream in
arbitrarily shaped, compact, and well-separated clusters while optimizing the
time and memory. Our method also outperformed most of the stream algorithms in
terms of NMI and ARAND measures.
- Abstract(参考訳): データストリームの分析は、過去数十年間、センサーやソーシャルメディアなどによってかなりの注目を集めてきた。
無秩序で無限で進化する観察の流れの中のパターンを認識することを目的としている。
このタイプのデータをクラスタリングするには、時間とメモリの制限が必要だ。
本稿では,新しいデータストリームクラスタリング手法(IMOC-Stream)を提案する。
この方法は、他のクラスタリングアルゴリズムとは異なり、2つの異なる目的関数を使用してデータの異なる側面をキャプチャする。
IMOC-Streamの目標は次のとおりです。
1) アイドル時間を用いて遺伝的操作を施し, 解法を強化することにより計算時間を短縮する。
2)新しいツリーシンプシスを導入することでメモリ割り当てを削減する。
3) 多目的フレームワークを用いて任意の形状のクラスタを見つける。
本研究では,高次元ストリームデータセットを用いた実験を行い,よく知られたストリームクラスタリング手法と比較した。
実験では、時間とメモリを最適化しながら、任意の形状、コンパクト、分離されたクラスタでデータストリームを分割する能力を示す。
また,提案手法は,NMIとARANDの手法により,ストリームアルゴリズムのほとんどの性能を向上した。
関連論文リスト
- Implementing Streaming algorithm and k-means clusters to RAG [2.5251537417183028]
本稿では,ストリーミングアルゴリズムとk-meansクラスタリングを組み合わせた新しいアプローチを提案する。
提案手法では,動的にインデックスを更新し,メモリ消費を削減するためにストリーミングアルゴリズムを適用した。
その結果,ストリーミングアルゴリズムとk平均クラスタを用いたRAGは,従来のRAGよりも精度とメモリが優れていた。
論文 参考訳(メタデータ) (2024-07-31T03:00:59Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Contrastive Continual Multi-view Clustering with Filtered Structural
Fusion [57.193645780552565]
ビューが事前に収集されるアプリケーションでは、マルチビュークラスタリングが成功します。
データビューがシーケンシャルに収集されるシナリオ、すなわちリアルタイムデータを見落としている。
いくつかの方法が提案されているが、安定塑性ジレンマに閉じ込められている。
フィルタ構造融合を用いたコントラスト連続多視点クラスタリングを提案する。
論文 参考訳(メタデータ) (2023-09-26T14:18:29Z) - Clustering Method for Time-Series Images Using Quantum-Inspired
Computing Technology [0.0]
時系列クラスタリングは、クラスタに関する事前の知識がなければ、時系列データの強力なデータマイニング技術として機能する。
本研究では,アニーリングマシンを利用した新しい時系列クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T05:58:14Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Rethinking Space-Time Networks with Improved Memory Coverage for
Efficient Video Object Segmentation [68.45737688496654]
各オブジェクトのマスク特徴を再エンコードすることなく,フレーム間の直接対応性を確立する。
対応によって、現在のクエリフレーム内の全てのノードは、過去の特徴を連想的に集約することによって推測される。
すべてのメモリノードにコントリビュートする機会があることを検証し、そのような多彩な投票がメモリ効率と推論精度の両方に有益であることを示した。
論文 参考訳(メタデータ) (2021-06-09T16:50:57Z) - Data Stream Clustering: A Review [0.0]
クラスタリングはリアルタイムデータストリーム処理に最も適した手法の1つである。
我々は、最近のデータストリームクラスタリングアルゴリズムをレビューし、ベースクラスタリング手法、計算複雑性、クラスタリング精度の観点から分析する。
一般的なデータストリームレポジトリとデータセット、ストリーム処理ツール、プラットフォームを示します。
論文 参考訳(メタデータ) (2020-07-16T20:35:09Z) - Learnable Subspace Clustering [76.2352740039615]
本研究では,大規模サブスペースクラスタリング問題を効率的に解くために,学習可能なサブスペースクラスタリングパラダイムを開発する。
鍵となる考え方は、高次元部分空間を下層の低次元部分空間に分割するパラメトリック関数を学ぶことである。
我々の知る限り、本論文は、サブスペースクラスタリング手法の中で、数百万のデータポイントを効率的にクラスタ化する最初の試みである。
論文 参考訳(メタデータ) (2020-04-09T12:53:28Z) - A Novel Incremental Clustering Technique with Concept Drift Detection [2.790947019327459]
従来の静的クラスタリングアルゴリズムは動的データセットには適していない。
UIClustと呼ばれる効率的なインクリメンタルクラスタリングアルゴリズムを提案する。
我々は、UIClustの性能を、最近発表された高品質なインクリメンタルクラスタリングアルゴリズムと比較することで評価する。
論文 参考訳(メタデータ) (2020-03-30T05:20:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。