論文の概要: Data clustering: an essential technique in data science
- arxiv url: http://arxiv.org/abs/2412.18760v1
- Date: Wed, 25 Dec 2024 03:14:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:27:00.028043
- Title: Data clustering: an essential technique in data science
- Title(参考訳): データクラスタリング:データサイエンスにおける重要な技術
- Authors: Wong Hauchi, Daniil Lisik, Tai Dinh,
- Abstract要約: 本稿では,クラスタリングの基本原理を概観し,共通ツールと手法を導入し,データサイエンスにおけるその多様な応用について検討する。
この議論は、今後の方向性に関する洞察で締めくくられ、イノベーションを推進し、データ駆動意思決定を可能にするクラスタリングの集中性を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper provides a comprehensive exploration of data clustering, emphasizing its methodologies and applications across different fields. Traditional techniques, including partitional and hierarchical clustering, are discussed alongside other approaches such as data stream, subspace and network clustering, highlighting their role in addressing complex, high-dimensional datasets. The paper also reviews the foundational principles of clustering, introduces common tools and methods, and examines its diverse applications in data science. Finally, the discussion concludes with insights into future directions, underscoring the centrality of clustering in driving innovation and enabling data-driven decision making.
- Abstract(参考訳): 本稿では,データクラスタリングを包括的に調査し,その方法論と応用をさまざまな分野にわたって強調する。
分割クラスタリングや階層クラスタリングといった従来のテクニックは、データストリームやサブスペース、ネットワーククラスタリングといった他のアプローチとともに議論されており、複雑な高次元データセットに対処する上での役割を強調している。
また、クラスタリングの基本原理を概観し、共通ツールや手法を導入し、データサイエンスにおけるその多様な応用について検討する。
最後に、この議論は今後の方向性に関する洞察で締めくくられ、イノベーションの推進とデータ駆動意思決定の実現におけるクラスタリングの集中性を強調している。
関連論文リスト
- Categorical data clustering: 25 years beyond K-modes [1.545264698293902]
分類データクラスタリングは、コンピュータ科学において一般的かつ重要なタスクである。
このレビューは、過去25年間のカテゴリデータクラスタリングの総合的な合成を提供する。
これは、健康科学、自然科学、社会科学、教育、工学、経済学など様々な分野における分類学的データクラスタリングの重要な役割を解明するものである。
論文 参考訳(メタデータ) (2024-08-30T12:36:00Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Review of Clustering Methods for Functional Data [1.827510863075184]
このレビューは、機能データ分析コミュニティとクラスタリングコミュニティのギャップを埋めることを目的としている。
本稿では,既存の機能的データクラスタリング手法の相互関係と差異を探索する系統分類法を提案する。
論文 参考訳(メタデータ) (2022-10-03T12:15:23Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - A Proposition-Level Clustering Approach for Multi-Document Summarization [82.4616498914049]
クラスタリングアプローチを再検討し、より正確な情報アライメントの提案をグループ化します。
提案手法は,有意な命題を検出し,それらをパラフラスティックなクラスタに分類し,その命題を融合して各クラスタの代表文を生成する。
DUC 2004 とTAC 2011 データセットでは,従来の最先端 MDS 法よりも要約法が優れている。
論文 参考訳(メタデータ) (2021-12-16T10:34:22Z) - A Comprehensive Survey on Community Detection with Deep Learning [93.40332347374712]
コミュニティは、ネットワーク内の他のコミュニティと異なるメンバーの特徴と接続を明らかにする。
この調査は、最先端の手法の様々なカテゴリをカバーする新しい分類法を考案し、提案する。
ディープニューラルネットワーク(Deep Neural Network)は、畳み込みネットワーク(convolutional network)、グラフアテンションネットワーク( graph attention network)、生成的敵ネットワーク(generative adversarial network)、オートエンコーダ(autoencoder)に分けられる。
論文 参考訳(メタデータ) (2021-05-26T14:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。