論文の概要: Data clustering: an essential technique in data science
- arxiv url: http://arxiv.org/abs/2412.18760v2
- Date: Thu, 30 Jan 2025 21:57:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 13:59:10.922236
- Title: Data clustering: an essential technique in data science
- Title(参考訳): データクラスタリング:データサイエンスにおける重要な技術
- Authors: Tai Dinh, Wong Hauchi, Daniil Lisik, Michal Koren, Dat Tran, Philip S. Yu, Joaquín Torres-Sospedra,
- Abstract要約: この記事では、クラスタリングの基礎となる重要な原則を強調し、広く使われているツールとフレームワークの概要を説明し、データサイエンスにおけるクラスタリングのワークフローを紹介します。
この論文は、クラスタリングがイノベーションを推進し、データ駆動による意思決定を可能にする上での役割を強調し、今後の研究方向性に関する洞察で締めくくっている。
- 参考スコア(独自算出の注目度): 28.124442353352183
- License:
- Abstract: This paper explores the critical role of data clustering in data science, emphasizing its methodologies, tools, and diverse applications. Traditional techniques, such as partitional and hierarchical clustering, are analyzed alongside advanced approaches such as data stream, density-based, graph-based, and model-based clustering for handling complex structured datasets. The paper highlights key principles underpinning clustering, outlines widely used tools and frameworks, introduces the workflow of clustering in data science, discusses challenges in practical implementation, and examines various applications of clustering. By focusing on these foundations and applications, the discussion underscores clustering's transformative potential. The paper concludes with insights into future research directions, emphasizing clustering's role in driving innovation and enabling data-driven decision-making.
- Abstract(参考訳): 本稿では,データ科学におけるデータクラスタリングの重要性を考察し,その方法論,ツール,多種多様なアプリケーションを強調した。
分割クラスタリングや階層クラスタリングといった従来のテクニックは、複雑な構造化データセットを扱うためのデータストリーム、密度ベース、グラフベース、モデルベースのクラスタリングといった高度なアプローチとともに分析される。
この記事では、クラスタリングの基盤となる重要な原則を強調し、広く使われているツールやフレームワークの概要を説明し、データサイエンスにおけるクラスタリングのワークフローを紹介し、実践的な実装における課題について議論し、クラスタリングの様々な応用について検討する。
これらの基盤とアプリケーションに焦点を当てることで、この議論はクラスタリングの変革の可能性を強調します。
この論文は、クラスタリングがイノベーションを推進し、データ駆動による意思決定を可能にする上での役割を強調し、今後の研究方向性に関する洞察で締めくくっている。
関連論文リスト
- Categorical data clustering: 25 years beyond K-modes [1.545264698293902]
分類データクラスタリングは、コンピュータ科学において一般的かつ重要なタスクである。
このレビューは、過去25年間のカテゴリデータクラスタリングの総合的な合成を提供する。
これは、健康科学、自然科学、社会科学、教育、工学、経済学など様々な分野における分類学的データクラスタリングの重要な役割を解明するものである。
論文 参考訳(メタデータ) (2024-08-30T12:36:00Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Review of Clustering Methods for Functional Data [1.827510863075184]
このレビューは、機能データ分析コミュニティとクラスタリングコミュニティのギャップを埋めることを目的としている。
本稿では,既存の機能的データクラスタリング手法の相互関係と差異を探索する系統分類法を提案する。
論文 参考訳(メタデータ) (2022-10-03T12:15:23Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。