論文の概要: Mixed Data Clustering Survey and Challenges
- arxiv url: http://arxiv.org/abs/2512.03070v1
- Date: Thu, 27 Nov 2025 08:20:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-04 20:02:54.933809
- Title: Mixed Data Clustering Survey and Challenges
- Title(参考訳): 混合データクラスタリング調査と課題
- Authors: Guillaume Guerard, Sonia Djebali,
- Abstract要約: 本稿では,前位相空間におけるクラスタリング手法を提案する。
古典的数値クラスタリングアルゴリズムに対するベンチマークは,提案手法の性能と有効性に関する洞察を与える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of the big data paradigm has transformed how industries manage and analyze information, ushering in an era of unprecedented data volume, velocity, and variety. Within this landscape, mixed-data clustering has become a critical challenge, requiring innovative methods that can effectively exploit heterogeneous data types, including numerical and categorical variables. Traditional clustering techniques, typically designed for homogeneous datasets, often struggle to capture the additional complexity introduced by mixed data, underscoring the need for approaches specifically tailored to this setting. Hierarchical and explainable algorithms are particularly valuable in this context, as they provide structured, interpretable clustering results that support informed decision-making. This paper introduces a clustering method grounded in pretopological spaces. In addition, benchmarking against classical numerical clustering algorithms and existing pretopological approaches yields insights into the performance and effectiveness of the proposed method within the big data paradigm.
- Abstract(参考訳): ビッグデータパラダイムの出現は、業界における情報管理と分析の方法を変え、前例のないデータ量、速度、多様性の時代に繋がった。
この状況の中で、混合データクラスタリングは重要な課題となり、数値変数や分類変数を含む異種データタイプを効果的に活用できる革新的な方法が必要である。
従来のクラスタリング技術は、通常、均質なデータセットのために設計されており、混合データによってもたらされる追加の複雑さを捉えるのに苦労することが多く、この設定に特化されたアプローチの必要性を強調している。
階層的かつ説明可能なアルゴリズムは、情報的意思決定をサポートする構造化され解釈可能なクラスタリング結果を提供するため、この文脈で特に有用である。
本稿では,前位相空間におけるクラスタリング手法を提案する。
さらに,従来の数値クラスタリングアルゴリズムと既存プリトポロジ手法とのベンチマークにより,ビッグデータパラダイムにおける提案手法の性能と有効性について考察する。
関連論文リスト
- PretopoMD: Pretopology-based Mixed Data Hierarchical Clustering [0.0]
本稿では,次元削減を必要とせずに混合データをクラスタリングすることの課題に対処する,新しいプリトポロジーに基づくアルゴリズムを提案する。
提案手法は,ユーザ定義の階層クラスタ構築を可能にする,カスタマイズ可能な論理ルールと調整可能なハイパーパラメータを定式化する。
経験的発見は、有意義なクラスタ構築におけるアルゴリズムの堅牢性を強調し、クラスタ化されたデータ説明可能性に関連する問題を克服する可能性を明らかにする。
論文 参考訳(メタデータ) (2025-11-27T08:20:22Z) - A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。
提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T09:06:19Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。