論文の概要: Sparse clustering via the Deterministic Information Bottleneck algorithm
- arxiv url: http://arxiv.org/abs/2601.20628v1
- Date: Wed, 28 Jan 2026 14:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.963199
- Title: Sparse clustering via the Deterministic Information Bottleneck algorithm
- Title(参考訳): 決定論的情報ボトルネック法によるスパースクラスタリング
- Authors: Efthymios Costa, Ioanna Papatsouma, Angelos Markos,
- Abstract要約: クラスタ構造が機能領域のサブセットに限定されている場合、従来のクラスタリング技術は前例のない課題に直面します。
本稿では,スパースデータに関連する問題を克服し,特徴量の重み付けとクラスタリングを可能にする情報理論フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cluster analysis relates to the task of assigning objects into groups which ideally present some desirable characteristics. When a cluster structure is confined to a subset of the feature space, traditional clustering techniques face unprecedented challenges. We present an information-theoretic framework that overcomes the problems associated with sparse data, allowing for joint feature weighting and clustering. Our proposal constitutes a competitive alternative to existing clustering algorithms for sparse data, as demonstrated through simulations on synthetic data. The effectiveness of our method is established by an application on a real-world genomics data set.
- Abstract(参考訳): クラスタ分析は、望ましい特性を理想的に示すグループにオブジェクトを割り当てるタスクに関連する。
クラスタ構造が機能領域のサブセットに限定されている場合、従来のクラスタリング技術は前例のない課題に直面します。
本稿では,スパースデータに関連する問題を克服し,特徴量の重み付けとクラスタリングを可能にする情報理論フレームワークを提案する。
提案手法は,合成データのシミュレーションにより示すように,スパースデータに対する既存のクラスタリングアルゴリズムの代替となる。
本手法の有効性は,実世界のゲノミクスデータセットへの応用によって確立される。
関連論文リスト
- Mixed Data Clustering Survey and Challenges [0.0]
本稿では,前位相空間におけるクラスタリング手法を提案する。
古典的数値クラスタリングアルゴリズムに対するベンチマークは,提案手法の性能と有効性に関する洞察を与える。
論文 参考訳(メタデータ) (2025-11-27T08:20:05Z) - A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。
提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。
提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T09:06:19Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Clustering Optimisation Method for Highly Connected Biological Data [0.0]
接続クラスタリング評価のための単純な指標が,生物データの最適セグメンテーションにつながることを示す。
この作業の斬新さは、混雑したデータをクラスタリングするための単純な最適化方法の作成にある。
論文 参考訳(メタデータ) (2022-08-08T17:33:32Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。