Fugu-MT 論文翻訳(概要): A Robust Clustering Framework Combining Minimum Description Length and Genetic Optimization

論文の概要: A Robust Clustering Framework Combining Minimum Description Length and Genetic Optimization

arxiv url: http://arxiv.org/abs/2412.05305v2
Date: Wed, 11 Dec 2024 14:26:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-12 16:52:59.150463
Title: A Robust Clustering Framework Combining Minimum Description Length and Genetic Optimization
Title（参考訳）: 最小記述長と遺伝的最適化を組み合わせたロバストクラスタリングフレームワーク
Authors: H. Jahani, F. Zamio,
Abstract要約: 本稿では,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせた新しいクラスタリングフレームワークを提案する。このアプローチは、ベースラインとしてアンサンブルクラスタリングソリューションから始まり、MDLに基づく評価関数を使用して洗練され、遺伝的アルゴリズムで最適化される。その結果、この手法は従来のクラスタリングアルゴリズムを一貫して上回り、高い精度、高い安定性、バイアスの低減を実現していることがわかった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Clustering algorithms are fundamental in data analysis, enabling the organization of data into meaningful groups. However, individual clustering methods often face limitations and biases, making it challenging to develop a universal solution for diverse datasets. To address this, we propose a novel clustering framework that combines the Minimum Description Length (MDL) principle with a genetic optimization algorithm. This approach begins with an ensemble clustering solution as a baseline, which is refined using MDL-based evaluation functions and optimized with a genetic algorithm. By leveraging the MDL principle, the method adapts to the intrinsic properties of datasets, minimizing dependence on input clusters and ensuring a data-driven process. The proposed method was evaluated on thirteen benchmark datasets using four validation metrics: accuracy, normalized mutual information (NMI), Fisher score, and adjusted Rand index (ARI). Results show that the method consistently outperforms traditional clustering algorithms, achieving higher accuracy, greater stability, and reduced biases. Its adaptability makes it a reliable tool for clustering complex and varied datasets. This study demonstrates the potential of combining MDL and genetic optimization to create a robust and versatile clustering framework, advancing the field of data analysis and offering a scalable solution for diverse applications.
Abstract（参考訳）: クラスタリングアルゴリズムはデータ分析の基本であり、データの有意義なグループへの編成を可能にする。しかし、個々のクラスタリング手法は制限やバイアスに直面することが多く、多様なデータセットに対する普遍的なソリューションを開発することは困難である。そこで本研究では,最小記述長(MDL)と遺伝的最適化アルゴリズムを組み合わせた新しいクラスタリングフレームワークを提案する。このアプローチは、ベースラインとしてアンサンブルクラスタリングソリューションから始まり、MDLに基づく評価関数を使用して洗練され、遺伝的アルゴリズムで最適化される。 MDLの原理を活用することで、本手法はデータセットの本質的な性質に適応し、入力クラスタへの依存を最小限に抑え、データ駆動プロセスを保証する。提案手法は、精度、正規化相互情報(NMI)、フィッシャースコア(Fisher score)、調整されたRand Index(ARI)の4つの評価指標を用いて、13のベンチマークデータセットで評価した。その結果、この手法は従来のクラスタリングアルゴリズムを一貫して上回り、高い精度、高い安定性、バイアスの低減を実現していることがわかった。その適応性により、複雑で多様なデータセットをクラスタリングするための信頼性の高いツールになる。本研究は、MDLと遺伝的最適化を組み合わせて、堅牢で汎用的なクラスタリングフレームワークを構築し、データ解析の分野を前進させ、多様なアプリケーションにスケーラブルなソリューションを提供する可能性を示す。

関連論文リスト

Convex Clustering Redefined: Robust Learning with the Median of Means Estimator [22.614296433333106]
コンベックスクラスタリングをMedian of Means (MoM) 推定器と統合するロバストなアプローチを導入する。提案手法は,特に大規模データセットにおいて,性能と効率を両立させる。
論文参考訳（メタデータ） (2025-11-12T21:16:53Z)
A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文参考訳（メタデータ） (2024-07-14T13:37:03Z)
A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data [0.0]
混合型データ,すなわち連続変数と分類変数の両方からなるデータをクラスタリングするための情報理論手法を提案する。提案手法は、一般化された製品カーネルを通して、インフォメーション・ボトルネックの原理を異種データに拡張する。提案手法はDIBmixと呼ばれ,従来の4つの手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (2024-07-03T09:06:19Z)
Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文参考訳（メタデータ） (2024-06-12T08:30:16Z)
Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-04-07T12:25:03Z)
A Generalized Framework for Predictive Clustering and Optimization [18.06697544912383]
クラスタリングは強力で広く使われているデータサイエンスツールです。本稿では,予測クラスタリングのための一般化最適化フレームワークを定義する。また,大域的最適化のためにMILP(mixed-integer linear programming)を利用する共同最適化手法を提案する。
論文参考訳（メタデータ） (2023-05-07T19:56:51Z)
Simple and Scalable Algorithms for Cluster-Aware Precision Medicine [0.0]
共同クラスタリングと埋め込みに対するシンプルでスケーラブルなアプローチを提案する。この新しいクラスタ対応の埋め込みアプローチは、現在の共同埋め込みとクラスタリング法の複雑さと限界を克服する。当社のアプローチでは,ユーザが希望するクラスタ数を選択する必要はなく,階層的にクラスタ化された埋め込みの解釈可能なデンドログラムを生成する。
論文参考訳（メタデータ） (2022-11-29T19:27:26Z)
Unified Multi-View Orthonormal Non-Negative Graph Based Clustering Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文参考訳（メタデータ） (2022-11-03T08:18:27Z)
Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。 iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文参考訳（メタデータ） (2022-09-29T21:03:13Z)
Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文参考訳（メタデータ） (2022-09-27T19:04:36Z)
A One-shot Framework for Distributed Clustered Learning in Heterogeneous Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文参考訳（メタデータ） (2022-09-22T09:04:10Z)
Clustering Optimisation Method for Highly Connected Biological Data [0.0]
接続クラスタリング評価のための単純な指標が,生物データの最適セグメンテーションにつながることを示す。この作業の斬新さは、混雑したデータをクラスタリングするための単純な最適化方法の作成にある。
論文参考訳（メタデータ） (2022-08-08T17:33:32Z)
Late Fusion Multi-view Clustering via Global and Local Alignment Maximization [61.89218392703043]
マルチビュークラスタリング(MVC)は、異なるビューからの補完情報を最適に統合し、クラスタリング性能を改善する。既存のアプローチの多くは、クラスタリングに最適な類似性行列を学ぶために、複数の事前定義された類似性を直接融合する。これらの問題に対処するために、アライメントを通してレイトフュージョンMVCを提案する。
論文参考訳（メタデータ） (2022-08-02T01:49:31Z)
A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous Datasets [0.76146285961466]
本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。 ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。従来の5つのアプローチに対してECAStarを評価する実験を行った。
論文参考訳（メタデータ） (2021-01-01T07:20:50Z)
Too Much Information Kills Information: A Clustering Perspective [6.375668163098171]
分散に基づくk-クラスタリングタスクに対して,k-平均クラスタリング(k-means clustering)が広く知られていることを含む,単純かつ斬新なアプローチを提案する。提案手法は、与えられたデータセットからサンプリングサブセットを選択し、サブセット内のデータ情報のみに基づいて決定する。ある仮定では、結果のクラスタリングは、高い確率で分散に基づく目的の最適度を推定するのに十分である。
論文参考訳（メタデータ） (2020-09-16T01:54:26Z)
A New Validity Index for Fuzzy-Possibilistic C-Means Clustering [6.174448419090291]
Fuzzy-Possibilistic (FP)指数は、形状や密度の異なるクラスターの存在下でうまく機能する。 FPCMはファジィの度合いと典型性の度合いを事前選択する必要がある。
論文参考訳（メタデータ） (2020-05-19T01:48:13Z)
Clustering Binary Data by Application of Combinatorial Optimization Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文参考訳（メタデータ） (2020-01-06T23:33:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。