論文の概要: Problem-oriented AutoML in Clustering
- arxiv url: http://arxiv.org/abs/2409.16218v1
- Date: Tue, 24 Sep 2024 16:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 05:07:38.074981
- Title: Problem-oriented AutoML in Clustering
- Title(参考訳): クラスタリングにおける問題指向オートML
- Authors: Matheus Camilo da Silva, Gabriel Marques Tavares, Eric Medvet, Sylvio Barbon Junior,
- Abstract要約: Problem-oriented AutoML in Clustering (PoAC)フレームワークは、クラスタリングタスクを自動化する新しいフレキシブルなアプローチを導入している。
PoACはクラスタリング問題、CVI、メタ機能の間の動的接続を確立し、ユーザーはこれらのコンポーネントをカスタマイズできる。
PoACはアルゴリズムに依存しないため、追加のデータや再トレーニングを必要とせずに、異なるクラスタリング問題にシームレスに適応する。
- 参考スコア(独自算出の注目度): 2.541080349729282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Problem-oriented AutoML in Clustering (PoAC) framework introduces a novel, flexible approach to automating clustering tasks by addressing the shortcomings of traditional AutoML solutions. Conventional methods often rely on predefined internal Clustering Validity Indexes (CVIs) and static meta-features, limiting their adaptability and effectiveness across diverse clustering tasks. In contrast, PoAC establishes a dynamic connection between the clustering problem, CVIs, and meta-features, allowing users to customize these components based on the specific context and goals of their task. At its core, PoAC employs a surrogate model trained on a large meta-knowledge base of previous clustering datasets and solutions, enabling it to infer the quality of new clustering pipelines and synthesize optimal solutions for unseen datasets. Unlike many AutoML frameworks that are constrained by fixed evaluation metrics and algorithm sets, PoAC is algorithm-agnostic, adapting seamlessly to different clustering problems without requiring additional data or retraining. Experimental results demonstrate that PoAC not only outperforms state-of-the-art frameworks on a variety of datasets but also excels in specific tasks such as data visualization, and highlight its ability to dynamically adjust pipeline configurations based on dataset complexity.
- Abstract(参考訳): Problem-oriented AutoML in Clustering (PoAC)フレームワークは、従来のAutoMLソリューションの欠点に対処することによって、クラスタリングタスクを自動化するための、新しく柔軟なアプローチを導入している。
従来の手法では、事前に定義された内部クラスタリング妥当性指数(CVI)と静的メタ機能に依存しており、多様なクラスタリングタスクに対する適応性と有効性を制限している。
これとは対照的に、PoACはクラスタリング問題、CVI、メタ機能の間の動的接続を確立し、ユーザーはタスクの特定のコンテキストと目標に基づいてこれらのコンポーネントをカスタマイズできる。
コアとなるPoACでは、以前のクラスタリングデータセットとソリューションの大きなメタ知識ベースでトレーニングされたサロゲートモデルを採用しており、新たなクラスタリングパイプラインの品質を推測し、目に見えないデータセットに対して最適なソリューションを合成することが可能になる。
固定評価メトリクスやアルゴリズムセットによって制約される多くのAutoMLフレームワークとは異なり、PoACはアルゴリズムに依存しず、追加のデータや再トレーニングを必要とせず、異なるクラスタリング問題にシームレスに適応する。
実験の結果、PoACはさまざまなデータセット上で最先端のフレームワークを上回るだけでなく、データの視覚化のような特定のタスクにも優れており、データセットの複雑さに基づいてパイプライン構成を動的に調整する能力を強調している。
関連論文リスト
- CLAMS: A System for Zero-Shot Model Selection for Clustering [3.7127285734321194]
本稿では,最適なトランスポートベースデータセットの類似性を利用して,クラスタリング問題に対するモデル選択を可能にするAutoMLシステムを提案する。
その結果、クラスタリングアプリケーションを解決するための類似性に基づく自動モデル選択の有用性が実証された。
論文 参考訳(メタデータ) (2024-07-15T23:50:07Z) - A3S: A General Active Clustering Method with Pairwise Constraints [66.74627463101837]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。
さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文 参考訳(メタデータ) (2024-07-14T13:37:03Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - A Deep Learning Object Detection Method for an Efficient Clusters
Initialization [6.365889364810239]
クラスタリングは、銀行顧客のプロファイリング、文書検索、画像セグメンテーション、Eコマースレコメンデーションエンジンなど、多くのアプリケーションで使用されている。
既存のクラスタリング技術には、初期化パラメータに対する安定性の信頼性という大きな制限がある。
本稿では,計算オーバーヘッドとリソースオーバーヘッドの少ない最適クラスタリングパラメータを提供するソリューションを提案する。
論文 参考訳(メタデータ) (2021-04-28T08:34:25Z) - ClusterVO: Clustering Moving Instances and Estimating Visual Odometry
for Self and Surroundings [54.33327082243022]
ClusterVOはステレオビジュアルオドメトリーで、エゴと周囲の固いクラスタ/オブジェクトの両方の動きを同時にクラスタし、推定する。
以前のソリューションでは、バッチ入力やシーン構造や動的オブジェクトモデルへの事前の指示に頼っていたが、ClusterVOは一般的にオンラインであり、屋内のシーン理解や自律運転など、さまざまなシナリオで使用することができる。
論文 参考訳(メタデータ) (2020-03-29T09:06:28Z) - Multi-objective Consensus Clustering Framework for Flight Search
Recommendation [4.5782961896413035]
クラスタリング・アンサンブル・アプローチは、古典的なクラスタリング・アプローチのよく知られた問題を克服するために開発された。
本稿では,Amadeusの顧客検索データを解析するために,クラスタリングアンサンブルを用いた多目的最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-20T03:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。