論文の概要: Robust Consensus Clustering and its Applications for Advertising
Forecasting
- arxiv url: http://arxiv.org/abs/2301.00717v1
- Date: Tue, 27 Dec 2022 21:49:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-09 01:49:09.709305
- Title: Robust Consensus Clustering and its Applications for Advertising
Forecasting
- Title(参考訳): ロバストコンセンサスクラスタリングと広告予測への応用
- Authors: Deguang Kong, Miao Lu, Konstantin Shmakov and Jian Yang
- Abstract要約: 我々は,専門家の意見に共通する根拠となる真実を見出すことのできる,ロバストなコンセンサスクラスタリングという新しいアルゴリズムを提案する。
提案手法を実世界の広告キャンペーンセグメンテーションと予測タスクに適用する。
- 参考スコア(独自算出の注目度): 18.242055675730253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Consensus clustering aggregates partitions in order to find a better fit by
reconciling clustering results from different sources/executions. In practice,
there exist noise and outliers in clustering task, which, however, may
significantly degrade the performance. To address this issue, we propose a
novel algorithm -- robust consensus clustering that can find common ground
truth among experts' opinions, which tends to be minimally affected by the bias
caused by the outliers. In particular, we formalize the robust consensus
clustering problem as a constraint optimization problem, and then derive an
effective algorithm upon alternating direction method of multipliers (ADMM)
with rigorous convergence guarantee. Our method outperforms the baselines on
benchmarks. We apply the proposed method to the real-world advertising campaign
segmentation and forecasting tasks using the proposed consensus clustering
results based on the similarity computed via Kolmogorov-Smirnov Statistics. The
accurate clustering result is helpful for building the advertiser profiles so
as to perform the forecasting.
- Abstract(参考訳): コンセンサスクラスタリングはパーティションを集約し、異なるソース/実行結果のクラスタリング結果を調整することで、より適合性を見出す。
実際には、クラスタ化タスクにはノイズや異常があるが、パフォーマンスが著しく低下する可能性がある。
この問題に対処するため、我々は、専門家の意見に共通する真実を見出すことのできる、ロバストなコンセンサスクラスタリングという新しいアルゴリズムを提案する。
特に、ロバストなコンセンサスクラスタリング問題を制約最適化問題として定式化し、厳密な収束を保証する乗算器(ADMM)の交互方向法に基づく効果的なアルゴリズムを導出する。
我々の手法はベンチマークのベースラインを上回ります。
提案手法を実世界の広告キャンペーンセグメンテーションおよび予測タスクに適用し,コルモゴロフ・スミルノフ統計を用いて計算した類似性に基づくコンセンサスクラスタリング結果を用いた。
正確なクラスタリング結果は、広告主プロファイルの構築に役立ち、予測を行う。
関連論文リスト
- A Bayesian Approach to Clustering via the Proper Bayesian Bootstrap: the Bayesian Bagged Clustering (BBC) algorithm [0.0]
本稿では,クラスタリング分野における教師なし手法の新たなアプローチを提案する。
ベイジアンブートストラップを用いた既存文献モデルを改良し,ロバスト性や解釈性の観点から結果を改善する手法が提案されている。
論文 参考訳(メタデータ) (2024-09-13T16:14:54Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Deep Embedding Clustering Driven by Sample Stability [16.53706617383543]
サンプル安定性(DECS)により駆動されるディープ埋め込みクラスタリングアルゴリズムを提案する。
具体的には、まずオートエンコーダで初期特徴空間を構築し、次にサンプル安定性に制約されたクラスタ指向の埋め込み機能を学ぶ。
5つのデータセットに対する実験結果から,提案手法は最先端のクラスタリング手法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-01-29T09:19:49Z) - Cluster Purging: Efficient Outlier Detection based on Rate-Distortion
Theory [6.929025509877642]
Cluster Purgingは、クラスタリングベースのアウトレイラ検出の拡張である。
本稿では, 生クラスタリングから検出された異常値に対して, クラスタ・パージが改善することを示す。
論文 参考訳(メタデータ) (2023-02-22T09:32:37Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Self-Evolutionary Clustering [1.662966122370634]
既存のディープクラスタリング手法の多くは、単純な距離比較に基づいており、手作り非線形マッピングによって生成されたターゲット分布に大きく依存している。
新たなモジュール型自己進化クラスタリング(Self-EvoC)フレームワークが構築され,自己管理的な分類によってクラスタリング性能が向上する。
このフレームワークは、サンプルアウトレイラを効率よく識別し、自己監督の助けを借りて、より良い目標分布を生成することができる。
論文 参考訳(メタデータ) (2022-02-21T19:38:18Z) - Tight integration of neural- and clustering-based diarization through
deep unfolding of infinite Gaussian mixture model [84.57667267657382]
本稿では,統合フレームワークにトレーニング可能なクラスタリングアルゴリズムを導入する。
話者埋め込みはトレーニング中に最適化され、iGMMクラスタリングに適合する。
実験の結果,提案手法はダイアリゼーション誤差率において従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-02-14T07:45:21Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Robust Grouped Variable Selection Using Distributionally Robust
Optimization [11.383869751239166]
摂動下での群付き変数選択のための不確実性セットを用いた分布ロバスト最適化(DRO)の定式化を提案する。
我々は,サンプル外損失と推定バイアスの確率的境界を証明し,推定器の群化効果を確立する。
我々の定式化は,群レベルでの空間性を促進する解釈可能で同相なモデルを生成することを示す。
論文 参考訳(メタデータ) (2020-06-10T22:32:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。