論文の概要: Dynamic User Segmentation and Usage Profiling
- arxiv url: http://arxiv.org/abs/2305.17492v1
- Date: Sat, 27 May 2023 15:09:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 18:44:45.440977
- Title: Dynamic User Segmentation and Usage Profiling
- Title(参考訳): 動的ユーザセグメンテーションと利用状況のプロファイリング
- Authors: Animesh Mitra, Saswata Sahoo, Soumyabrata Dey
- Abstract要約: このような分類的ビッグデータのクラスタリング戦略を提案する。
提案手法を実装し,大規模で高次元の楽曲プレイリストデータセットに適用し,性能検証を行った。
機能領域におけるクラスタ間オーバーラップが最小限に抑えられた、同様のサイズのユーザクラスタを達成したことで、結果は素晴らしいものになりました。
- 参考スコア(独自算出の注目度): 0.12891210250935148
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Usage data of a group of users distributed across a number of categories,
such as songs, movies, webpages, links, regular household products, mobile
apps, games, etc. can be ultra-high dimensional and massive in size. More often
this kind of data is categorical and sparse in nature making it even more
difficult to interpret any underlying hidden patterns such as clusters of
users. However, if this information can be estimated accurately, it will have
huge impacts in different business areas such as user recommendations for apps,
songs, movies, and other similar products, health analytics using electronic
health record (EHR) data, and driver profiling for insurance premium estimation
or fleet management.
In this work, we propose a clustering strategy of such categorical big data,
utilizing the hidden sparsity of the dataset. Most traditional clustering
methods fail to give proper clusters for such data and end up giving one big
cluster with small clusters around it irrespective of the true structure of the
data clusters. We propose a feature transformation, which maps the
binary-valued usage vector to a lower dimensional continuous feature space in
terms of groups of usage categories, termed as covariate classes. The lower
dimensional feature representations in terms of covariate classes can be used
for clustering. We implemented the proposed strategy and applied it to a large
sized very high-dimensional song playlist dataset for the performance
validation. The results are impressive as we achieved similar-sized user
clusters with minimal between-cluster overlap in the feature space (8%) on
average). As the proposed strategy has a very generic framework, it can be
utilized as the analytic engine of many of the above-mentioned business use
cases allowing an intelligent and dynamic personal recommendation system or a
support system for smart business decision-making.
- Abstract(参考訳): 楽曲、映画、ウェブページ、リンク、一般家庭製品、モバイルアプリ、ゲームなど、多数のカテゴリにまたがるユーザーの利用データは、超高次元で巨大なサイズになる可能性がある。
この種のデータはカテゴリ的にも性質的にもばらばらであるため、ユーザクラスタのような隠れたパターンを解釈するのがさらに難しくなります。
しかし、この情報が正確に推定できれば、アプリ、曲、映画、その他の類似製品に対するユーザー推薦、電子健康記録(EHR)データを用いた健康分析、保険料見積や車両管理のためのドライバープロファイリングなど、さまざまなビジネス領域に大きな影響を与えることになる。
本稿では,データセットの隠れたスパーシティを利用して,そのようなカテゴリビッグデータのクラスタリング戦略を提案する。
ほとんどの従来のクラスタリング手法は、そのようなデータに対して適切なクラスタを与えず、データクラスタの真の構造に関係なく、小さなクラスタを持つひとつの大きなクラスタを与えることになります。
本稿では,二項値付き利用ベクトルを,共変類と呼ばれる利用カテゴリ群の観点から,低次元連続的特徴空間にマッピングする特徴変換を提案する。
共変類の観点からの低次元特徴表現はクラスタリングに使うことができる。
提案手法を実装し,大規模で高次元の楽曲プレイリストデータセットに適用し,性能検証を行った。
クラスタ間のオーバーラップが最小限に抑えられ(平均8%)、同じサイズのユーザクラスタを達成できたので、結果は印象的です。
提案手法は非常に汎用的なフレームワークであるため,知的かつダイナミックなパーソナルレコメンデーションシステムやスマートなビジネス意思決定支援システムを実現する上で,上記の多くのビジネスユースケースの分析エンジンとして利用することができる。
関連論文リスト
- Cluster-based Graph Collaborative Filtering [55.929052969825825]
グラフ畳み込みネットワーク(GCN)は、レコメンデーションシステムのためのユーザおよびアイテム表現の学習に成功している。
既存のGCNベースのほとんどのメソッドは、高階グラフ畳み込みを実行しながら、ユーザの複数の関心事を見落としている。
クラスタベースグラフ協調フィルタリング(ClusterGCF)と呼ばれる新しいGCNベースのレコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2024-04-16T07:05:16Z) - OMH: Structured Sparsity via Optimally Matched Hierarchy for Unsupervised Semantic Segmentation [69.37484603556307]
Un Semantic segmenting (USS)は、事前に定義されたラベルに頼ることなく、イメージをセグメント化する。
上記の問題を同時に解決するために,OMH (Optimally Matched Hierarchy) という新しいアプローチを導入する。
我々のOMHは既存のUSS法と比較して教師なしセグメンテーション性能がよい。
論文 参考訳(メタデータ) (2024-03-11T09:46:41Z) - A Machine Learning-Based Framework for Clustering Residential
Electricity Load Profiles to Enhance Demand Response Programs [0.0]
実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
本稿では,実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T11:23:26Z) - Interpretable Deep Clustering for Tabular Data [7.972599673048582]
クラスタリングは、データ分析で広く使われている基本的な学習タスクである。
本稿では,インスタンスとクラスタレベルでの解釈可能なクラスタ割り当てを予測する,新たなディープラーニングフレームワークを提案する。
提案手法は,生物,テキスト,画像,物理データセットのクラスタ割り当てを確実に予測できることを示す。
論文 参考訳(メタデータ) (2023-06-07T21:08:09Z) - A Generalized Framework for Predictive Clustering and Optimization [18.06697544912383]
クラスタリングは強力で広く使われているデータサイエンスツールです。
本稿では,予測クラスタリングのための一般化最適化フレームワークを定義する。
また,大域的最適化のためにMILP(mixed-integer linear programming)を利用する共同最適化手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T19:56:51Z) - ClusterNet: A Perception-Based Clustering Model for Scattered Data [16.326062082938215]
クラスタ分離は、一般的に広く使用されているクラスタリング技術によって取り組まれるタスクである。
本稿では,分散データを直接操作する学習戦略を提案する。
私たちは、ポイントベースのディープラーニングモデルであるClusterNetをトレーニングし、クラスタ分離性に対する人間の認識を反映するように訓練します。
論文 参考訳(メタデータ) (2023-04-27T13:41:12Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Overcoming Data Sparsity in Group Recommendation [52.00998276970403]
グループレコメンデータシステムは、ユーザの個人的な好みだけでなく、嗜好集約戦略も正確に学習できなければならない。
本稿では,BGEM(Bipartite Graphding Model)とGCN(Graph Convolutional Networks)を基本構造として,グループとユーザ表現を統一的に学習する。
論文 参考訳(メタデータ) (2020-10-02T07:11:19Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。