論文の概要: Expert with Clustering: Hierarchical Online Preference Learning
Framework
- arxiv url: http://arxiv.org/abs/2401.15062v1
- Date: Fri, 26 Jan 2024 18:44:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 14:16:43.286591
- Title: Expert with Clustering: Hierarchical Online Preference Learning
Framework
- Title(参考訳): expert with clustering:階層型オンライン選好学習フレームワーク
- Authors: Tianyue Zhou, Jung-Hoon Cho, Babak Rahimi Ardabili, Hamed Tabkhi, and
Cathy Wu
- Abstract要約: Expert with Clustering (EWC) は階層的なコンテキスト的バンディットフレームワークである。
EWCは階層的ユーザ情報を効率的に利用し、新しいロス誘導距離計を組み込む。
EWCはLinUCBベースラインと比較して後悔を27.57%減らすことができる。
- 参考スコア(独自算出の注目度): 4.05836962263239
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emerging mobility systems are increasingly capable of recommending options to
mobility users, to guide them towards personalized yet sustainable system
outcomes. Even more so than the typical recommendation system, it is crucial to
minimize regret, because 1) the mobility options directly affect the lives of
the users, and 2) the system sustainability relies on sufficient user
participation. In this study, we consider accelerating user preference learning
by exploiting a low-dimensional latent space that captures the mobility
preferences of users. We introduce a hierarchical contextual bandit framework
named Expert with Clustering (EWC), which integrates clustering techniques and
prediction with expert advice. EWC efficiently utilizes hierarchical user
information and incorporates a novel Loss-guided Distance metric. This metric
is instrumental in generating more representative cluster centroids. In a
recommendation scenario with $N$ users, $T$ rounds per user, and $K$ options,
our algorithm achieves a regret bound of $O(N\sqrt{T\log K} + NT)$. This bound
consists of two parts: the first term is the regret from the Hedge algorithm,
and the second term depends on the average loss from clustering. The algorithm
performs with low regret, especially when a latent hierarchical structure
exists among users. This regret bound underscores the theoretical and
experimental efficacy of EWC, particularly in scenarios that demand rapid
learning and adaptation. Experimental results highlight that EWC can
substantially reduce regret by 27.57% compared to the LinUCB baseline. Our work
offers a data-efficient approach to capturing both individual and collective
behaviors, making it highly applicable to contexts with hierarchical
structures. We expect the algorithm to be applicable to other settings with
layered nuances of user preferences and information.
- Abstract(参考訳): 新たなモビリティシステムは、パーソナライズされた持続可能なシステム成果に向けて、モビリティユーザーに選択肢を推奨する能力がますます高まっている。
一般的なレコメンデーションシステムよりも、後悔を最小限に抑えることが重要です。
1)移動手段は利用者の生活に直接影響を与え、
2)システムサステナビリティは十分なユーザ参加に依存している。
本研究では,ユーザのモビリティ嗜好を捉えた低次元の潜在空間を活用し,ユーザの嗜好学習の促進を検討する。
本稿では,クラスタ化手法と予測手法を専門家のアドバイスと統合した,階層的コンテキスト的バンディットフレームワークであるexpert with clustering (ewc)を提案する。
EWCは階層的ユーザ情報を効率的に利用し、新しいロス誘導距離計を組み込む。
この計量は、より代表的な中心体を生成するのに役立つ。
ユーザ毎の$N$,ユーザ毎の$T$,オプション毎の$K$のレコメンデーションシナリオでは,我々のアルゴリズムは,O(N\sqrt{T\log K} + NT)$の後悔の限界を達成している。
この境界は2つの部分から構成される: 第一項はヘッジアルゴリズムの後悔であり、第二項はクラスタリングからの平均損失に依存する。
このアルゴリズムは、特にユーザ間に潜在階層構造が存在する場合、低い後悔で実行される。
この後悔は、特に急速な学習と適応を必要とするシナリオにおいて、ewcの理論的および実験的有効性を強調する。
実験の結果、EWCはLinUCBベースラインと比較して、後悔を27.57%減らすことができた。
我々の研究は、個人と集団の両方の振る舞いを捉えるためのデータ効率のよいアプローチを提供し、階層構造を持つコンテキストに適用できる。
このアルゴリズムは、ユーザの好みと情報の層的なニュアンスを持つ他の設定にも適用できることを期待している。
関連論文リスト
- The Nah Bandit: Modeling User Non-compliance in Recommendation Systems [2.421459418045937]
Expert with Clustering(EWC)は、推奨オプションと推奨されないオプションの両方からのフィードバックを取り入れた階層的なアプローチで、ユーザの好み学習を加速する。
EWCは教師付き学習と伝統的な文脈的バンディットアプローチの両方を上回ります。
この研究は、より効果的なレコメンデーションシステムのための堅牢なフレームワークを提供する、Nah Banditにおける将来の研究の基礎を築いた。
論文 参考訳(メタデータ) (2024-08-15T03:01:02Z) - Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - A Machine Learning-Based Framework for Clustering Residential
Electricity Load Profiles to Enhance Demand Response Programs [0.0]
実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
本稿では,実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T11:23:26Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - ClusterSeq: Enhancing Sequential Recommender Systems with Clustering
based Meta-Learning [3.168790535780547]
ClusterSeqはメタラーニングクラスタリングに基づくシーケンスレコメンダシステムである。
ユーザシーケンスの動的情報を利用して、サイド情報がない場合でもアイテム予測精度を高める。
提案手法は平均相反ランク(MRR)において16~39%の大幅な改善を実現する。
論文 参考訳(メタデータ) (2023-07-25T18:53:24Z) - Understanding or Manipulation: Rethinking Online Performance Gains of
Modern Recommender Systems [38.75457258877731]
本稿では,推薦アルゴリズムの操作度をベンチマークするフレームワークを提案する。
オンラインクリックスルー率が高いことは、必ずしもユーザーの初期嗜好をよりよく理解するという意味ではない。
我々は,制約付きユーザ嗜好操作による最適化問題として,将来のレコメンデーションアルゴリズムの研究を取り扱うべきであることを主張する。
論文 参考訳(メタデータ) (2022-10-11T17:56:55Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z) - An Efficient Framework for Clustered Federated Learning [26.24231986590374]
本稿では,ユーザがクラスタに分散するフェデレーション学習(FL)の問題に対処する。
反復フェデレーションクラスタリングアルゴリズム(IFCA)を提案する。
ニューラルネットワークのような非分割問題では,アルゴリズムが効率的であることを示す。
論文 参考訳(メタデータ) (2020-06-07T08:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。