論文の概要: Expert with Clustering: Hierarchical Online Preference Learning Framework
- arxiv url: http://arxiv.org/abs/2401.15062v2
- Date: Mon, 24 Jun 2024 13:03:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 02:22:43.351764
- Title: Expert with Clustering: Hierarchical Online Preference Learning Framework
- Title(参考訳): クラスタリングの専門家:階層的なオンライン推論学習フレームワーク
- Authors: Tianyue Zhou, Jung-Hoon Cho, Babak Rahimi Ardabili, Hamed Tabkhi, Cathy Wu,
- Abstract要約: Expert with Clustering (EWC)は、クラスタリングのテクニックと予測を専門家のアドバイスと統合した階層的なコンテキスト的バンディットフレームワークである。
EWCはLinUCBベースラインと比較して後悔を27.57%減らすことができる。
- 参考スコア(独自算出の注目度): 4.05836962263239
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emerging mobility systems are increasingly capable of recommending options to mobility users, to guide them towards personalized yet sustainable system outcomes. Even more so than the typical recommendation system, it is crucial to minimize regret, because 1) the mobility options directly affect the lives of the users, and 2) the system sustainability relies on sufficient user participation. In this study, we consider accelerating user preference learning by exploiting a low-dimensional latent space that captures the mobility preferences of users. We introduce a hierarchical contextual bandit framework named Expert with Clustering (EWC), which integrates clustering techniques and prediction with expert advice. EWC efficiently utilizes hierarchical user information and incorporates a novel Loss-guided Distance metric. This metric is instrumental in generating more representative cluster centroids. In a recommendation scenario with $N$ users, $T$ rounds per user, and $K$ options, our algorithm achieves a regret bound of $O(N\sqrt{T\log K} + NT)$. This bound consists of two parts: the first term is the regret from the Hedge algorithm, and the second term depends on the average loss from clustering. To the best of the authors knowledge, this is the first work to analyze the regret of an integrated expert algorithm with k-Means clustering. This regret bound underscores the theoretical and experimental efficacy of EWC, particularly in scenarios that demand rapid learning and adaptation. Experimental results highlight that EWC can substantially reduce regret by 27.57% compared to the LinUCB baseline. Our work offers a data-efficient approach to capturing both individual and collective behaviors, making it highly applicable to contexts with hierarchical structures. We expect the algorithm to be applicable to other settings with layered nuances of user preferences and information.
- Abstract(参考訳): 新たなモビリティシステムは、パーソナライズされた持続可能なシステム成果へのガイドとして、モビリティユーザに選択肢を推奨する能力がますます高まっている。
一般的なレコメンデーションシステムよりも、後悔を最小限に抑えることが重要です。
1)移動手段は利用者の生活に直接影響を与え、
2)システムサステナビリティは,十分なユーザ参加に依存している。
本研究では,ユーザのモビリティの嗜好を捉えた低次元潜在空間を活用することで,ユーザの嗜好学習の促進を検討する。
本稿では,クラスタリング技術と予測を専門家のアドバイスと統合した,クラスタリングによるエキスパート(Expert with Clustering, EWC)という階層的なコンテキスト的帯域幅フレームワークを紹介する。
EWCは階層的ユーザ情報を効率的に利用し、新しいロス誘導距離計を組み込む。
この計量は、より代表的なクラスターセントロイドを生成するのに役立っている。
ユーザ毎の$N$,ユーザ毎の$T$,オプション毎の$K$のレコメンデーションシナリオでは,我々のアルゴリズムは,O(N\sqrt{T\log K} + NT)$の後悔の限界を達成している。
この境界は2つの部分から構成される: 第一項はヘッジアルゴリズムの後悔であり、第二項はクラスタリングからの平均損失に依存する。
著者の知る限りでは、これはk-Meansクラスタリングによる統合専門家アルゴリズムの後悔を分析する最初の研究である。
この後悔は、特に急激な学習と適応を必要とするシナリオにおいて、EWCの理論的および実験的有効性を強調している。
実験の結果、EWCはLinUCBベースラインと比較して、後悔を27.57%減らすことができた。
我々の研究は、個人と集団の両方の振る舞いを捉えるためのデータ効率のよいアプローチを提供し、階層構造を持つコンテキストに適用できる。
このアルゴリズムは、ユーザの好みや情報の階層化されたニュアンスを持つ他の設定に適用できることを期待している。
関連論文リスト
- Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - The Nah Bandit: Modeling User Non-compliance in Recommendation Systems [2.421459418045937]
Expert with Clustering(EWC)は、推奨オプションと推奨されないオプションの両方からのフィードバックを取り入れた階層的なアプローチで、ユーザの好み学習を加速する。
EWCは教師付き学習と伝統的な文脈的バンディットアプローチの両方を上回ります。
この研究は、より効果的なレコメンデーションシステムのための堅牢なフレームワークを提供する、Nah Banditにおける将来の研究の基礎を築いた。
論文 参考訳(メタデータ) (2024-08-15T03:01:02Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - ClusterSeq: Enhancing Sequential Recommender Systems with Clustering
based Meta-Learning [3.168790535780547]
ClusterSeqはメタラーニングクラスタリングに基づくシーケンスレコメンダシステムである。
ユーザシーケンスの動的情報を利用して、サイド情報がない場合でもアイテム予測精度を高める。
提案手法は平均相反ランク(MRR)において16~39%の大幅な改善を実現する。
論文 参考訳(メタデータ) (2023-07-25T18:53:24Z) - Understanding or Manipulation: Rethinking Online Performance Gains of
Modern Recommender Systems [38.75457258877731]
本稿では,推薦アルゴリズムの操作度をベンチマークするフレームワークを提案する。
オンラインクリックスルー率が高いことは、必ずしもユーザーの初期嗜好をよりよく理解するという意味ではない。
我々は,制約付きユーザ嗜好操作による最適化問題として,将来のレコメンデーションアルゴリズムの研究を取り扱うべきであることを主張する。
論文 参考訳(メタデータ) (2022-10-11T17:56:55Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z) - An Efficient Framework for Clustered Federated Learning [26.24231986590374]
本稿では,ユーザがクラスタに分散するフェデレーション学習(FL)の問題に対処する。
反復フェデレーションクラスタリングアルゴリズム(IFCA)を提案する。
ニューラルネットワークのような非分割問題では,アルゴリズムが効率的であることを示す。
論文 参考訳(メタデータ) (2020-06-07T08:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。