論文の概要: CoCoB: Adaptive Collaborative Combinatorial Bandits for Online Recommendation
- arxiv url: http://arxiv.org/abs/2505.03840v1
- Date: Mon, 05 May 2025 05:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.863062
- Title: CoCoB: Adaptive Collaborative Combinatorial Bandits for Online Recommendation
- Title(参考訳): CoCoB: オンラインレコメンデーションのためのアダプティブコラボレーティブなコンビニティブバンド
- Authors: Cairong Yan, Jinyi Han, Jin Ju, Yanting Zhang, Zijian Wang, Xuan Shao,
- Abstract要約: 本稿では,CoCoBの適応的組合せ帯域幅アルゴリズムを提案する。
CoCoBは革新的な二面バンディットアーキテクチャを採用し、ユーザーとアイテムの両方にバンディットの原則を適用している。
3つの実世界のデータセットの実験では、CoCoBの有効性が示され、最先端の手法よりも平均2.4%のF1スコアが向上した。
- 参考スコア(独自算出の注目度): 3.789330380841338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering bandits have gained significant attention in recommender systems by leveraging collaborative information from neighboring users to better capture target user preferences. However, these methods often lack a clear definition of similar users and face challenges when users with unique preferences lack appropriate neighbors. In such cases, relying on divergent preferences of misidentified neighbors can degrade recommendation quality. To address these limitations, this paper proposes an adaptive Collaborative Combinatorial Bandits algorithm (CoCoB). CoCoB employs an innovative two-sided bandit architecture, applying bandit principles to both the user and item sides. The user-bandit employs an enhanced Bayesian model to explore user similarity, identifying neighbors based on a similarity probability threshold. The item-bandit treats items as arms, generating diverse recommendations informed by the user-bandit's output. CoCoB dynamically adapts, leveraging neighbor preferences when available or focusing solely on the target user otherwise. Regret analysis under a linear contextual bandit setting and experiments on three real-world datasets demonstrate CoCoB's effectiveness, achieving an average 2.4% improvement in F1 score over state-of-the-art methods.
- Abstract(参考訳): クラスタリングの帯域幅は、近隣のユーザからの協調的な情報を活用して、ターゲットのユーザの嗜好をよりよく捉えることで、レコメンデーションシステムにおいて大きな注目を集めている。
しかし、これらの手法は、しばしば類似したユーザーを明確に定義しておらず、固有の好みを持つユーザーが適切な隣人を欠いている場合、課題に直面している。
このような場合、誤識別された隣人の異質な嗜好に頼れば、推奨品質を低下させる可能性がある。
本稿では,これらの制約に対処するため,適応型コラボレーティブ・コンビナート・バンド・アルゴリズム(CoCoB)を提案する。
CoCoBは革新的な二面バンディットアーキテクチャを採用し、ユーザーとアイテムの両方にバンディットの原則を適用している。
ユーザバンドは、拡張ベイズモデルを用いて、類似度確率閾値に基づいて隣人を識別する。
アイテムバンドはアイテムを武器として扱い、ユーザバンドの出力によって通知される多様なレコメンデーションを生成する。
CoCoBは動的に適応し、利用可能であれば隣人の好みを利用するか、ターゲットとするユーザのみにフォーカスする。
線形文脈的帯域設定の下での回帰分析と3つの実世界のデータセットの実験は、CoCoBの有効性を示し、最先端の手法よりも平均2.4%改善されたF1スコアを達成する。
関連論文リスト
- Empowering Retrieval-based Conversational Recommendation with Contrasting User Preferences [12.249992789091415]
我々は、Contrasting user pReference expAnsion and Learning (CORAL)と呼ばれる対話型推薦モデルを提案する。
コーラルは、ユーザの隠れた好みを、コントラストの好み拡張によって抽出する。
対照的な選好を明確に区別し、選好認識学習を通じてレコメンデーションプロセスに活用する。
論文 参考訳(メタデータ) (2025-03-27T21:45:49Z) - Interactive Visualization Recommendation with Hier-SUCB [52.11209329270573]
本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文 参考訳(メタデータ) (2025-02-05T17:14:45Z) - Online Clustering of Dueling Bandits [59.09590979404303]
本稿では、優先フィードバックに基づく協調的な意思決定を可能にするために、最初の「デュエルバンディットアルゴリズムのクラスタリング」を導入する。
本稿では,(1)ユーザ報酬関数をコンテキストベクトルの線形関数としてモデル化する線形デューリング帯域のクラスタリング(COLDB)と,(2)ニューラルネットワークを用いて複雑な非線形ユーザ報酬関数をモデル化するニューラルデューリング帯域のクラスタリング(CONDB)の2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-04T07:55:41Z) - BanditMF: Multi-Armed Bandit Based Matrix Factorization Recommender
System [0.0]
マルチアーム・バンディット(MAB)は、探索と搾取のバランスをとるために原則化されたオンライン学習アプローチを提供する。
協調フィルタリング(CF)は、おそらく推奨システムにおいて最も早く、最も影響力のある手法である。
BanditMFは、マルチアームバンディットアルゴリズムと協調フィルタリングの2つの課題に対処するように設計されている。
論文 参考訳(メタデータ) (2021-06-21T07:35:39Z) - When and Whom to Collaborate with in a Changing Environment: A
Collaborative Dynamic Bandit Solution [36.76450390135742]
協調バンディットアルゴリズムは、協調フィルタリング技術を用いて、オンラインインタラクティブレコメンデーションにおけるサンプル効率を改善する。
すべての既存の共同バンディット学習ソリューションは、環境に関する定常的な仮定を課します。
我々は,環境変化に対応するための協調型動的バンディットソリューションを開発した。
論文 参考訳(メタデータ) (2021-04-14T22:15:58Z) - SetRank: A Setwise Bayesian Approach for Collaborative Ranking from
Implicit Feedback [50.13745601531148]
提案手法は,提案システムにおける暗黙的フィードバックの特性に対応するために,協調的ランキング(SeetRank)のためのセッティングワイドベイズ的手法を提案する。
具体的には、SetRankは、新しい設定された選好比較の後方確率を最大化することを目的としている。
また、SetRankの理論解析により、余剰リスクの境界が$sqrtM/N$に比例できることを示す。
論文 参考訳(メタデータ) (2020-02-23T06:40:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。