論文の概要: Recommenadation aided Caching using Combinatorial Multi-armed Bandits
- arxiv url: http://arxiv.org/abs/2405.00080v2
- Date: Fri, 3 May 2024 07:29:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-06 16:58:34.550438
- Title: Recommenadation aided Caching using Combinatorial Multi-armed Bandits
- Title(参考訳): コンビニアルマルチアームバンドによるキャッシング支援
- Authors: Pavamana K J, Chandramani Kishore Singh,
- Abstract要約: 本研究では,有限容量キャッシュを備えた基地局を介してユーザが接続する無線ネットワークにおいて,コンテントキャッシュとレコメンデーションを併用したコンテントキャッシュについて検討する。
コンテンツのサブセットをユーザに推奨して、ユーザがこれらのコンテンツをリクエストするように促すことができます。
- 参考スコア(独自算出の注目度): 0.06554326244334867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study content caching with recommendations in a wireless network where the users are connected through a base station equipped with a finite-capacity cache. We assume a fixed set of contents with unknown user preferences and content popularities. We can recommend a subset of the contents to the users which encourages the users to request these contents. Recommendation can thus be used to increase cache hits. We formulate the cache hit optimization problem as a combinatorial multi-armed bandit (CMAB). We propose a UCB-based algorithm to decide which contents to cache and recommend. We provide an upper bound on the regret of our algorithm. We numerically demonstrate the performance of our algorithm and compare it to state-of-the-art algorithms.
- Abstract(参考訳): 本研究では,有限容量キャッシュを備えた基地局を介してユーザが接続する無線ネットワークにおいて,コンテントキャッシュとレコメンデーションを併用したコンテントキャッシュについて検討する。
我々は、未知のユーザー好みとコンテンツ人気のあるコンテンツセットを仮定する。
コンテンツのサブセットをユーザに推奨し、ユーザがこれらのコンテンツをリクエストするように促すことができます。
これにより、キャッシュヒットの増加にレコメンデーションが使用できる。
キャッシュヒット最適化問題をCMAB (combintorial multi-armed bandit) として定式化する。
キャッシュとレコメンデーションを決定するための UCB ベースのアルゴリズムを提案する。
我々はアルゴリズムの後悔に上限を与えている。
本稿では,アルゴリズムの性能を数値的に検証し,最先端のアルゴリズムと比較する。
関連論文リスト
- Cache-Aware Reinforcement Learning in Large-Scale Recommender Systems [10.52021139266752]
キャッシュ対応強化学習(CARL)は、リアルタイム計算とキャッシュによる推薦を協調的に最適化する手法である。
CARLは、結果キャッシュを考慮すると、ユーザのエンゲージメントを大幅に改善できる。
CARLはKwaiアプリで完全にローンチされ、1億人以上のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2024-04-23T12:06:40Z) - Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Caching Contents with Varying Popularity using Restless Bandits [0.3093890460224435]
本研究では,無線エッジ(例えば基地局)におけるコンテンツキャッシングの問題について検討し,無限水平線上で発生する割引コストを最小化する。
これらの構造的結果を用いて、問題の索引可能性を証明するとともに、割引コストを最小限に抑えるためにWhittleインデックスポリシーを使用する。
論文 参考訳(メタデータ) (2022-10-31T16:24:45Z) - Predictive Edge Caching through Deep Mining of Sequential Patterns in
User Content Retrievals [34.716416311132946]
本稿では,より詳細な学習モデルを用いて,将来的なコンテンツ人気を予測する新しい予測エッジキャッシング(PEC)システムを提案する。
PECは、非常にダイナミックなコンテンツの人気に適応し、キャッシュヒット率を大幅に改善し、ユーザのコンテンツ検索遅延を低減できる。
論文 参考訳(メタデータ) (2022-10-06T03:24:19Z) - Incentivizing Combinatorial Bandit Exploration [87.08827496301839]
自己関心のあるユーザに対してレコメンデーションシステムでアクションを推奨するバンディットアルゴリズムを考える。
ユーザーは他のアクションを自由に選択でき、アルゴリズムの推奨に従うためにインセンティブを得る必要がある。
ユーザは悪用を好むが、アルゴリズムは、前のユーザから収集した情報を活用することで、探索にインセンティブを与えることができる。
論文 参考訳(メタデータ) (2022-06-01T13:46:25Z) - Accelerating Deep Learning Classification with Error-controlled
Approximate-key Caching [72.50506500576746]
我々は、近似キーキャッシングと名付けた新しいキャッシングパラダイムを提案する。
近似キャッシュはDL推論の負荷を軽減し、システムのスループットを向上するが、近似誤差を導入する。
我々は古典的なLRUと理想的なキャッシュのキャッシュシステム性能を解析的にモデル化し、期待される性能のトレース駆動評価を行い、提案手法の利点を最先端の類似キャッシュと比較した。
論文 参考訳(メタデータ) (2021-12-13T13:49:11Z) - Caching Placement and Resource Allocation for Cache-Enabling UAV NOMA
Networks [87.6031308969681]
本稿では,非直交多重アクセス(NOMA)をサポートした大規模アクセス機能を有する無人航空機(UAV)セルネットワークについて検討する。
コンテンツ配信遅延最小化のための長期キャッシュ配置と資源配分最適化問題をマルコフ決定プロセス(MDP)として定式化する。
そこで我々は,UAVがemphsoft $varepsilon$-greedy戦略を用いて行動の学習と選択を行い,行動と状態の最適な一致を探索する,Qラーニングに基づくキャッシュ配置とリソース割り当てアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-12T08:33:51Z) - Fast Distributed Bandits for Online Recommendation Systems [22.447455071649852]
コンテキスト帯域幅アルゴリズムは、コンテンツの人気が急速に変化するレコメンデーションシステムで一般的に使用される。
近年,ユーザ間のクラスタリングやソーシャル構造を学習するリコメンデーションアルゴリズムは,高いレコメンデーション精度を示した。
最先端の分散バンディットアルゴリズム(DCCB)は、分散ワーカー間で情報を共有するためにピアツーピアのネットワークに依存している。
本稿では,DistCLUBと呼ばれる分散帯域幅に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-16T01:18:08Z) - Reinforcement Learning for Caching with Space-Time Popularity Dynamics [61.55827760294755]
キャッシングは次世代ネットワークにおいて重要な役割を果たすと想定されている。
コンテンツをインテリジェントにプリフェッチし、保存するためには、キャッシュノードは、何といつキャッシュするかを学ばなければならない。
本章では、近似キャッシングポリシー設計のための多目的強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-19T01:23:51Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。