論文の概要: Convolutional Neural Bandit: Provable Algorithm for Visual-aware
Advertising
- arxiv url: http://arxiv.org/abs/2107.07438v1
- Date: Fri, 2 Jul 2021 03:02:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-18 12:25:14.735530
- Title: Convolutional Neural Bandit: Provable Algorithm for Visual-aware
Advertising
- Title(参考訳): 畳み込みニューラルバンド:ビジュアルアウェア広告のための確率的アルゴリズム
- Authors: Yikun Ban, Jingrui He
- Abstract要約: コンテクチュアルなマルチアームバンディットは、レコメンデーション手順に存在する探索・探索ジレンマを解決するための広告の適用に成功している。
本稿では,視覚的広告に触発され,文脈的帯域幅アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 41.30283330958433
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Online advertising is ubiquitous in web business. Image displaying is
considered as one of the most commonly used formats to interact with customers.
Contextual multi-armed bandit has shown success in the application of
advertising to solve the exploration-exploitation dilemma existed in the
recommendation procedure. Inspired by the visual-aware advertising, in this
paper, we propose a contextual bandit algorithm, where the convolutional neural
network (CNN) is utilized to learn the reward function along with an upper
confidence bound (UCB) for exploration. We also prove a near-optimal regret
bound $\tilde{\mathcal{O}}(\sqrt{T})$ when the network is over-parameterized
and establish strong connections with convolutional neural tangent kernel
(CNTK). Finally, we evaluate the empirical performance of the proposed
algorithm and show that it outperforms other state-of-the-art UCB-based bandit
algorithms on real-world image data sets.
- Abstract(参考訳): オンライン広告はウェブビジネスで広く使われている。
画像表示は、顧客と対話する最も一般的なフォーマットの1つであると考えられている。
コンテクチュアルなマルチアームバンディットは、レコメンデーション手順に存在する探索探索ジレンマを解決するための広告の適用に成功している。
本稿では,視覚的広告にインスパイアされた畳み込みニューラルネットワーク(CNN)を用いて,探索のための上位信頼境界(UCB)とともに報酬関数を学習するコンテキスト的帯域幅アルゴリズムを提案する。
また、ネットワークが過度にパラメータ化され、畳み込みニューラル・タンジェント・カーネル(CNTK)との強い接続が確立されたときに、ほぼ最適の後悔を$\tilde{\mathcal{O}}(\sqrt{T})$で証明する。
最後に,提案手法の有効性を評価し,実世界画像データセット上でのucbベースのバンディットアルゴリズムよりも優れていることを示す。
関連論文リスト
- Neural Exploitation and Exploration of Contextual Bandits [51.25537742455235]
本研究では,ニューラルネットワークを用いたコンテキスト型マルチアームバンディットの活用と探索について検討する。
EE-Netは、ニューラルベースによる新たなエクスプロイトと探索戦略である。
EE-Netは、実世界のデータセット上での線形およびニューラルネットワークの帯域ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-05T18:34:49Z) - Learning Contextual Bandits Through Perturbed Rewards [107.6210145983805]
標準正規性条件下では、$tildeO(tildedsqrtT)$ regret上界が達成可能であることを示す。
明示的な探索の必要性を排除するために、ニューラルネットワークを更新する際の報酬を混乱させます。
論文 参考訳(メタデータ) (2022-01-24T19:10:22Z) - Deep Upper Confidence Bound Algorithm for Contextual Bandit Ranking of
Information Selection [0.0]
CMAB(Contextual Multi-armed bandits)は、ユーザの関心に応じて情報のフィルタリングと優先順位付けを学習するために広く使用されている。
本研究は,トップKアームを反復的に選択して報酬を最大化するCMABフレームワークに基づくトップKランキングの分析である。
本稿では,Deep Up Confidence Bound (UCB)アルゴリズムという新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-08T13:32:14Z) - EE-Net: Exploitation-Exploration Neural Networks in Contextual Bandits [52.98326168071513]
EE-Netは、新しい探索戦略を持つニューラルネットワークベースのバンドイットアプローチである。
EE-Net が $mathcalO(sqrtTlog T)$ regret を達成することを示す。
論文 参考訳(メタデータ) (2021-10-07T04:12:36Z) - Neural Contextual Bandits with Deep Representation and Shallow
Exploration [105.8099566651448]
本稿では,深部ReLUニューラルネットワークの最後の隠蔽層を用いて,原特徴ベクトルを変換する新しい学習アルゴリズムを提案する。
既存のニューラルネットワークと比較して、ディープニューラルネットワークの最後の層でのみ探索する必要があるため、我々のアプローチは計算的にはるかに効率的です。
論文 参考訳(メタデータ) (2020-12-03T09:17:55Z) - Neural Thompson Sampling [94.82847209157494]
本稿では,ニューラルトンプソンサンプリング(Neural Thompson Smpling)と呼ばれる新しいアルゴリズムを提案する。
我々のアルゴリズムの中核は報酬の新たな後部分布であり、その平均はニューラルネットワーク近似器であり、その分散は対応するニューラルネットワークのニューラル・タンジェントな特徴に基づいて構築されている。
論文 参考訳(メタデータ) (2020-10-02T07:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。