論文の概要: Contextual Bandits for Advertising Campaigns: A Diffusion-Model
Independent Approach (Extended Version)
- arxiv url: http://arxiv.org/abs/2201.05231v1
- Date: Thu, 13 Jan 2022 22:06:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-18 00:38:05.907173
- Title: Contextual Bandits for Advertising Campaigns: A Diffusion-Model
Independent Approach (Extended Version)
- Title(参考訳): 広告キャンペーンにおけるコンテキストバンディット:拡散モデル独立アプローチ(拡張版)
- Authors: Alexandra Iacob, Bogdan Cautis, Silviu Maniu
- Abstract要約: 拡散ネットワークや情報伝達の仕方を決定するモデルについてはほとんど知られていないと考えられる影響問題について検討する。
この設定では、キャンペーンの実行中に主要な拡散パラメータを学習するために探索-探索アプローチが使用できる。
本稿では,2つの文脈的マルチアーム・バンディットの手法と,インフルエンサーの残りのポテンシャルに対する上限について比較する。
- 参考スコア(独自算出の注目度): 73.59962178534361
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by scenarios of information diffusion and advertising in social
media, we study an influence maximization problem in which little is assumed to
be known about the diffusion network or about the model that determines how
information may propagate. In such a highly uncertain environment, one can
focus on multi-round diffusion campaigns, with the objective to maximize the
number of distinct users that are influenced or activated, starting from a
known base of few influential nodes. During a campaign, spread seeds are
selected sequentially at consecutive rounds, and feedback is collected in the
form of the activated nodes at each round. A round's impact (reward) is then
quantified as the number of newly activated nodes. Overall, one must maximize
the campaign's total spread, as the sum of rounds' rewards. In this setting, an
explore-exploit approach could be used to learn the key underlying diffusion
parameters, while running the campaign. We describe and compare two methods of
contextual multi-armed bandits, with upper-confidence bounds on the remaining
potential of influencers, one using a generalized linear model and the
Good-Turing estimator for remaining potential (GLM-GT-UCB), and another one
that directly adapts the LinUCB algorithm to our setting (LogNorm-LinUCB). We
show that they outperform baseline methods using state-of-the-art ideas, on
synthetic and real-world data, while at the same time exhibiting different and
complementary behavior, depending on the scenarios in which they are deployed.
- Abstract(参考訳): ソーシャルメディアにおける情報拡散と広告のシナリオに動機づけられ,情報拡散ネットワークや情報の伝播方法を決定するモデルについてほとんど知られていない影響最大化問題について検討した。
このような極めて不確実な環境では、ほとんど影響力のないノードの既知の基盤から、影響を受け、活性化される異なるユーザ数を最大化することを目的として、マルチラウンド拡散キャンペーンに集中することができる。
キャンペーン中、スプレッドシードは連続するラウンドで順次選択され、各ラウンドの活性化ノードの形式でフィードバックが収集される。
ラウンドの影響(逆)は、新たに活性化されたノードの数として定量化される。
総じて、ラウンドの報酬の合計として、キャンペーン全体の広がりを最大化しなければならない。
この設定では、キャンペーンの実行中に主要な拡散パラメータを学習するために探索-探索アプローチが使用できる。
本稿では,LinUCBアルゴリズムを我々の設定(LogNorm-LinUCB)に直接適応させる手法と,一般線形モデルとGood-Turing 推定器(GLM-GT-UCB)を用いて,インフルエンサーの残余ポテンシャルに高信頼境界を持つコンテキスト多重武装バンドの2つの手法を記述・比較する。
現状のアイデアを用いたベースライン手法では, 合成データと実世界のデータを用いて, 同時に, 展開シナリオによって異なる相補的な振る舞いを示す。
関連論文リスト
- Influence Maximization via Graph Neural Bandits [54.45552721334886]
IM問題を多ラウンド拡散キャンペーンに設定し,影響を受けやすいユーザ数を最大化することを目的とした。
IM-GNB(Influence Maximization with Graph Neural Bandits)を提案する。
論文 参考訳(メタデータ) (2024-06-18T17:54:33Z) - Potential Field Based Deep Metric Learning [8.670873561640903]
ディープメトリック学習は、意味的に意味のある表現空間を学ぶためにネットワークを訓練する。
物理学における静電場に着想を得た新しい合成DMLモデルを提案する。
このような減衰は,クラス内変動が大きく,ラベルノイズも大きい実世界のデータセットの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2024-05-28T20:10:06Z) - Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data [102.16105233826917]
好みラベルからの学習は、微調整された大きな言語モデルにおいて重要な役割を果たす。
好みの微調整には、教師付き学習、オンライン強化学習(RL)、コントラスト学習など、いくつかの異なるアプローチがある。
論文 参考訳(メタデータ) (2024-04-22T17:20:18Z) - BayesPrompt: Prompting Large-Scale Pre-Trained Language Models on Few-shot Inference via Debiased Domain Abstraction [40.226752807366864]
本稿では,プロンプトチューニング手法が特定のショットパターンに一般化できないことを示す。
ドメイン識別情報を含むプロンプトを学習するためにベイズプロンプトを提案する。
本手法は,ベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-01-25T13:20:47Z) - Targeted Advertising on Social Networks Using Online Variational Tensor
Regression [19.586412285513962]
我々は、オンラインターゲティング広告のための最初の文脈的盗賊フレームワークであると考えるものを提案する。
提案するフレームワークは,多モードテンソルの形で,任意の特徴ベクトルに対応するように設計されている。
提案したUCBアルゴリズムは,ベンチマークによる影響タスクの大幅な改善を実現することを実証的に確認する。
論文 参考訳(メタデータ) (2022-08-22T22:10:45Z) - Provably Efficient Reinforcement Learning for Online Adaptive Influence
Maximization [53.11458949694947]
本稿では,リアルタイムフィードバックに基づいてシードノードを逐次活性化する,コンテンツ依存型オンライン影響問題の適応バージョンについて検討する。
提案アルゴリズムは,最適政策を楽観的に改善しつつ,ネットワークモデルの推定を保守し,適応的にシードを選択する。
論文 参考訳(メタデータ) (2022-06-29T18:17:28Z) - Uplifting Bandits [23.262188897812475]
報酬は複数の確率変数の和であり、各アクションはそれらの一部の分布だけを変化させるマルチアームバンディットモデルを導入する。
このモデルはマーケティングキャンペーンやレコメンデーションシステムによって動機付けられており、そこでは変数が個々の顧客の結果を表す。
ベースライン上のアクションの上昇を推定する UCB スタイルのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T18:00:56Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。