論文の概要: Contextual Bandits for Advertising Campaigns: A Diffusion-Model
Independent Approach (Extended Version)
- arxiv url: http://arxiv.org/abs/2201.05231v1
- Date: Thu, 13 Jan 2022 22:06:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-18 00:38:05.907173
- Title: Contextual Bandits for Advertising Campaigns: A Diffusion-Model
Independent Approach (Extended Version)
- Title(参考訳): 広告キャンペーンにおけるコンテキストバンディット:拡散モデル独立アプローチ(拡張版)
- Authors: Alexandra Iacob, Bogdan Cautis, Silviu Maniu
- Abstract要約: 拡散ネットワークや情報伝達の仕方を決定するモデルについてはほとんど知られていないと考えられる影響問題について検討する。
この設定では、キャンペーンの実行中に主要な拡散パラメータを学習するために探索-探索アプローチが使用できる。
本稿では,2つの文脈的マルチアーム・バンディットの手法と,インフルエンサーの残りのポテンシャルに対する上限について比較する。
- 参考スコア(独自算出の注目度): 73.59962178534361
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by scenarios of information diffusion and advertising in social
media, we study an influence maximization problem in which little is assumed to
be known about the diffusion network or about the model that determines how
information may propagate. In such a highly uncertain environment, one can
focus on multi-round diffusion campaigns, with the objective to maximize the
number of distinct users that are influenced or activated, starting from a
known base of few influential nodes. During a campaign, spread seeds are
selected sequentially at consecutive rounds, and feedback is collected in the
form of the activated nodes at each round. A round's impact (reward) is then
quantified as the number of newly activated nodes. Overall, one must maximize
the campaign's total spread, as the sum of rounds' rewards. In this setting, an
explore-exploit approach could be used to learn the key underlying diffusion
parameters, while running the campaign. We describe and compare two methods of
contextual multi-armed bandits, with upper-confidence bounds on the remaining
potential of influencers, one using a generalized linear model and the
Good-Turing estimator for remaining potential (GLM-GT-UCB), and another one
that directly adapts the LinUCB algorithm to our setting (LogNorm-LinUCB). We
show that they outperform baseline methods using state-of-the-art ideas, on
synthetic and real-world data, while at the same time exhibiting different and
complementary behavior, depending on the scenarios in which they are deployed.
- Abstract(参考訳): ソーシャルメディアにおける情報拡散と広告のシナリオに動機づけられ,情報拡散ネットワークや情報の伝播方法を決定するモデルについてほとんど知られていない影響最大化問題について検討した。
このような極めて不確実な環境では、ほとんど影響力のないノードの既知の基盤から、影響を受け、活性化される異なるユーザ数を最大化することを目的として、マルチラウンド拡散キャンペーンに集中することができる。
キャンペーン中、スプレッドシードは連続するラウンドで順次選択され、各ラウンドの活性化ノードの形式でフィードバックが収集される。
ラウンドの影響(逆)は、新たに活性化されたノードの数として定量化される。
総じて、ラウンドの報酬の合計として、キャンペーン全体の広がりを最大化しなければならない。
この設定では、キャンペーンの実行中に主要な拡散パラメータを学習するために探索-探索アプローチが使用できる。
本稿では,LinUCBアルゴリズムを我々の設定(LogNorm-LinUCB)に直接適応させる手法と,一般線形モデルとGood-Turing 推定器(GLM-GT-UCB)を用いて,インフルエンサーの残余ポテンシャルに高信頼境界を持つコンテキスト多重武装バンドの2つの手法を記述・比較する。
現状のアイデアを用いたベースライン手法では, 合成データと実世界のデータを用いて, 同時に, 展開シナリオによって異なる相補的な振る舞いを示す。
関連論文リスト
- Behavioral Refinement via Interpolant-based Policy Diffusion [17.63910869653275]
拡散モデルは、標準ガウスノイズから作用(あるいは状態)を拡散することでポリシーを形成することを学習する。
学習対象のポリシーはガウスとは大きく異なり、少数の拡散ステップを使用すると性能が低下する可能性がある。
我々の手法はBRIDGERと呼ばれ、補間フレームワークを利用して任意のポリシーをブリッジし、模倣学習への柔軟なアプローチを可能にする。
論文 参考訳(メタデータ) (2024-02-25T12:19:21Z) - BayesPrompt: Prompting Large-Scale Pre-Trained Language Models on
Few-shot Inference via Debiased Domain Abstraction [42.243952316121636]
本稿では,プロンプトチューニング手法が特定のショットパターンに一般化できないことを示す。
ドメイン識別情報を含むプロンプトを学習するためにベイズプロンプトを提案する。
本手法は,ベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-01-25T13:20:47Z) - MADAv2: Advanced Multi-Anchor Based Active Domain Adaptation
Segmentation [98.09845149258972]
セマンティックセグメンテーションタスクに関するドメイン適応を支援するために,アクティブなサンプル選択を導入する。
これらのサンプルを手動でアノテートする作業量が少ないため、ターゲット領域分布の歪みを効果的に緩和することができる。
長期分布問題を緩和するために、強力な半教師付きドメイン適応戦略を提案する。
論文 参考訳(メタデータ) (2023-01-18T07:55:22Z) - Targeted Advertising on Social Networks Using Online Variational Tensor
Regression [19.586412285513962]
我々は、オンラインターゲティング広告のための最初の文脈的盗賊フレームワークであると考えるものを提案する。
提案するフレームワークは,多モードテンソルの形で,任意の特徴ベクトルに対応するように設計されている。
提案したUCBアルゴリズムは,ベンチマークによる影響タスクの大幅な改善を実現することを実証的に確認する。
論文 参考訳(メタデータ) (2022-08-22T22:10:45Z) - Domain-Specific Risk Minimization for Out-of-Distribution Generalization [104.17683265084757]
まず、適応性ギャップを明示的に考慮した一般化境界を確立する。
本稿では,目標に対するより良い仮説の選択を導くための効果的なギャップ推定法を提案する。
もう1つの方法は、オンラインターゲットサンプルを用いてモデルパラメータを適応させることにより、ギャップを最小化することである。
論文 参考訳(メタデータ) (2022-08-18T06:42:49Z) - Provably Efficient Reinforcement Learning for Online Adaptive Influence
Maximization [53.11458949694947]
本稿では,リアルタイムフィードバックに基づいてシードノードを逐次活性化する,コンテンツ依存型オンライン影響問題の適応バージョンについて検討する。
提案アルゴリズムは,最適政策を楽観的に改善しつつ,ネットワークモデルの推定を保守し,適応的にシードを選択する。
論文 参考訳(メタデータ) (2022-06-29T18:17:28Z) - Uplifting Bandits [23.262188897812475]
報酬は複数の確率変数の和であり、各アクションはそれらの一部の分布だけを変化させるマルチアームバンディットモデルを導入する。
このモデルはマーケティングキャンペーンやレコメンデーションシステムによって動機付けられており、そこでは変数が個々の顧客の結果を表す。
ベースライン上のアクションの上昇を推定する UCB スタイルのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T18:00:56Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - Deep Bayesian Bandits: Exploring in Online Personalized Recommendations [4.845576821204241]
我々は、表示広告レコメンデータを文脈的盗賊として定式化する。
クリックスルーレートの後部分布からのサンプリングを必要とする探索手法を実装した。
提案したディープベイズ帯域幅アルゴリズムをオフラインシミュレーションとオンラインAB設定で検証した。
論文 参考訳(メタデータ) (2020-08-03T08:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。