論文の概要: A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising
- arxiv url: http://arxiv.org/abs/2106.06224v1
- Date: Fri, 11 Jun 2021 08:07:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-14 14:05:45.000414
- Title: A Cooperative-Competitive Multi-Agent Framework for Auto-bidding in
Online Advertising
- Title(参考訳): オンライン広告における自動入札のための協調競争型マルチエージェントフレームワーク
- Authors: Chao Wen, Miao Xu, Zhilin Zhang, Zhenzhe Zheng, Yuhui Wang, Xiangyu
Liu, Yu Rong, Dong Xie, Xiaoyang Tan, Chuan Yu, Jian Xu, Fan Wu, Guihai Chen,
Xiaoqiang Zhu
- Abstract要約: 本稿では,自動入札のための総合的マルチエージェント強化学習フレームワーク,すなわちMAABを提案し,自動入札戦略を学習する。
当社のアプローチは、社会的福祉の観点から、いくつかの基準的手法を上回り、広告プラットフォームの収益を保証します。
- 参考スコア(独自算出の注目度): 53.636153252400945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In online advertising, auto-bidding has become an essential tool for
advertisers to optimize their preferred ad performance metrics by simply
expressing the high-level campaign objectives and constraints. Previous works
consider the design of auto-bidding agents from the single-agent view without
modeling the mutual influence between agents. In this paper, we instead
consider this problem from the perspective of a distributed multi-agent system,
and propose a general Multi-Agent reinforcement learning framework for
Auto-Bidding, namely MAAB, to learn the auto-bidding strategies. First, we
investigate the competition and cooperation relation among auto-bidding agents,
and propose temperature-regularized credit assignment for establishing a mixed
cooperative-competitive paradigm. By carefully making a competition and
cooperation trade-off among the agents, we can reach an equilibrium state that
guarantees not only individual advertiser's utility but also the system
performance (social welfare). Second, due to the observed collusion behaviors
of bidding low prices underlying the cooperation, we further propose bar agents
to set a personalized bidding bar for each agent, and then to alleviate the
degradation of revenue. Third, to deploy MAAB to the large-scale advertising
system with millions of advertisers, we propose a mean-field approach. By
grouping advertisers with the same objective as a mean auto-bidding agent, the
interactions among advertisers are greatly simplified, making it practical to
train MAAB efficiently. Extensive experiments on the offline industrial dataset
and Alibaba advertising platform demonstrate that our approach outperforms
several baseline methods in terms of social welfare and guarantees the ad
platform's revenue.
- Abstract(参考訳): オンライン広告において、自動入札は、単に高いレベルのキャンペーン目標と制約を表現するだけで、広告主が好む広告パフォーマンス指標を最適化するための必須のツールとなっている。
先行研究では,エージェント間の相互影響をモデル化することなく,単一エージェント視点からの自動入札エージェントの設計を検討する。
本稿では、分散マルチエージェントシステムの観点からこの問題を考察し、自動入札(MAAB)のための汎用マルチエージェント強化学習フレームワークを提案する。
まず, 自動入札エージェント間の競合関係と協調関係について検討し, 複合協調競争パラダイムを確立するための温度調整型クレジット割り当てを提案する。
エージェント間の競争と協力のトレードオフを慎重に行うことで、個々の広告主の効用だけでなくシステムパフォーマンス(社会福祉)も保証する均衡状態に達することができる。
第2に、協力の基盤となる低価格入札の結束行動が観察されていることから、各エージェントにパーソナライズされた入札バーを設定し、収益の低下を緩和するバーエージェントを提案する。
第3に,MAABを数百万の広告主による大規模広告システムに展開するために,平均場アプローチを提案する。
平均的な自動入札エージェントと同じ目的の広告主をグループ化することにより、広告主間のインタラクションが大幅に単純化され、maabの効率的なトレーニングが実現する。
オフライン産業データセットとalibaba広告プラットフォームに関する広範な実験は、我々のアプローチが社会福祉の観点からいくつかの基準手法を上回っており、広告プラットフォームの収益を保証していることを示している。
関連論文リスト
- AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - Bidding Strategies for Proportional Representation in Advertisement
Campaigns [8.269283912626873]
同一入札は、異なる種類の個人に対する不均一な競争のレベルが原因で、等質な結果が得られないことが示される。
プラットフォームメカニズムを変更しない変更を検討し、代わりに広告主が使用する入札戦略を変更します。
論文 参考訳(メタデータ) (2023-05-22T23:29:05Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Functional Optimization Reinforcement Learning for Real-Time Bidding [14.5826735379053]
リアルタイム入札はプログラム広告の新しいパラダイムである。
既存のアプローチは、入札最適化に十分なソリューションを提供するのに苦労しています。
本稿では,機能最適化を伴うRTBのためのマルチエージェント強化学習アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-25T06:12:17Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Bidding Agent Design in the LinkedIn Ad Marketplace [16.815498720115443]
オンラインマーケットプレースにおける自動入札エージェントの設計のための汎用最適化フレームワークを構築した。
結果として、フレームワークは、例えば、複数のプラットフォームにまたがる広告グループの共同最適化を可能にし、それぞれが独自のオークションフォーマットを実行している。
このフレームワークに基づいたLinkedInの広告マーケットプレースで、デプロイされた入札システムの実践的な学習を共有します。
論文 参考訳(メタデータ) (2022-02-25T03:01:57Z) - Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization
in e-Commercial Sponsored Search [26.117969395228503]
我々は,Multi-Agent Cooperative bidding Games (MACG) と呼ばれる新しい多目的協調入札最適化法を提案する。
すべての広告の全体的な利益を最大化するためのグローバルな目的が、より良い協力を奨励し、またセルフ入札の広告主を保護するために追加される。
タオバオプラットフォーム上でのオフライン実験とオンラインA/Bテストは、単一広告主の目標とグローバル利益の両方が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2021-06-08T03:18:28Z) - We Know What You Want: An Advertising Strategy Recommender System for
Online Advertising [26.261736843187045]
本稿では,ディスプレイ広告プラットフォーム上での動的入札戦略レコメンデーションのためのレコメンデーションシステムを提案する。
ニューラルネットワークをエージェントとして使用して,広告主のプロファイルや過去の採用行動に基づいて,広告主の要求を予測する。
オンライン評価は、広告主の広告パフォーマンスを最適化できることを示している。
論文 参考訳(メタデータ) (2021-05-25T17:06:59Z) - A novel auction system for selecting advertisements in Real-Time bidding [68.8204255655161]
リアルタイム入札(Real-Time Bidding)は、インターネット広告システムで、近年非常に人気を集めている。
本稿では、経済的な側面だけでなく、広告システムの機能にかかわる他の要因も考慮した、新たなアプローチによる代替ベッティングシステムを提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:41Z) - Dynamic Knapsack Optimization Towards Efficient Multi-Channel Sequential
Advertising [52.3825928886714]
我々は、動的knapsack問題として、シーケンシャルな広告戦略最適化を定式化する。
理論的に保証された二段階最適化フレームワークを提案し、元の最適化空間の解空間を大幅に削減する。
強化学習の探索効率を向上させるため,効果的な行動空間削減手法も考案した。
論文 参考訳(メタデータ) (2020-06-29T18:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。