論文の概要: MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding
- arxiv url: http://arxiv.org/abs/2002.07408v2
- Date: Wed, 6 Jul 2022 05:07:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 19:15:25.768822
- Title: MoTiAC: Multi-Objective Actor-Critics for Real-Time Bidding
- Title(参考訳): MoTiAC: リアルタイム入札のための多目的アクタークリティカル
- Authors: Haolin Zhou, Chaoqi Yang, Xiaofeng Gao, Qiong Chen, Gongshen Liu and
Guihai Chen
- Abstract要約: そこで本研究では,MoTiACというマルチエクティブ・アクタ・クリティカルスアルゴリズムを提案する。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
- 参考スコア(独自算出の注目度): 47.555870679348416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online Real-Time Bidding (RTB) is a complex auction game among which
advertisers struggle to bid for ad impressions when a user request occurs.
Considering display cost, Return on Investment (ROI), and other influential Key
Performance Indicators (KPIs), large ad platforms try to balance the trade-off
among various goals in dynamics. To address the challenge, we propose a
Multi-ObjecTive Actor-Critics algorithm based on reinforcement learning (RL),
named MoTiAC, for the problem of bidding optimization with various goals. In
MoTiAC, objective-specific agents update the global network asynchronously with
different goals and perspectives, leading to a robust bidding policy. Unlike
previous RL models, the proposed MoTiAC can simultaneously fulfill
multi-objective tasks in complicated bidding environments. In addition, we
mathematically prove that our model will converge to Pareto optimality.
Finally, experiments on a large-scale real-world commercial dataset from
Tencent verify the effectiveness of MoTiAC versus a set of recent approaches
- Abstract(参考訳): オンラインリアルタイム入札(英語: Online Real-Time Bidding, RTB)は、広告主が広告インプレッションを競う複雑なオークションゲームである。
ディスプレイコストやROI(Return on Investment)、その他の影響力のあるキーパフォーマンス指標(KPI)を考慮すると、大きな広告プラットフォームは、ダイナミックスにおけるさまざまな目標間のトレードオフのバランスをとろうとします。
この課題を解決するために,MoTiACと呼ばれる強化学習(RL)に基づくマルチObjecTive Actor-Criticsアルゴリズムを提案する。
MoTiACでは、客観的なエージェントが異なる目標と視点でグローバルネットワークを非同期に更新し、堅牢な入札ポリシーにつながる。
従来のRLモデルとは異なり、提案されたMoTiACは複雑な入札環境で同時に多目的タスクを達成できる。
さらに、我々のモデルがパレート最適性に収束することを数学的に証明する。
最後に、Tencentの大規模実世界の商用データセットの実験は、MoTiACの有効性と最近の一連のアプローチの有効性を検証する。
関連論文リスト
- MODRL-TA:A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search [13.893431289065997]
本稿では、多目的Q-ラーニング(MOQ)と、クロスエントロピー法(CEM)に基づく決定融合アルゴリズム(DFM)と、プログレッシブデータ拡張システム(PDA)からなる多目的深層強化学習フレームワークを提案する。
実世界のオンラインeコマースシステムの実験は、MODRL-TAの大幅な改善を実証している。
論文 参考訳(メタデータ) (2024-07-22T08:40:27Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - Exploring Missing Modality in Multimodal Egocentric Datasets [89.76463983679058]
モダリティが欠如している場合でも,MMT(Missing Modality Token)という新しい概念を導入してパフォーマンスを維持する。
テストセットの半分がモダル不完全である場合、元の$sim 30%$ dropから$sim 10%$に減らします。
論文 参考訳(メタデータ) (2024-01-21T11:55:42Z) - Lightweight In-Context Tuning for Multimodal Unified Models [57.10831399642176]
MultiModal In-conteXt Tuning (M$2$IXT)は、マルチモーダル統一モデルのICL機能を強化する軽量モジュールである。
最大50Kのマルチモーダルデータをチューニングすると、M$2$IXTは数ショットのICL性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-10-08T10:47:24Z) - UniMatch: A Unified User-Item Matching Framework for the Multi-purpose
Merchant Marketing [27.459774494479227]
1つのモデルでアイテムレコメンデーションとユーザターゲティングを同時に行うために,統合されたユーザイテムマッチングフレームワークを提案する。
我々のフレームワークは、最先端の手法と比較して大幅に性能が向上し、計算資源や日々のメンテナンスにかかるコストが大幅に削減された。
論文 参考訳(メタデータ) (2023-07-19T13:49:35Z) - Functional Optimization Reinforcement Learning for Real-Time Bidding [14.5826735379053]
リアルタイム入札はプログラム広告の新しいパラダイムである。
既存のアプローチは、入札最適化に十分なソリューションを提供するのに苦労しています。
本稿では,機能最適化を伴うRTBのためのマルチエージェント強化学習アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-25T06:12:17Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Single-Modal Entropy based Active Learning for Visual Question Answering [75.1682163844354]
視覚質問応答(VQA)のマルチモーダル設定におけるアクティブラーニングに対処する
マルチモーダルな入力,画像,質問を考慮し,有効サンプル取得のための新しい手法を提案する。
私たちの新しいアイデアは、実装が簡単で、コスト効率が高く、他のマルチモーダルタスクにも容易に適応できます。
論文 参考訳(メタデータ) (2021-10-21T05:38:45Z) - Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization
in e-Commercial Sponsored Search [26.117969395228503]
我々は,Multi-Agent Cooperative bidding Games (MACG) と呼ばれる新しい多目的協調入札最適化法を提案する。
すべての広告の全体的な利益を最大化するためのグローバルな目的が、より良い協力を奨励し、またセルフ入札の広告主を保護するために追加される。
タオバオプラットフォーム上でのオフライン実験とオンラインA/Bテストは、単一広告主の目標とグローバル利益の両方が大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2021-06-08T03:18:28Z) - Multi-Purchase Behavior: Modeling, Estimation and Optimization [0.9337154228221861]
本稿では,Bundle-MVL-Kファミリーと呼ばれる,同種の選択モデルのマルチ購入ファミリを提案する。
このモデルに対して最適化されたレコメンデーションを効率的に計算するバイナリ検索に基づく反復戦略を開発する。
論文 参考訳(メタデータ) (2020-06-14T23:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。