論文の概要: Hybrid Transfer in Deep Reinforcement Learning for Ads Allocation
- arxiv url: http://arxiv.org/abs/2204.11589v1
- Date: Sat, 2 Apr 2022 16:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-01 09:25:11.802580
- Title: Hybrid Transfer in Deep Reinforcement Learning for Ads Allocation
- Title(参考訳): 広告割り当てのための深層強化学習におけるハイブリッド転送
- Authors: Guogang Liao, Ze Wang, Xiaowen Shi, Xiaoxu Wu, Chuheng Zhang, Bingqi
Zhu, Yongkang Wang, Xingxing Wang, Dong Wang
- Abstract要約: 電子商取引プラットフォームは通常、異なるカテゴリーの複数の入り口があり、いくつかの入り口には訪問がほとんどない。
これらの入り口に蓄積されたデータは、良いエージェントの学習をほとんど支えない。
類似性に基づく広告割当のためのハイブリッドトランスファー(SHTAA)を提案する。
- 参考スコア(独自算出の注目度): 14.29100789848677
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ads allocation, that allocates ads and organic items to limited slots in feed
with the purpose of maximizing platform revenue, has become a popular problem.
However, e-commerce platforms usually have multiple entrances for different
categories and some entrances have few visits. Data accumulated on these
entrances can hardly support the learning of a good agent. To address this
challenge, we present Similarity-based Hybrid Transfer for Ads Allocation
(SHTAA), which can effectively transfer the samples as well as the knowledge
from data-rich entrance to other data-poor entrance. Specifically, we define an
uncertainty-aware Markov Decision Process (MDP) similarity which can estimate
the MDP similarity of different entrances. Based on the MDP similarity, we
design a hybrid transfer method (consisting of instance transfer and strategy
transfer) to efficiently transfer the samples and the knowledge from one
entrance to another. Both offline and online experiments on Meituan food
delivery platform demonstrate that our method can help to learn better agent
for data-poor entrance and increase the revenue for the platform.
- Abstract(参考訳): プラットフォーム収益の最大化を目的として、限られたスロットに広告やオーガニックアイテムを割り当てる広告割当が一般的な問題となっている。
しかし、電子商取引プラットフォームは通常、異なるカテゴリーの複数の入り口があり、いくつかの入り口には訪問がほとんどない。
これらの入り口に蓄積されたデータは、良いエージェントの学習をほとんど支援できない。
そこで本研究では,類似度に基づく広告アロケーションのためのハイブリッド・トランスファー(shtaa)を提案する。
具体的には、異なる入り口のMDP類似性を推定できる不確実性を考慮したマルコフ決定プロセス(MDP)の類似性を定義する。
mdpの類似性に基づき、サンプルと知識を一つの入り口から別の入り口へ効率的に転送するためのハイブリッド転送手法(インスタンス転送と戦略転送)を設計する。
meituan food delivery platform(meituan)のオフラインおよびオンライン実験は、データポーアエントランスのエージェントを学習し、プラットフォームの売上を増やすのに役立つことを実証する。
関連論文リスト
- Towards Multi-modal Transformers in Federated Learning [10.823839967671454]
本稿では,視覚言語領域におけるMFL(Transfer Multi-modal Federated Learning)のシナリオについて検討する。
我々は,クライアント間の非モダリティと相互モダリティのギャップに対処することによって,FedCola(Federated modality complementary and collaboration)と呼ばれる新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-04-18T19:04:27Z) - Physics-informed and Unsupervised Riemannian Domain Adaptation for Machine Learning on Heterogeneous EEG Datasets [53.367212596352324]
脳波信号物理を利用した教師なし手法を提案する。
脳波チャンネルをフィールド、ソースフリーなドメイン適応を用いて固定位置にマッピングする。
提案手法は脳-コンピュータインタフェース(BCI)タスクおよび潜在的なバイオマーカー応用におけるロバストな性能を示す。
論文 参考訳(メタデータ) (2024-03-07T16:17:33Z) - SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal
Targets [30.262094419776208]
現在のアプローチでは、ソースデータが適応中に利用可能であり、ソースはペア化されたマルチモーダルデータで構成されていると仮定している。
本稿では,2つの相補的な擬似ラベル融合法を自動選択するスイッチングフレームワークを提案する。
提案手法は,mIoUが競合するベースラインよりも最大12%向上することを示す。
論文 参考訳(メタデータ) (2023-08-23T02:57:58Z) - Learning on Bandwidth Constrained Multi-Source Data with MIMO-inspired
DPP MAP Inference [0.5675520944829118]
分散ソース間でMAP推論を行うための戦略を提案する。
多様性を最大化する分散サンプル選択問題の下位境界を電力配分問題として扱うことができることを示す。
本手法は,情報源間の生データ交換を必要とせず,軽量な多様性測定を行うための帯域制限フィードバックチャネルである。
論文 参考訳(メタデータ) (2023-06-04T22:16:49Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Modeling the Sequential Dependence among Audience Multi-step Conversions
with Multi-task Learning in Targeted Display Advertising [17.759045342006694]
本稿では,オーディエンス間の逐次依存をモデル化する適応型情報転送マルチタスク(aitm)フレームワークを提案する。
提案するフレームワークはMeituanアプリにデプロイされ,高エンドツーエンドのコンバージョンレートでユーザに対してバナーをリアルタイムに表示する。
論文 参考訳(メタデータ) (2021-05-18T13:07:12Z) - TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain
Gait Recognition [77.77786072373942]
本稿では、教師なしクロスドメイン歩行認識のための領域ギャップを橋渡しするTransferable Neighborhood Discovery (TraND) フレームワークを提案する。
我々は、潜在空間におけるラベルなしサンプルの自信ある近傍を自動的に発見するために、エンドツーエンドのトレーニング可能なアプローチを設計する。
提案手法は,CASIA-BとOU-LPの2つの公開データセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-02-09T03:07:07Z) - Deep Multimodal Fusion by Channel Exchanging [87.40768169300898]
本稿では,異なるモードのサブネットワーク間で動的にチャネルを交換するパラメータフリーマルチモーダル融合フレームワークを提案する。
このような交換プロセスの有効性は、畳み込みフィルタを共有してもBN層をモダリティで分離しておくことで保証される。
論文 参考訳(メタデータ) (2020-11-10T09:53:20Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。