論文の概要: Masked Multi-Domain Network: Multi-Type and Multi-Scenario Conversion Rate Prediction with a Single Model
- arxiv url: http://arxiv.org/abs/2403.17425v1
- Date: Tue, 26 Mar 2024 06:42:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 16:26:20.315294
- Title: Masked Multi-Domain Network: Multi-Type and Multi-Scenario Conversion Rate Prediction with a Single Model
- Title(参考訳): Masked Multi-Domain Network:単一モデルによるマルチタイプ・マルチシナリオ変換率予測
- Authors: Wentao Ouyang, Xiuwu Zhang, Chaofeng Guo, Shukui Ren, Yupei Sui, Kun Zhang, Jinmei Luo, Yunfeng Chen, Dongbo Xu, Xiangzheng Liu, Yanlong Du,
- Abstract要約: 現実世界の広告システムでは、変換は性質の異なるタイプを持ち、異なる表示シナリオで広告を表示することができる。
これにより、マルチタイプおよびマルチシナリオCVR予測問題が発生する。
この問題を解決するために,Masked Multi-domain Network (MMN)を提案する。
- 参考スコア(独自算出の注目度): 7.59460018125934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real-world advertising systems, conversions have different types in nature and ads can be shown in different display scenarios, both of which highly impact the actual conversion rate (CVR). This results in the multi-type and multi-scenario CVR prediction problem. A desired model for this problem should satisfy the following requirements: 1) Accuracy: the model should achieve fine-grained accuracy with respect to any conversion type in any display scenario. 2) Scalability: the model parameter size should be affordable. 3) Convenience: the model should not require a large amount of effort in data partitioning, subset processing and separate storage. Existing approaches cannot simultaneously satisfy these requirements. For example, building a separate model for each (conversion type, display scenario) pair is neither scalable nor convenient. Building a unified model trained on all the data with conversion type and display scenario included as two features is not accurate enough. In this paper, we propose the Masked Multi-domain Network (MMN) to solve this problem. To achieve the accuracy requirement, we model domain-specific parameters and propose a dynamically weighted loss to account for the loss scale imbalance issue within each mini-batch. To achieve the scalability requirement, we propose a parameter sharing and composition strategy to reduce model parameters from a product space to a sum space. To achieve the convenience requirement, we propose an auto-masking strategy which can take mixed data from all the domains as input. It avoids the overhead caused by data partitioning, individual processing and separate storage. Both offline and online experimental results validate the superiority of MMN for multi-type and multi-scenario CVR prediction. MMN is now the serving model for real-time CVR prediction in UC Toutiao.
- Abstract(参考訳): 現実世界の広告システムでは、変換は性質が異なり、異なる表示シナリオで広告を表示することができ、どちらも実際の変換速度(CVR)に大きな影響を与える。
これにより、マルチタイプおよびマルチシナリオCVR予測問題が発生する。
この問題の望ましいモデルは以下の要件を満たすべきである。
1) 精度: モデルは, 任意の表示シナリオにおける変換タイプに対して, きめ細かい精度を達成すべきである。
2) スケーラビリティ: モデルパラメータのサイズは手頃な価格でなければならない。
3) 利便性: モデルはデータパーティショニング、サブセット処理、分離ストレージに多大な労力を必要としてはならない。
既存のアプローチはこれらの要件を同時に満たすことはできない。
例えば、それぞれの(変換タイプ、表示シナリオ)ペアに対して別々のモデルを構築することは、スケーラブルでも便利でもない。
変換タイプと2つの機能を含む表示シナリオを備えた、すべてのデータでトレーニングされた統一モデルの構築は、十分に正確ではない。
本稿では,この問題を解決するためにMasked Multi-domain Network (MMN)を提案する。
この精度を実現するために,ドメイン固有パラメータをモデル化し,各ミニバッチ内の損失スケール不均衡問題を考慮した動的重み付き損失を提案する。
拡張性要件を実現するために,モデルパラメータを製品空間から和空間へ還元するパラメータ共有と構成戦略を提案する。
この利便性を実現するために,全てのドメインから混合データを入力として得る自動マスキング方式を提案する。
データパーティショニング、個別処理、分離ストレージによるオーバーヘッドを回避する。
オフライン・オンライン両方の実験結果から,マルチタイプ・マルチシナリオCVR予測におけるMMNの優位性を検証した。
MMNは現在、UC ToutiaoにおけるリアルタイムCVR予測のサービスモデルとなっている。
関連論文リスト
- EMR-Merging: Tuning-Free High-Performance Model Merging [55.03509900949149]
Elect, Mask & Rescale-Merging (EMR-Merging) は既存のマージ手法と比較して優れた性能を示した。
EMR-Mergingはチューニング不要なので、データアベイラビリティや追加のトレーニングは必要ありません。
論文 参考訳(メタデータ) (2024-05-23T05:25:45Z) - A Unified Model for Spatio-Temporal Prediction Queries with Arbitrary
Modifiable Areal Units [12.926158225647804]
One4All-STは、1つのモデルのみを使用して任意の修飾可能なアラル単位に対してST予測を行うことができるフレームワークである。
本稿では,定式化された最適組合せ問題を解くための動的プログラミング手法を提案する。
2つの実世界のデータセットの実験は、One4All-STの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2024-03-10T02:34:44Z) - MatFormer: Nested Transformer for Elastic Inference [94.1789252941718]
MatFormerは、様々なデプロイメント制約で弾力性を提供するように設計されたネストトランスフォーマーアーキテクチャである。
2.6BデコーダのみのMatFormer言語モデル(MatLM)は1.5Bから2.6Bまでの小さなモデルを抽出できることを示す。
また,MatFormerベースのViT(MatViT)エンコーダから抽出した小さなエンコーダは,適応的な大規模検索のための距離空間構造を保持する。
論文 参考訳(メタデータ) (2023-10-11T17:57:14Z) - Adapting model-based deep learning to multiple acquisition conditions:
Ada-MoDL [17.21936233574088]
本研究の目的は、アンサンプされた並列MRIデータから高品質な再構成を可能にする、単一のモデルベースのディープネットワークを導入することである。
複数の取得設定のための優れた再構築を提供する、単一のアンロールアーキテクチャが導入された。
論文 参考訳(メタデータ) (2023-04-21T20:12:59Z) - PAMI: partition input and aggregate outputs for model interpretation [69.42924964776766]
本研究では、深層学習モデルが局所的な特徴を集約してモデル予測を行うという観察に基づいて、PAMIと呼ばれるシンプルで効果的な可視化フレームワークを提案する。
基本的な考え方は、入力の大多数を隠蔽し、元のモデル予測に対する保存された入力部の相対的な寄与として対応するモデル出力を使用することである。
複数のタスクに対する大規模な実験により,提案手法は,クラス固有の入力領域をより正確に見つけるために,既存の可視化手法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2023-02-07T08:48:34Z) - Variant Parallelism: Lightweight Deep Convolutional Models for
Distributed Inference on IoT Devices [0.0]
2つの主要なテクニックは、リソース制約のあるIoTデバイスにモデルを分散する際に、リアルタイムの推論制限を満たすために一般的に使用される。
本稿では,主モデルの異なる変種が生成され,別々のマシンにデプロイ可能な,アンサンブルに基づくディープラーニング分散手法である変分並列性(VP)を提案する。
その結果、我々のモデルではパラメータが5.8-7.1x少なく、4.3-31x少ない乗算累積(MAC)、2.5-13.2倍の応答時間をMobileNetV2と比較できることがわかった。
論文 参考訳(メタデータ) (2022-10-15T20:52:28Z) - Scenario-Adaptive and Self-Supervised Model for Multi-Scenario
Personalized Recommendation [35.4495536683099]
シナリオ適応型自己監督型(SASS)モデルを提案し,上記の3つの課題を解決する。
このモデルは、ユーザ側とアイテム側の両方で対称に生成され、異なるシナリオにおけるアイテムの表現を区別することができる。
このモデルは、オンラインA/Bテストにおける平均視聴時間に対して8.0%以上の改善も達成している。
論文 参考訳(メタデータ) (2022-08-24T11:44:00Z) - AdaMix: Mixture-of-Adapter for Parameter-efficient Tuning of Large
Language Models [119.7093605087114]
大規模なトレーニング済み言語モデルをダウンストリームタスクに微調整するには、数億のパラメータを更新する必要がある。
これにより、各タスクのモデルの重みの大量コピーを格納するためのサービスコストが増大するだけでなく、数発のタスク適応中に不安定を示す。
パラメータや計算コストを2つの重要な手法で増大させることなく、アダプタ容量を改善するための新しいメカニズムを導入する。
論文 参考訳(メタデータ) (2022-05-24T23:41:22Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。