論文の概要: GIST: Cross-Domain Click-Through Rate Prediction via Guided Content-Behavior Distillation
- arxiv url: http://arxiv.org/abs/2507.05142v1
- Date: Mon, 07 Jul 2025 15:51:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.496879
- Title: GIST: Cross-Domain Click-Through Rate Prediction via Guided Content-Behavior Distillation
- Title(参考訳): GIST: ガイド付きコンテント-ビヘイビア蒸留によるクリックスルー速度予測
- Authors: Wei Xu, Haoran Li, Baoyuan Ou, Lai Xu, Yingjie Qin, Ruilong Su, Ruiwen Xu,
- Abstract要約: クロスドメインクリックスルーレート予測は、オンライン広告システムにおけるデータ空間とコールドスタートの問題に対処することを目的としている。
既存の方法の多くは、この転送を容易にするために重複したユーザーに依存している。
GISTは、ソースとターゲットドメインのトレーニングプロセスを分離するクロスドメインライフロングシーケンスモデルである。
- 参考スコア(独自算出の注目度): 8.796126922682554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain Click-Through Rate prediction aims to tackle the data sparsity and the cold start problems in online advertising systems by transferring knowledge from source domains to a target domain. Most existing methods rely on overlapping users to facilitate this transfer, often focusing on joint training or pre-training with fine-tuning approach to connect the source and target domains. However, in real-world industrial settings, joint training struggles to learn optimal representations with different distributions, and pre-training with fine-tuning is not well-suited for continuously integrating new data. To address these issues, we propose GIST, a cross-domain lifelong sequence model that decouples the training processes of the source and target domains. Unlike previous methods that search lifelong sequences in the source domains using only content or behavior signals or their simple combinations, we innovatively introduce a Content-Behavior Joint Training Module (CBJT), which aligns content-behavior distributions and combines them with guided information to facilitate a more stable representation. Furthermore, we develop an Asymmetric Similarity Integration strategy (ASI) to augment knowledge transfer through similarity computation. Extensive experiments demonstrate the effectiveness of GIST, surpassing SOTA methods on offline evaluations and an online A/B test. Deployed on the Xiaohongshu (RedNote) platform, GIST effectively enhances online ads system performance at scale, serving hundreds of millions of daily active users.
- Abstract(参考訳): クロスドメインクリックスルーレート予測は、ソースドメインからの知識をターゲットドメインに転送することで、オンライン広告システムにおけるデータスパーシリティとコールドスタート問題に取り組むことを目的としている。
既存の方法の多くは、この移行を促進するために重複するユーザに依存しており、多くの場合、ソースとターゲットドメインを接続するための微調整アプローチによる共同トレーニングや事前トレーニングに重点を置いている。
しかし, 実世界の産業環境では, 異なる分布による最適表現の学習に苦慮し, 微調整による事前学習は, 新たなデータを継続的に統合するのに適していない。
これらの問題に対処するために、ソースとターゲットドメインのトレーニングプロセスを分離するクロスドメインライフロングシーケンスモデルであるGISTを提案する。
コンテンツや振舞いの信号や単純な組み合わせのみを用いて、ソースドメイン内の寿命の長いシーケンスを探索する従来の方法とは異なり、コンテント・ビヘイビア・ジョイント・トレーニング・モジュール(CBJT)を革新的に導入し、コンテンツ・ビヘイビアの分布を調整し、より安定した表現を容易にするためのガイド付き情報と組み合わせる。
さらに、類似性計算による知識伝達を増強する非対称類似性統合戦略(ASI)を開発した。
大規模な実験は、オフライン評価とオンラインA/Bテストにおいて、SOTA法を超越したGISTの有効性を示す。
Xiaohongshu(RedNote)プラットフォーム上にデプロイされたGISTは、オンライン広告システムのパフォーマンスを効果的に向上させ、毎日数億のアクティブユーザを提供する。
関連論文リスト
- Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification [13.883869481902744]
生涯人物再識別(LReID)は、新しい情報に適応しながら、古い知識を保存する上で重要な課題である。
既存のソリューションには、この課題に対処するためのリハーサルベースおよびリハーサルフリーメソッドが含まれる。
本稿では,クロスドメイン共有表現学習とドメイン固有分布統合を探求する分散適応モデルを提案する。
論文 参考訳(メタデータ) (2025-04-21T11:53:43Z) - Improve Cross-domain Mixed Sampling with Guidance Training for Adaptive Segmentation [9.875170018805768]
教師なしのドメイン適応(UDA)は、ソースドメインでトレーニングされたモデルを調整し、追加のアノテーションを必要とせずにターゲットドメインでうまく機能させる。
本稿では,指導訓練という新しい補助課題を提案する。
本課題は,実世界の分散シフトを緩和しつつ,クロスドメイン混合サンプリング手法の有効利用を促進する。
既存の手法と統合し、継続的に性能を向上することで、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-22T07:12:48Z) - ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation [48.039156140237615]
目標ドメインの継続的な変更に事前訓練されたモデルを適用するために、連続的なテスト時間適応タスクを提案する。
我々はCTTA用のVisual Domain Adapter (ViDA) を設計し、ドメイン固有知識とドメイン共有知識の両方を明示的に扱う。
提案手法は,CTTAタスクの分類とセグメント化の両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-07T11:18:53Z) - IDA: Informed Domain Adaptive Semantic Segmentation [51.12107564372869]
クラスレベルのセグメンテーション性能に基づいてデータを混合する自己学習フレームワークであるDomain Informed Adaptation (IDA) モデルを提案する。
IDAモデルでは、クラスレベルの性能を期待信頼スコア(ECS)によって追跡し、動的スケジュールを用いて異なる領域のデータに対する混合比を決定する。
提案手法は,GTA-Vの都市景観への適応において1.1 mIoU,SynTHIAの都市への適応において0.9 mIoUのマージンで,最先端のUDA-SS法よりも優れる。
論文 参考訳(メタデータ) (2023-03-05T18:16:34Z) - Heterogeneous Domain Adaptation with Adversarial Neural Representation
Learning: Experiments on E-Commerce and Cybersecurity [7.748670137746999]
Heterogeneous Adversarial Neural Domain Adaptation (HANDA) は異種環境における伝達性を最大化するように設計されている。
画像とテキストの電子商取引ベンチマークを用いて,最先端HDA手法に対する性能評価を3つの実験により行った。
論文 参考訳(メタデータ) (2022-05-05T16:57:36Z) - Unified Instance and Knowledge Alignment Pretraining for Aspect-based
Sentiment Analysis [96.53859361560505]
Aspect-based Sentiment Analysis (ABSA) は、ある側面に対する感情の極性を決定することを目的としている。
事前トレーニングと下流ABSAデータセットの間には、常に深刻なドメインシフトが存在する。
我々は,バニラ・プレトレイン・ファインチューンパイプラインにアライメント事前訓練フレームワークを導入する。
論文 参考訳(メタデータ) (2021-10-26T04:03:45Z) - Source-Free Open Compound Domain Adaptation in Semantic Segmentation [99.82890571842603]
SF-OCDAでは、ターゲットモデルを学習するために、ソース事前訓練されたモデルとターゲットデータのみが利用可能である。
そこで我々は,Cross-Patch Style Swap (CPSS)を提案する。
提案手法は,C-Drivingデータセット上で最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-06-07T08:38:41Z) - Physically-Constrained Transfer Learning through Shared Abundance Space
for Hyperspectral Image Classification [14.840925517957258]
本稿では、ソースとターゲットドメイン間のギャップを埋める新しい転送学習手法を提案する。
提案手法は,共有空間を経由した物理制約付き移動学習と呼ばれる。
論文 参考訳(メタデータ) (2020-08-19T17:41:37Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。