論文の概要: CS3: Efficient Online Capability Synergy for Two-Tower Recommendation
- arxiv url: http://arxiv.org/abs/2604.19269v1
- Date: Tue, 21 Apr 2026 09:35:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.70429
- Title: CS3: Efficient Online Capability Synergy for Two-Tower Recommendation
- Title(参考訳): CS3: 2-towerレコメンデーションのための効率的なオンライン機能シナジー
- Authors: Lixiang Wang, Shaoyun Shi, Peng Wang, Wenjin Wu, Peng Jiang,
- Abstract要約: 2towerアーキテクチャは、表現能力、埋め込み空間アライメント、および機能間相互作用を制限する。
本稿では,リアルタイムな制約を保ちながら2towerレトリバーを強化した効率的なオンラインフレームワークであるCapability Synergy (CS3)を提案する。
CS3は多様な2towerのバックボーンでプラグ&プレイでき、オンライン学習と互換性がある。
- 参考スコア(独自算出の注目度): 8.955059715857173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To balance effectiveness and efficiency in recommender systems, multi-stage pipelines commonly use lightweight two-tower models for large-scale candidate retrieval. However, the isolated two-tower architecture restricts representation capacity, embedding-space alignment, and cross-feature interactions. Existing solutions such as late interaction and knowledge distillation can mitigate these issues, but often increase latency or are difficult to deploy in online learning settings. We propose Capability Synergy (CS3), an efficient online framework that strengthens two-tower retrievers while preserving real-time constraints. CS3 introduces three mechanisms: (1) Cycle-Adaptive Structure for self-revision via adaptive feature denoising within each tower; (2) Cross-Tower Synchronization to improve alignment through lightweight mutual awareness between towers; and (3) Cascade-Model Sharing to enhance cross-stage consistency by reusing knowledge from downstream models. CS3 is plug-and-play with diverse two-tower backbones and compatible with online learning. Experiments on three public datasets show consistent gains over strong baselines, and deployment in a largescale advertising system yields up to 8.36% revenue improvement across three scenarios while maintaining ms-level latency.
- Abstract(参考訳): 推薦システムの効率性と効率のバランスをとるために、マルチステージパイプラインは大規模候補探索に軽量な2towerモデルを用いるのが一般的である。
しかし、分離された2towerアーキテクチャは、表現能力、埋め込み空間アライメント、および機能間相互作用を制限する。
遅延相互作用や知識蒸留といった既存のソリューションはこれらの問題を緩和するが、しばしばレイテンシを増大させるか、オンライン学習環境でのデプロイが困難である。
本稿では,リアルタイムな制約を保ちながら2towerレトリバーを強化した効率的なオンラインフレームワークであるCapability Synergy (CS3)を提案する。
CS3 では,(1) 塔内の適応的特徴分担による自己修正のためのサイクル適応構造,(2) 塔間の軽量な相互認識による整合性向上のためのクロスツーワー同期,(3) 下流モデルからの知識の再利用による相互整合性向上のためのカスケードモデル共有,の3つのメカニズムを導入している。
CS3は多様な2towerのバックボーンでプラグ&プレイでき、オンライン学習と互換性がある。
3つのパブリックデータセットの実験では、強いベースラインよりも一貫して向上し、大規模な広告システムへのデプロイメントは、3つのシナリオで最大8.36%の収益向上を達成し、msレベルのレイテンシを維持している。
関連論文リスト
- Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation [67.09494009022471]
本稿では,オンライン知識蒸留(PSAD)フレームワークを改訂するための新しいパーソナライズド・セミ・オートレグレッシブを提案する。
このフレームワークでは、教師モデルは、生成品質と効率のバランスをとるために半自己回帰ジェネレータを採用し、そのランキング知識はオンラインで軽量のスコアリングネットワークに抽出される。
3つの大規模な公開データセットで実施された実験により、PSADはランク付け性能と推論効率の両方において最先端のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2026-03-07T08:37:13Z) - CATNet: Collaborative Alignment and Transformation Network for Cooperative Perception [9.983779569276475]
コラボレーティブアライメント・アンド・トランスフォーメーション・ネットワーク(CATNet)は、マルチエージェントシステムにおける時間遅延とノイズ干渉を解決する適応補償フレームワークである。
まず、非同期機能ストリームの整合性を備えた時空間リカレントシンクロナイゼーション(STSync)を紹介します。
第2に,大域的雑音を抑制し,局所的特徴歪みを再構成するDual-Branch Wavelet Enhanced Denoiser (WTDen) を設計する。
第三に、ロバスト融合のための重要な知覚機能に動的にフォーカスする適応的特徴選択器(AdpSel)を構築する。
論文 参考訳(メタデータ) (2026-03-05T15:07:36Z) - Compress, Cross and Scale: Multi-Level Compression Cross Networks for Efficient Scaling in Recommender Systems [5.897678894426804]
MLCCは階層的な圧縮と動的合成によって機能横断を組織する構造化された機能相互作用アーキテクチャである。
MC-MLCCはマルチチャネル拡張であり、並列部分空間に特徴的相互作用を分解する。
提案モデルでは,高いDLRMスタイルのベースラインを最大0.52AUCで上回り,モデルパラメータとFLOPを最大26$times$で削減した。
論文 参考訳(メタデータ) (2026-02-12T15:06:46Z) - A2R: An Asymmetric Two-Stage Reasoning Framework for Parallel Reasoning [57.727084580884075]
モデルポテンシャルと実際の性能の間のギャップを埋めるために設計された非対称な2段階推論フレームワーク。
A2R-Efficientは、Qwen3-4BとQwen3-8Bシンセサイザーを組み合わせた「小型から大型」の派生型である。
その結果、A2Rはパフォーマンス・ブートスティングのフレームワークであるだけでなく、現実世界のアプリケーションに対して効率的かつ実用的なソリューションであることがわかった。
論文 参考訳(メタデータ) (2025-09-26T08:27:03Z) - C2D-ISR: Optimizing Attention-based Image Super-resolution from Continuous to Discrete Scales [6.700548615812325]
我々は、注目に基づく画像超解像モデルの最適化のための新しいフレームワーク、textbfC2D-ISRを提案する。
このアプローチは、2段階のトレーニング手法と階層的なエンコーディング機構に基づいている。
さらに,既存のアテンションベースネットワーク構造を用いて階層符号化機構を一般化する。
論文 参考訳(メタデータ) (2025-03-17T21:52:18Z) - Dynamic Cross-Modal Feature Interaction Network for Hyperspectral and LiDAR Data Classification [66.59320112015556]
ハイパースペクトル画像(HSI)とLiDARデータ共同分類は難しい課題である。
DCMNet(Dynamic Cross-Modal Feature Interaction Network)を提案する。
BSAB(Bilinear Spatial Attention Block)、BCAB(Bilinear Channel Attention Block)、ICB(Integration Convolutional Block)の3つの機能相互作用ブロックを導入している。
論文 参考訳(メタデータ) (2025-03-10T05:50:13Z) - Climber: Toward Efficient Scaling Laws for Large Recommendation Models [8.970144942471425]
Climberは2つの相乗的コンポーネントからなる効率的なレコメンデーションフレームワークである。
提案モデルでは,(1)一定因子による時間的複雑性の低減を実現し,シーケンス長によるより効率的なスケーリングを実現するマルチスケールシーケンス抽出,(2)マルチシナリオパターンとマルチビヘイビアパターンに注意分布を適応させる動的温度変調,の2つのコアイノベーションを採用している。
Climberは、中国最大の音楽ストリーミングプラットフォームであるNetease Cloud Musicに、毎日数千万人のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2025-02-14T03:25:09Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Dynamic Scheduling for Stochastic Edge-Cloud Computing Environments
using A3C learning and Residual Recurrent Neural Networks [30.61220416710614]
A-Advantage-Actor-Critic(A3C)学習は、データが少ない動的なシナリオに迅速に適応することが知られ、Residual Recurrent Neural Network(R2N2)はモデルパラメータを迅速に更新する。
我々はR2N2アーキテクチャを用いて、多数のホストパラメータとタスクパラメータを時間パターンとともにキャプチャし、効率的なスケジューリング決定を提供する。
実世界のデータセットで実施された実験では、エネルギー消費、応答時間、ServiceLevelAgreementおよびランニングコストがそれぞれ14.4%、7.74%、31.9%、および4.64%で大幅に改善された。
論文 参考訳(メタデータ) (2020-09-01T13:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。