論文の概要: GAP-Net: Calibrating User Intent via Gated Adaptive Progressive Learning for CTR Prediction
- arxiv url: http://arxiv.org/abs/2601.07613v1
- Date: Mon, 12 Jan 2026 15:01:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.47611
- Title: GAP-Net: Calibrating User Intent via Gated Adaptive Progressive Learning for CTR Prediction
- Title(参考訳): GAP-Net: CTR予測のためのGated Adaptive Progressive Learningによるユーザインテントの校正
- Authors: Ke Shenqiang, Wei Jianxiong, Hua Qingsong,
- Abstract要約: GAP-Netは、マイクロレベルの機能からマクロレベルのビューまで、情報を段階的に洗練する"トリプルゲーティング"アーキテクチャを確立する統一フレームワークである。
最先端のベースラインよりも大幅に改善され、相互作用ノイズや意図の漂流に対して優れた堅牢性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential user behavior modeling is pivotal for Click-Through Rate (CTR) prediction yet is hindered by three intrinsic bottlenecks: (1) the "Attention Sink" phenomenon, where standard Softmax compels the model to allocate probability mass to noisy behaviors; (2) the Static Query Assumption, which overlooks dynamic shifts in user intent driven by real-time contexts; and (3) Rigid View Aggregation, which fails to adaptively weight heterogeneous temporal signals according to the decision context. To bridge these gaps, we propose GAP-Net (Gated Adaptive Progressive Network), a unified framework establishing a "Triple Gating" architecture to progressively refine information from micro-level features to macro-level views. GAP-Net operates through three integrated mechanisms: (1) Adaptive Sparse-Gated Attention (ASGA) employs micro-level gating to enforce sparsity, effectively suppressing massive noise activations; (2) Gated Cascading Query Calibration (GCQC) dynamically aligns user intent by bridging real-time triggers and long-term memories via a meso-level cascading channel; and (3) Context-Gated Denoising Fusion (CGDF) performs macro-level modulation to orchestrate the aggregation of multi-view sequences. Extensive experiments on industrial datasets demonstrate that GAP-Net achieves substantial improvements over state-of-the-art baselines, exhibiting superior robustness against interaction noise and intent drift.
- Abstract(参考訳): 1)標準ソフトマックスが確率質量をノイズの多い行動に割り当てるためのモデルを補完する「注意シンク(Attention Sink)」現象,(2)リアルタイムコンテキストによって駆動されるユーザ意図の動的シフトを無視する静的クエリ推定,(3)異種時間信号の適応的な重み付けに失敗する「リジッドビュー・アグリゲーション(Rigid View Aggregation)」である。
これらのギャップを埋めるため,我々は,マイクロレベルの特徴からマクロレベルの視点まで情報を段階的に洗練する"トリプルゲーティング"アーキテクチャを確立する統一フレームワークであるGAP-Netを提案する。
GAP-Netは,(1)適応スパースGated Attention (ASGA) のマイクロレベルゲーティングを用いて,大規模なノイズアクティベーションを効果的に抑制する,(2) Gated Cascading Query Calibration (GCQC) は,メソレベルのカスケードチャネルを介してリアルタイムトリガと長期記憶をブリッジすることで,ユーザ意図を動的に調整する,(3) CGDF (Context-Gated Denoising Fusion) は,マルチビューシーケンスの集約を調整するためのマクロレベル変調を行う,という3つの統合メカニズムを通じて運用されている。
産業データセットに関する大規模な実験により、GAP-Netは最先端のベースラインよりも大幅に改善され、相互作用ノイズや意図のドリフトに対して優れた堅牢性を示すことが示された。
関連論文リスト
- Adaptive Causal Coordination Detection for Social Media: A Memory-Guided Framework with Semi-Supervised Learning [1.5683405037750644]
ACCDは3段階のプログレッシブアーキテクチャを採用し、メモリ誘導適応機構を利用して最適な検出設定を学習し維持する。
Twitter IRAデータセット、Redditのコーディネーショントレース、および広く採用されているボット検出ベンチマークなど、実世界のデータセットを使用して包括的な評価を行う。
ACCDのF1スコアは87.3%で、最強のベースラインよりも15.2%向上している。
論文 参考訳(メタデータ) (2026-01-01T17:27:52Z) - IAR2: Improving Autoregressive Visual Generation with Semantic-Detail Associated Token Prediction [77.06211178777939]
IAR2は、階層的なセマンティックディーテール合成プロセスを可能にする高度な自己回帰フレームワークである。
我々は、IAR2が自動回帰画像生成のための新しい最先端技術を設定し、ImageNet上で1.50のFIDを達成することを示す。
論文 参考訳(メタデータ) (2025-10-08T12:08:21Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Contrastive Matrix Completion with Denoising and Augmented Graph Views for Robust Recommendation [1.0128808054306186]
マトリックス補完は推薦システムにおいて広く採用されているフレームワークである。
コントラスト学習(MCCL)を用いた行列補完法を提案する。
提案手法は,予測スコアの数値精度を向上するだけでなく,ランキング指標の最大36%を向上する上で,優れたランキングを生成する。
論文 参考訳(メタデータ) (2025-06-12T12:47:35Z) - Analysis of Anonymous User Interaction Relationships and Prediction of Advertising Feedback Based on Graph Neural Network [5.250286096386298]
本稿では3つの主要な貢献を成すDTH-GNN(Decoupled Temporal-Hierarchical Graph Neural Network)を提案する。
まず,各相互作用を短周期バースト,昼周期,長距離メモリの3種類のチャネルに分割し,並列拡張残差の畳み込みカーネルを用いて特徴抽出を行う。
第三に、フィードバック知覚のコントラストを定式化し、様々なタイムスライスの一貫性を最大化し、二重ビューターゲットによる制御露光情報のエントロピーを最大化し、二重モーメントキュー蒸留のグローバルプロトタイプを示す。
論文 参考訳(メタデータ) (2025-06-11T04:40:24Z) - Divide-and-Conquer: Confluent Triple-Flow Network for RGB-T Salient Object Detection [70.84835546732738]
RGB-Thermal Salient Object Detectionは、目視と熱赤外画像のペア内の目立つ物体をピンポイントすることを目的としている。
従来のエンコーダ・デコーダアーキテクチャは、欠陥モードから生じるノイズに対する頑健さを十分に考慮していなかったかもしれない。
本稿では,Divide-and-Conquer戦略を用いた,堅牢なConfluent Triple-Flow NetworkであるConTriNetを提案する。
論文 参考訳(メタデータ) (2024-12-02T14:44:39Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - CMGAN: Conformer-Based Metric-GAN for Monaural Speech Enhancement [5.766499647507758]
さらに、時間周波数(TF)領域における音声強調(SE)のためのコンバータベース計量生成逆ネットワーク(CMGAN)モデルを開発した。
以上の結果から,CMGANは3つの主要な音声強調課題において,既存の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-22T15:50:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。