論文の概要: Deferred is Better: A Framework for Multi-Granularity Deferred Interaction of Heterogeneous Features
- arxiv url: http://arxiv.org/abs/2603.12586v1
- Date: Fri, 13 Mar 2026 02:36:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.854799
- Title: Deferred is Better: A Framework for Multi-Granularity Deferred Interaction of Heterogeneous Features
- Title(参考訳): Deferredはより良い:不均一な特徴のマルチグラニュラリティデフレクトインタラクションのためのフレームワーク
- Authors: Yi Xu, Moyu Zhang, Chaofan Fan, Jinxin Hu, Yu Zhang, Xiaoyi Zeng,
- Abstract要約: MGDIN(Multi-Granularity Information-Aware Deferred Interaction Network)を提案する。
MGDINは機能インタラクションプロセスへの機能の導入を適応的に拒否する。
極端な個々の特徴空間の影響を緩和し、モデルが多様な視点から特徴的相互作用をキャプチャできるようにする。
- 参考スコア(独自算出の注目度): 11.38122944188751
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Click-through rate (CTR) prediction models estimates the probability of a user-item click by modeling interactions across a vast feature space. A fundamental yet often overlooked challenge is the inherent heterogeneity of these features: their sparsity and information content vary dramatically. For instance, categorical features like item IDs are extremely sparse, whereas numerical features like item price are relatively dense. Prevailing CTR models have largely ignored this heterogeneity, employing a uniform feature interaction strategy that inputs all features into the interaction layers simultaneously. This approach is suboptimal, as the premature introduction of low-information features can inject significant noise and mask the signals from information-rich features, which leads to model collapse and hinders the learning of robust representations. To address the above challenge, we propose a Multi-Granularity Information-Aware Deferred Interaction Network (MGDIN), which adaptively defers the introduction of features into the feature interaction process. MGDIN's core mechanism operates in two stages: First, it employs a multi-granularity feature grouping strategy to partition the raw features into distinct groups with more homogeneous information density in different granularities, thereby mitigating the effects of extreme individual feature sparsity and enabling the model to capture feature interactions from diverse perspectives. Second, a delayed interaction mechanism is implemented through a hierarchical masking strategy, which governs when and how each group participates by masking low-information groups in the early layers and progressively unmasking them as the network deepens. This deferred introduction allows the model to establish a robust understanding based on high-information features before gradually incorporating sparser information from other groups...
- Abstract(参考訳): クリックスルーレート(CTR)予測モデルは、巨大な特徴空間をまたいだインタラクションをモデル化することで、ユーザイテムクリックの確率を推定する。
基本的に見過ごされがちな課題は、これらの特徴の固有の異質性である。
例えば、アイテムIDのようなカテゴリ的機能は極めて少ないが、アイテム価格のような数値的特徴は比較的密度が高い。
一般的なCTRモデルは、この異種性を無視し、全ての機能を同時に相互作用層に入力する一様機能相互作用戦略を採用している。
このアプローチは、低情報特徴の早期導入は、重要なノイズを注入し、情報豊富な特徴からの信号を隠蔽し、モデル崩壊を招き、ロバスト表現の学習を妨げるため、準最適である。
この課題に対処するために,機能相互作用プロセスへの機能導入を適応的に拒否する多言語情報認識デファレントインタラクションネットワーク(MGDIN)を提案する。
MGDINのコアメカニズムは以下の2つの段階で機能する: 第一に、多粒性特徴群(multi-granularity feature grouping strategy)を用いて、異なる粒度においてより均一な情報密度を持つ異なるグループに原特徴を分割し、極端に個々の特徴空間の影響を緩和し、様々な視点から特徴相互作用を捉えることを可能にする。
第2に、遅延相互作用機構は階層的なマスキング戦略によって実現され、初期層において低情報グループをマスキングし、ネットワークの深層化に伴ってそれらを徐々に解き放つことにより、各グループがいつ、どのように参加するかを管理する。
この遅延導入により、モデルは、他のグループからのスパーサー情報を徐々に取り入れる前に、高情報の特徴に基づいて堅牢な理解を確立することができる。
関連論文リスト
- Bridging Sequential and Contextual Features with a Dual-View of Fine-grained Core-Behaviors and Global Interest-Distribution [19.644227875720343]
逐次的特徴相互作用と文脈的特徴相互作用のギャップを埋めるために,コアビヘイビアと分布補償デュアルビューインタラクションネットワーク(CDNet)を提案する。
CDNetは、全体的なユーザ関心を保たずに重要な行動の詳細を同時にキャプチャすることで、シーケンシャルな特徴とコンテキスト的な特徴の相互作用を効果的にモデル化する。
論文 参考訳(メタデータ) (2026-03-13T02:24:45Z) - FAR-AMTN: Attention Multi-Task Network for Face Attribute Recognition [13.392837372242907]
本研究では,顔属性認識のための新しいマルチタスクネットワークであるFAR-AMTNを紹介する。
Weight-Shared Group-Specific Attention (WSGSA)モジュールが組み込まれている。
CelebAとLFWAデータセットの実験では、提案されたFAR-AMTNは既存のモデルに比べてパラメータが大幅に少ないため、精度が優れていることが示されている。
論文 参考訳(メタデータ) (2026-01-04T14:20:16Z) - HeLoFusion: An Efficient and Scalable Encoder for Modeling Heterogeneous and Multi-Scale Interactions in Trajectory Prediction [11.30785902722196]
HeLoFusionは、異種およびマルチスケールエージェントインタラクションをモデリングするための効率的でスケーラブルなエンコーダである。
本研究は,マルチスケールおよび異種相互作用を明示的にモデル化した局所性グラウンドアーキテクチャが,動き予測を推し進めるための極めて効果的な戦略であることを実証する。
論文 参考訳(メタデータ) (2025-09-15T09:19:41Z) - InterFormer: Effective Heterogeneous Interaction Learning for Click-Through Rate Prediction [83.7578502046955]
我々はインターリービング方式で異種情報インタラクションを学習するInterFormerという新しいモジュールを提案する。
提案するInterFormerは,3つのパブリックデータセットと大規模産業データセットに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-11-15T00:20:36Z) - DexDeepFM: Ensemble Diversity Enhanced Extreme Deep Factorization
Machine Model [8.73107818888638]
アンサンブルの多様性を高めた極深部分解機モデル(DexDeepFM)を提案する。
2つの公開現実世界のデータセットに関する実験は、提案されたモデルの優位性を示している。
論文 参考訳(メタデータ) (2021-04-05T14:06:32Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Multi-Granularity Reference-Aided Attentive Feature Aggregation for
Video-based Person Re-identification [98.7585431239291]
ビデオベースの人物再識別は、同じ人物をビデオクリップ間でマッチングすることを目的としている。
本稿では,マルチグラニュラリティ参照属性集約モジュールMG-RAFAを提案する。
本フレームワークは,3つのベンチマークデータセット上での最先端のアブレーション性能を実現する。
論文 参考訳(メタデータ) (2020-03-27T03:49:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。