論文の概要: TayFCS: Towards Light Feature Combination Selection for Deep Recommender Systems
- arxiv url: http://arxiv.org/abs/2507.03895v1
- Date: Sat, 05 Jul 2025 04:22:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.924049
- Title: TayFCS: Towards Light Feature Combination Selection for Deep Recommender Systems
- Title(参考訳): TayFCS:Deep Recommenderシステムのための光機能の組み合わせ選択に向けて
- Authors: Xianquan Wang, Zhaocheng Du, Jieming Zhu, Chuhan Wu, Qinglin Jia, Zhenhua Dong,
- Abstract要約: Taylor Expansion Scorer (TayScorer) は、ベースモデル上のフィールドワイドテイラー展開のためのモジュールである。
ロジスティック回帰除去(LRE)は、モデル予測性能に基づいて対応する情報ゲインを推定する。
- 参考スコア(独自算出の注目度): 44.80081613834248
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Feature interaction modeling is crucial for deep recommendation models. A common and effective approach is to construct explicit feature combinations to enhance model performance. However, in practice, only a small fraction of these combinations are truly informative. Thus it is essential to select useful feature combinations to reduce noise and manage memory consumption. While feature selection methods have been extensively studied, they are typically limited to selecting individual features. Extending these methods for high-order feature combination selection presents a significant challenge due to the exponential growth in time complexity when evaluating feature combinations one by one. In this paper, we propose $\textbf{TayFCS}$, a lightweight feature combination selection method that significantly improves model performance. Specifically, we propose the Taylor Expansion Scorer (TayScorer) module for field-wise Taylor expansion on the base model. Instead of evaluating all potential feature combinations' importance by repeatedly running experiments with feature adding and removal, this scorer only needs to approximate the importance based on their sub-components' gradients. This can be simply computed with one backward pass based on a trained recommendation model. To further reduce information redundancy among feature combinations and their sub-components, we introduce Logistic Regression Elimination (LRE), which estimates the corresponding information gain based on the model prediction performance. Experimental results on three benchmark datasets validate both the effectiveness and efficiency of our approach. Furthermore, online A/B test results demonstrate its practical applicability and commercial value.
- Abstract(参考訳): 機能相互作用モデリングは、深いレコメンデーションモデルにとって不可欠です。
一般的な効果的なアプローチは、モデルの性能を高めるために明示的な機能の組み合わせを構築することである。
しかし実際には、これらの組み合わせのごく一部だけが真に有益である。
したがって、ノイズを減らし、メモリ消費を管理するために有用な機能の組み合わせを選択することが不可欠である。
特徴選択法は広く研究されているが、通常は個々の特徴の選択に限られている。
これらの手法を高次特徴組合せ選択に拡張することは、特徴組合せを1つずつ評価する際に、時間的複雑さが指数関数的に増大するため、大きな課題となる。
本稿では,モデルの性能を大幅に向上させる軽量な特徴組合せ選択法である$\textbf{TayFCS}$を提案する。
具体的には,Taylor Expansion Scorer (TayScorer) モジュールを提案する。
機能追加と削除の実験を繰り返し行うことによって、潜在的な機能の組み合わせの重要性を評価する代わりに、このスコアラは、サブコンポーネントの勾配に基づいて重要度を近似するだけである。
これは、トレーニングされたレコメンデーションモデルに基づいて、1つの後方パスで簡単に計算できる。
特徴の組み合わせとそのサブコンポーネント間の情報冗長性をさらに低減するため、モデル予測性能に基づいて対応する情報ゲインを推定するロジスティック回帰除去(LRE)を導入する。
3つのベンチマークデータセットの実験結果から,提案手法の有効性と有効性について検証した。
さらに、オンラインA/Bテストの結果は実用性と商業的価値を示している。
関連論文リスト
- NAN: A Training-Free Solution to Coefficient Estimation in Model Merging [61.36020737229637]
最適なマージ重み付けは,各モデルに符号化されたタスク固有情報の量とともにスケールする必要があることを示す。
パラメータノルムの逆数を用いてモデルマージ係数を推定する,単純で効果的な手法であるNANを提案する。
NANはトレーニングフリーで、プラグアンドプレイで、幅広いマージ戦略に適用できる。
論文 参考訳(メタデータ) (2025-05-22T02:46:08Z) - Less is More: Efficient Black-box Attribution via Minimal Interpretable Subset Selection [52.716143424856185]
部分モジュラー部分集合選択の最適化問題として重要領域の帰属を再構成するLiMA(Less input is more faithful for Attribution)を提案する。
LiMAは、エラーを最小限に抑える最適な帰属境界を確保しながら、最も重要かつ最も重要でないサンプルを識別する。
また, 帰属効率が1.6倍に向上し, 帰属効率が向上した。
論文 参考訳(メタデータ) (2025-04-01T06:58:15Z) - ShuffleGate: An Efficient and Self-Polarizing Feature Selection Method for Large-Scale Deep Models in Industry [12.690406065558394]
ShuffleGateはインスタンス間ですべての機能を同時にシャッフルする。
モデルを再トレーニングすることなく、適切に分離された重要なスコアを生成し、パフォーマンスを見積もることができます。
様々なシナリオで、Bilibiliの検索モデルの日々のイテレーションにうまく統合されています。
論文 参考訳(メタデータ) (2025-03-12T12:05:03Z) - Automated Model Selection for Tabular Data [0.1797555376258229]
Rの混合効果線形モデルライブラリは、モデル設計において対話的な機能の組み合わせを提供することができる。
特徴的相互作用を取り入れたデータセットの予測のためのモデル選択プロセスを自動化することを目的としている。
このフレームワークには、優先順位に基づくランダムグリッド検索とグレディ検索という、2つの異なる機能選択のアプローチが含まれている。
論文 参考訳(メタデータ) (2024-01-01T21:41:20Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。