論文の概要: DCNv3: Towards Next Generation Deep Cross Network for CTR Prediction
- arxiv url: http://arxiv.org/abs/2407.13349v6
- Date: Fri, 09 Aug 2024 06:31:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 19:46:04.995836
- Title: DCNv3: Towards Next Generation Deep Cross Network for CTR Prediction
- Title(参考訳): DCNv3: CTR予測のための次世代ディープクロスネットワークを目指して
- Authors: Honghao Li, Yiwen Zhang, Yi Zhang, Hanwei Li, Lei Sang, Jieming Zhu,
- Abstract要約: 本稿では,次世代のディープクロスネットワークであるディープクロスネットワークv3(DCNv3)と,CTR予測のための2つのサブネットワークであるリニアクロスネットワーク(LCN)と指数クロスネットワーク(ECN)を提案する。
6つのデータセットに関する総合的な実験は、DCNv3の有効性、効率、解釈可能性を示している。
- 参考スコア(独自算出の注目度): 17.19859591493946
- License:
- Abstract: Deep & Cross Network and its derivative models have become an important paradigm for click-through rate (CTR) prediction due to their effective balance between computational cost and performance. However, these models face four major limitations: (1) the performance of existing explicit feature interaction methods is often weaker than that of implicit deep neural network (DNN), undermining their necessity; (2) many models fail to adaptively filter noise while increasing the order of feature interactions; (3) the fusion methods of most models cannot provide suitable supervision signals for their different sub-networks; (4) while most models claim to capture high-order feature interactions, they often do so implicitly and non-interpretably through DNN, which limits the trustworthiness of the model's predictions. To address the identified limitations, this paper proposes the next generation deep cross network: Deep Cross Network v3 (DCNv3), along with its two sub-networks: Linear Cross Network (LCN) and Exponential Cross Network (ECN) for CTR prediction. DCNv3 ensures interpretability in feature interaction modeling while linearly and exponentially increasing the order of feature interactions to achieve genuine Deep Crossing rather than just Deep & Cross. Additionally, we employ a Self-Mask operation to filter noise and reduce the number of parameters in the Cross Network by half. In the fusion layer, we use a simple yet effective multi-loss trade-off and calculation method, called Tri-BCE, to provide appropriate supervision signals. Comprehensive experiments on six datasets demonstrate the effectiveness, efficiency, and interpretability of DCNv3. The code, running logs, and detailed hyperparameter configurations are available at: https://github.com/salmon1802/DCNv3.
- Abstract(参考訳): Deep & Cross Networkとその派生モデルは、計算コストと性能の効果的なバランスのために、クリックスルー率(CTR)予測の重要なパラダイムとなっている。
しかし、これらのモデルには4つの大きな制限がある: 1) 既存の明示的な特徴相互作用法の性能は暗黙的なディープニューラルネットワーク(DNN)よりも弱いことが多く、その必要性を損なう; 2) 多くのモデルでは、特徴相互作用の順序を増大させながらノイズを適応的にフィルタリングすることができない; (3) 多くのモデルの融合法では、異なるサブネットワークに対して適切な監視信号を提供できない; (4) ほとんどのモデルでは高次特徴相互作用をキャプチャすることを主張するが、DNNを通して暗黙的に非解釈的に行うことが多く、モデルの予測の信頼性を制限している。
本稿では,次世代のディープ・クロス・ネットワークであるディープ・クロス・ネットワークv3(DCNv3)と,その2つのサブネットワークであるリニア・クロス・ネットワーク(LCN)とエクセプティブ・クロス・ネットワーク(ECN)を提案する。
DCNv3は、機能インタラクションモデリングにおける解釈可能性を保証すると同時に、機能インタラクションの順序を線形かつ指数関数的に増加させ、Deep & Crossだけでなく、真のDeep Crossingを実現する。
さらに、ノイズをフィルタし、クロスネットワーク内のパラメータ数を半減するセルフマスク演算を用いる。
融合層では,Tri-BCEと呼ばれる単純なマルチロストレードオフ計算手法を用いて,適切な監視信号を提供する。
6つのデータセットに関する総合的な実験は、DCNv3の有効性、効率、解釈可能性を示している。
コード、ログの実行、詳細なハイパーパラメータ設定は、https://github.com/salmon1802/DCNv3.comで公開されている。
関連論文リスト
- Learning Load Balancing with GNN in MPTCP-Enabled Heterogeneous Networks [13.178956651532213]
本稿では,MP TCP 対応 HetNet の LB 問題に対処するグラフニューラルネットワーク (GNN) モデルを提案する。
従来のディープニューラルネットワーク(DNN)と比較して、提案したGNNベースのモデルには2つの重要な長所がある。
論文 参考訳(メタデータ) (2024-10-22T15:49:53Z) - 4D ASR: Joint Beam Search Integrating CTC, Attention, Transducer, and Mask Predict Decoders [53.297697898510194]
我々は、4つのデコーダが同一のエンコーダを共有する共同モデリング手法を提案し、これを4Dモデリングと呼ぶ。
4Dモデルを効率的に訓練するために,マルチタスク学習を安定化させる2段階のトレーニング戦略を導入する。
さらに,3つのデコーダを組み合わせることで,新しい1パスビーム探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-05T05:18:20Z) - BDC-Occ: Binarized Deep Convolution Unit For Binarized Occupancy Network [55.21288428359509]
既存の3D占有ネットワークは重要なハードウェアリソースを必要としており、エッジデバイスの配備を妨げている。
本稿では,バイナライズド・ディープ・コンボリューション(BDC)ユニットを提案し,バイナライズド・ディープ・コンボリューション・レイヤの数を増やしつつ性能を効果的に向上させる。
我々のBDC-Occモデルは既存の3D占有ネットワークをバイナライズするために提案したBDCユニットを適用して作成する。
論文 参考訳(メタデータ) (2024-05-27T10:44:05Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Utterance Weighted Multi-Dilation Temporal Convolutional Networks for
Monaural Speech Dereverberation [26.94528951545861]
時間的畳み込みネットワーク(TCN)における標準深度分割畳み込みを置き換えるため、重み付き多重ディレーション深度分離畳み込みを提案する。
この重み付き多重拡散時間畳み込みネットワーク(WD-TCN)は、様々なモデル構成において、TCNを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-17T15:56:31Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Sequence-to-Sequence Load Disaggregation Using Multi-Scale Residual
Neural Network [4.094944573107066]
非侵入負荷モニタリング(Non-Intrusive Load Monitoring, NILM)は、電力をモニタするコスト効率の高い方法として、ますます注目されている。
ディープニューラルネットワークは、負荷分散の分野で大きな可能性を示している。
論文 参考訳(メタデータ) (2020-09-25T17:41:28Z) - Fully Dynamic Inference with Deep Neural Networks [19.833242253397206]
Layer-Net(L-Net)とChannel-Net(C-Net)と呼ばれる2つのコンパクトネットワークは、どのレイヤやフィルタ/チャネルが冗長であるかをインスタンス毎に予測する。
CIFAR-10データセットでは、LC-Netは11.9$times$ less floating-point Operations (FLOPs) となり、他の動的推論手法と比較して最大3.3%精度が向上する。
ImageNetデータセットでは、LC-Netは最大1.4$times$ FLOPsを減らし、Top-1の精度は他の方法よりも4.6%高い。
論文 参考訳(メタデータ) (2020-07-29T23:17:48Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z) - DeepLight: Deep Lightweight Feature Interactions for Accelerating CTR
Predictions in Ad Serving [15.637357991632241]
クリックスルー率(CTR)予測は、オンラインディスプレイ広告において重要な課題である。
埋め込みベースのニューラルネットワークは、両方の明示的な特徴相互作用を学ぶために提案されている。
しかし、これらの洗練されたモデルは、予測を少なくとも何百回も遅くする。
論文 参考訳(メタデータ) (2020-02-17T14:51:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。