論文の概要: EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems
- arxiv url: http://arxiv.org/abs/2402.00390v1
- Date: Thu, 1 Feb 2024 07:22:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 16:15:36.555423
- Title: EASRec: Elastic Architecture Search for Efficient Long-term Sequential
Recommender Systems
- Title(参考訳): EASRec: 効率的な長期シーケンスレコメンダシステムのための弾性アーキテクチャ探索
- Authors: Sheng Zhang, Maolin Wang, Yao Zhao, Chenyi Zhuang, Jinjie Gu, Ruocheng
Guo, Xiangyu Zhao, Zijian Zhang, Hongzhi Yin
- Abstract要約: 現在のSRS(Sequential Recommender Systems)は、計算とリソースの非効率に悩まされている。
我々は、効率的な長期シーケンスレコメンダシステム(EASRec)のための弾性アーキテクチャー探索を開発する。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
- 参考スコア(独自算出の注目度): 82.76483989905961
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this age where data is abundant, the ability to distill meaningful
insights from the sea of information is essential. Our research addresses the
computational and resource inefficiencies that current Sequential Recommender
Systems (SRSs) suffer from. especially those employing attention-based models
like SASRec, These systems are designed for next-item recommendations in
various applications, from e-commerce to social networks. However, such systems
suffer from substantial computational costs and resource consumption during the
inference stage. To tackle these issues, our research proposes a novel method
that combines automatic pruning techniques with advanced model architectures.
We also explore the potential of resource-constrained Neural Architecture
Search (NAS), a technique prevalent in the realm of recommendation systems, to
fine-tune models for reduced FLOPs, latency, and energy usage while retaining
or even enhancing accuracy. The main contribution of our work is developing the
Elastic Architecture Search for Efficient Long-term Sequential Recommender
Systems (EASRec). This approach aims to find optimal compact architectures for
attention-based SRSs, ensuring accuracy retention. EASRec introduces data-aware
gates that leverage historical information from input data batch to improve the
performance of the recommendation network. Additionally, it utilizes a dynamic
resource constraint approach, which standardizes the search process and results
in more appropriate architectures. The effectiveness of our methodology is
validated through exhaustive experiments on three benchmark datasets, which
demonstrates EASRec's superiority in SRSs. Our research set a new standard for
future exploration into efficient and accurate recommender systems, signifying
a substantial advancement within this swiftly advancing field.
- Abstract(参考訳): データが豊富であるこの時代には、情報海から意味のある洞察を抽出する能力が不可欠である。
本研究は,現在SRS(Sequential Recommender Systems)が抱える計算と資源の非効率性について考察する。
これらのシステムは、eコマースからソーシャルネットワークまで、さまざまなアプリケーションにおける次のイテムレコメンデーションのために設計されています。
しかし、これらのシステムは、推論段階での計算コストと資源消費に悩まされている。
そこで本研究では,自動刈り取り技術と高度なモデルアーキテクチャを組み合わせた新しい手法を提案する。
また,レコメンデーションシステムの分野で広く普及する手法であるnas(resource-constrained neural architecture search)の可能性を探究し,フロップ,レイテンシ,エネルギー使用量を減らすためのモデルを精度を維持しつつ微調整する。
私たちの研究の主な貢献は、効率的な長期シーケンスレコメンダシステム(EASRec)のためのElastic Architecture Searchの開発です。
このアプローチは注意に基づくsrssのための最適なコンパクトアーキテクチャを見つけ、正確性を確保することを目的としている。
EASRecは、入力データバッチから履歴情報を活用するデータ認識ゲートを導入し、レコメンデーションネットワークの性能を改善する。
さらに、動的リソース制約アプローチを利用して、検索プロセスを標準化し、より適切なアーキテクチャを実現する。
SRSにおけるEASRecの優位性を示す3つのベンチマークデータセットの徹底的な実験により,本手法の有効性を検証した。
私たちの研究は、効率的で正確なレコメンダシステムへの将来の調査のための新しい標準を設定しました。
関連論文リスト
- Query Optimization for Parametric Knowledge Refinement in Retrieval-Augmented Large Language Models [26.353428245346166]
Extract-Refine-Retrieve-Read (ERRR)フレームワークは、Retrieval-Augmented Generation (RAG)システムにおける事前検索情報ギャップを埋めるように設計されている。
RAGで使用される従来のクエリ最適化手法とは異なり、ERRRフレームワークはLarge Language Models (LLM) から知識を抽出することから始まる。
論文 参考訳(メタデータ) (2024-11-12T14:12:45Z) - Exploring Applications of State Space Models and Advanced Training Techniques in Sequential Recommendations: A Comparative Study on Efficiency and Performance [41.677784966514686]
本研究は, シーケンシャルレコメンデーションにおける3つの有望な方向性に焦点を当てる。
ひとつは、SSM(State Space Models)を使うことで、レイテンシ、メモリ、推論コストの低いシーケンシャルレコメンデーションドメインでSOTA結果を達成することができるように、スピードを向上することである。
2つ目は、LLM(Large Language Models)によるレコメンデーションの品質向上、参照モデルなしでのモノリシックな選好最適化(ORPO)、コスト削減とトレーニングプロセスの高速化を目的とした適応型バッチおよびステップサイズアルゴリズムの実装である。
論文 参考訳(メタデータ) (2024-08-10T18:09:10Z) - A Study on the Implementation Method of an Agent-Based Advanced RAG System Using Graph [0.0]
本研究では、グラフ技術に基づく高度なRAGシステムを実装し、高品質な生成AIサービスを開発する。
検索した情報の信頼性を評価するためにLangGraphを使用し、さまざまなデータを合成して、より正確で拡張されたレスポンスを生成する。
論文 参考訳(メタデータ) (2024-07-29T13:26:43Z) - A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文 参考訳(メタデータ) (2024-06-25T07:45:00Z) - Efficient Architecture Search via Bi-level Data Pruning [70.29970746807882]
この研究は、DARTSの双方向最適化におけるデータセット特性の重要な役割を探求する先駆者となった。
我々は、スーパーネット予測力学を計量として活用する新しいプログレッシブデータプルーニング戦略を導入する。
NAS-Bench-201サーチスペース、DARTSサーチスペース、MobileNetのようなサーチスペースに関する総合的な評価は、BDPがサーチコストを50%以上削減することを検証する。
論文 参考訳(メタデータ) (2023-12-21T02:48:44Z) - Embedding in Recommender Systems: A Survey [67.67966158305603]
重要な側面は、ユーザやアイテムIDといった高次元の離散的な特徴を低次元連続ベクトルに包含する技法である。
埋め込み技術の適用は複雑なエンティティ関係を捉え、かなりの研究を刺激している。
この調査では、協調フィルタリング、自己教師付き学習、グラフベースのテクニックなどの埋め込み手法を取り上げている。
論文 参考訳(メタデータ) (2023-10-28T06:31:06Z) - Modeling Time-Series and Spatial Data for Recommendations and Other
Applications [1.713291434132985]
我々は,CTESデータの品質が低いために発生する可能性のある問題をレコメンデーションシステムに入力する。
CTESデータの質を向上させるため、時間的シーケンスにおける欠落イベントを克服する根本的な問題に対処する。
我々は、大規模CTES検索と人間の活動予測のためのソリューションの設計にそれらの能力を拡張した。
論文 参考訳(メタデータ) (2022-12-25T09:34:15Z) - Learning Where To Look -- Generative NAS is Surprisingly Efficient [11.83842808044211]
本稿では,より有望な潜在部分空間からサンプルを生成することを反復的に学習する,代理予測器と組み合わせた生成モデルを提案する。
このアプローチは、クエリ量を低く保ちながら、非常に効率的で効率的なアーキテクチャ検索をもたらす。
論文 参考訳(メタデータ) (2022-03-16T16:27:11Z) - LoRD-Net: Unfolded Deep Detection Network with Low-Resolution Receivers [104.01415343139901]
本稿では,1ビット計測から情報シンボルを復元する「LoRD-Net」というディープ検出器を提案する。
LoRD-Netは、関心のシグナルを回復するためのタスクベースのアーキテクチャである。
無線通信における1ビット信号回復のためのレシーバアーキテクチャの評価を行った。
論文 参考訳(メタデータ) (2021-02-05T04:26:05Z) - Off-Policy Reinforcement Learning for Efficient and Effective GAN
Architecture Search [50.40004966087121]
本稿では,GANアーキテクチャ探索のための強化学習に基づくニューラルアーキテクチャ探索手法を提案する。
鍵となる考え方は、よりスムーズなアーキテクチャサンプリングのためのマルコフ決定プロセス(MDP)として、GANアーキテクチャ探索問題を定式化することである。
我々は,従来の政策によって生成されたサンプルを効率的に活用する,非政治的なGANアーキテクチャ探索アルゴリズムを利用する。
論文 参考訳(メタデータ) (2020-07-17T18:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。