論文の概要: MaRI: Accelerating Ranking Model Inference via Structural Re-parameterization in Large Scale Recommendation System
- arxiv url: http://arxiv.org/abs/2602.23105v1
- Date: Thu, 26 Feb 2026 15:19:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.745951
- Title: MaRI: Accelerating Ranking Model Inference via Structural Re-parameterization in Large Scale Recommendation System
- Title(参考訳): 大規模リコメンデーションシステムにおける構造的再パラメータ化によるランキングモデル推論の高速化
- Authors: Yusheng Huang, Pengbo Xu, Shen Wang, Changxin Lao, Jiangxia Cao, Shuang Wen, Shuang Yang, Zhaojie Liu, Han Li, Kun Gai,
- Abstract要約: 本稿では,新しい行列再パラメータ推論フレームワークであるMaRIを提案する。
これは既存の手法を補完するアプローチとして機能し、精度の低下なしにランキングモデル推論を加速する。
MaRIは,機能融合行列の乗算において,ユーザ側の計算が冗長であるという観察に動機付けられている。
- 参考スコア(独自算出の注目度): 24.4139949756995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ranking models, i.e., coarse-ranking and fine-ranking models, serve as core components in large-scale recommendation systems, responsible for scoring massive item candidates based on user preferences. To meet the stringent latency requirements of online serving, structural lightweighting or knowledge distillation techniques are commonly employed for ranking model acceleration. However, these approaches typically lead to a non-negligible drop in accuracy. Notably, the angle of lossless acceleration by optimizing feature fusion matrix multiplication, particularly through structural reparameterization, remains underexplored. In this paper, we propose MaRI, a novel Matrix Re-parameterized Inference framework, which serves as a complementary approach to existing techniques while accelerating ranking model inference without any accuracy loss. MaRI is motivated by the observation that user-side computation is redundant in feature fusion matrix multiplication, and we therefore adopt the philosophy of structural reparameterization to alleviate such redundancy.
- Abstract(参考訳): ランク付けモデル、すなわち粗いランク付けモデルと細かなランク付けモデルは、大規模レコメンデーションシステムのコアコンポーネントとして機能し、ユーザの好みに基づいて大量のアイテム候補を評価する責任を負う。
オンラインサービスにおける厳格なレイテンシ要件を満たすため、構造的軽量化や知識蒸留技術がモデルアクセラレーションのランク付けに一般的に用いられている。
しかし、これらのアプローチは一般的に非無視的な精度の低下につながる。
特に,機能融合行列乗算の最適化,特に構造再パラメータ化によるロスレス加速の角度は未探索のままである。
本稿では,行列再パラメータ化推論フレームワークであるMaRIを提案する。これは既存の手法を補完する手法であり,精度を損なわずにランキングモデル推論を高速化する。
ユーザ側計算は特徴融合行列乗算において冗長であるという観察から動機付けられており,そのような冗長性を緩和するために構造的再パラメータ化の考え方を採用する。
関連論文リスト
- Can Recommender Systems Teach Themselves? A Recursive Self-Improving Framework with Fidelity Control [82.30868101940068]
本稿では,外部データや教師モデルに依存することなく,モデルが自身のパフォーマンスをブートストラップするパラダイムを提案する。
我々の理論的分析は、RSIRがデータ駆動型暗黙正則化器として機能し、最適化景観を円滑にしていることを示している。
より小さなモデルであっても利点があり、弱いモデルはより強力なモデルに対して効果的なトレーニングカリキュラムを生成することができることを示す。
論文 参考訳(メタデータ) (2026-02-17T15:31:32Z) - ODELoRA: Training Low-Rank Adaptation by Solving Ordinary Differential Equations [54.886931928255564]
低ランク適応(LoRA)は、深層移動学習においてパラメータ効率の高い微調整法として広く採用されている。
常微分方程式(ODE)の形でLoRA因子行列に対する新しい連続時間最適化ダイナミクスを提案する。
ODELoRAは,問題次元の異なるスケールのディープニューラルネットワークのトレーニングに不可欠な特性である,安定した特徴学習を実現する。
論文 参考訳(メタデータ) (2026-02-07T10:19:36Z) - SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models [53.19726629537694]
ビデオ生成モデルと人間の好みのトレーニング後のアライメントは、重要な目標である。
現在のデータ収集パラダイムは、プロンプト内のペアワイズアノテーションに依存しており、ノイズのラベル付けに悩まされている。
ビデオRMトレーニングのための体系的フレームワークであるSoliRewardを提案する。
論文 参考訳(メタデータ) (2025-12-17T14:28:23Z) - Revealing Low-Dimensional Structure in 2D Richtmyer-Meshkov Instabilities via Parametric Reduced-Order Modeling [0.6999740786886536]
Richtmyer-Meshkov不安定性(RMI)は多くのエンジニアリングタスクに必須である。
RMIはアブレーターと燃料を混合させ、コールドスポットを燃料に導入し、性能を低下させる。
本稿では,ラテント・スペース・ダイナミクス同定アルゴリズムに基づく2次元RMIの低次モデルを提案する。
論文 参考訳(メタデータ) (2025-10-17T20:19:00Z) - LSR-Adapt: Ultra-Efficient Parameter Tuning with Matrix Low Separation Rank Kernel Adaptation [3.9426000822656224]
現代の大規模言語モデルの厳密な規模のため、低ランクベースの適応はますます困難になっている。
本稿では,適応タスクに必要なパラメータの数を減らすために,効果的なカーネル化を提案する。
従来の低ランク法に比べてパラメータの約半分の精度で最先端性能を実現する。
論文 参考訳(メタデータ) (2025-02-19T09:20:47Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - Model order reduction of deep structured state-space models: A system-theoretic approach [0.0]
深い構造化状態空間モデルは高い予測性能を提供する。
学習された表現は、しばしば非常に大きなモデル順序に悩まされるため、制御設計の目的には適さない。
モデルの整合性を改善するためにトレーニング損失に組み込むことのできる2つの正規化項を導入する。
提示された正則化器は、同相表現と、縮小順序モデルによるより高速な推論という観点で利点をもたらす。
論文 参考訳(メタデータ) (2024-03-21T21:05:59Z) - Symplectic Autoencoders for Model Reduction of Hamiltonian Systems [0.0]
長期の数値安定性を確保するためには,システムに関連するシンプレクティックな構造を維持することが重要である。
本稿では,次元削減のための確立されたツールであるオートエンコーダの精神の中で,新しいニューラルネットワークアーキテクチャを提案する。
ネットワークのトレーニングには,非標準勾配降下法を適用した。
論文 参考訳(メタデータ) (2023-12-15T18:20:25Z) - Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。
大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文 参考訳(メタデータ) (2023-10-09T14:30:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。