Fugu-MT 論文翻訳(概要): Is Sliding Window All You Need? An Open Framework for Long-Sequence Recommendation

論文の概要: Is Sliding Window All You Need? An Open Framework for Long-Sequence Recommendation

arxiv url: http://arxiv.org/abs/2604.12372v1
Date: Tue, 14 Apr 2026 06:59:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-15 19:11:32.303583
Title: Is Sliding Window All You Need? An Open Framework for Long-Sequence Recommendation
Title（参考訳）: スライディングウィンドウは必要か? ロングシーケンスレコメンデーションのためのオープンフレームワーク
Authors: Sayak Chakrabarty, Souradip Pal,
Abstract要約: 長いシーケンスでのトレーニングは、現実的なメモリと遅延の予算の下では非現実的とされがちである。本研究は, 実効性だけでなく, 学業規模においても有効であることを示すものである。我々は、スライディングウィンドウを用いた産業スタイルのロングシーケンストレーニングを実装する、完全なエンドツーエンドフレームワークをリリースする。
参考スコア（独自算出の注目度）: 3.437656066916039
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Long interaction histories are central to modern recommender systems, yet training with long sequences is often dismissed as impractical under realistic memory and latency budgets. This work demonstrates that it is not only practical but also effective-at academic scale. We release a complete, end-to-end framework that implements industrial-style long-sequence training with sliding windows, including all data processing, training, and evaluation scripts. Beyond reproducing prior gains, we contribute two capabilities missing from earlier reports: (i) a runtime-aware ablation study that quantifies the accuracy-compute frontier across windowing regimes and strides, and (ii) a novel k-shift embedding layer that enables million-scale vocabularies on commodity GPUs with negligible accuracy loss. Our implementation trains reliably on modest university clusters while delivering competitive retrieval quality (e.g., up to +6.04% MRR and +6.34% Recall@10 on Retailrocket) with $\sim 4 \times $ training-time overheads. By packaging a robust pipeline, reporting training time costs, and introducing an embedding mechanism tailored for low-resource settings, we transform long-sequence training from a closed, industrial technique into a practical, open, and extensible methodology for the community.
Abstract（参考訳）: 長いインタラクション履歴は現代のレコメンデーションシステムの中心であるが、長いシーケンスでのトレーニングは、現実的なメモリと遅延の予算の下では非現実的なものとして無視されることが多い。本研究は, 実効性だけでなく, 学業規模においても有効であることを示すものである。我々は、すべてのデータ処理、トレーニング、評価スクリプトを含む、スライディングウィンドウによる産業スタイルのロングシーケンストレーニングを実装する完全なエンドツーエンドフレームワークをリリースする。事前の利益を再現するだけでなく、以前のレポートから欠落した2つの機能に貢献しています。 (i)ウィンドウリング体制と歩留まりを横断する精度計算フロンティアを定量化するランタイム対応アブレーション研究 (II) 最小限の精度を損なうことなく, 商品GPU上で百万規模の語彙を表現可能な, 新規なkシフト埋め込み層。我々の実装は、競争力のある検索品質(例えば、Retailrocketの+6.04% MRRと+6.34% Recall@10)を提供しながら、控えめな大学のクラスタで確実にトレーニングします。堅牢なパイプラインをパッケージ化し,トレーニング時間コストを報告し,低リソース環境に適した埋め込み機構を導入することにより,閉ざされた産業技術から,実践的でオープンで拡張可能なコミュニティの方法論に転換する。

関連論文リスト

Efficient Continual Learning in Language Models via Thalamically Routed Cortical Columns [0.16921396880325779]
アーキテクチャレベルでの継続的な学習に対処するデコーダのみのバックボーンであるTRC$2(Thalamically Routed Cortical Columns)を導入します。結果として得られるブロックはスパースでチャンク並列であり、各サブシステムのクリーンなアブレーションを維持しながら、効率的なトレーニングと推論を可能にする。
論文参考訳（メタデータ） (2026-02-25T23:38:16Z)
Train Long, Think Short: Curriculum Learning for Efficient Reasoning [51.506559652495476]
長さ制御推論のためのカリキュラム学習戦略を提案する。当社の手法は寛大なトークン予算から始まり、トレーニングをしながら徐々に厳格化します。 GSM8K、MATH500、SVAMP、College Math、GSM+の実験は、カリキュラムベースのトレーニングが固定予算ベースラインを一貫して上回ることを示した。
論文参考訳（メタデータ） (2025-08-12T13:48:03Z)
Orthogonal Soft Pruning for Efficient Class Unlearning [26.76186024947296]
そこで本研究では,ミリ秒レベルの応答時間で高速かつ高精度な記憶を実現するための,クラス認識型ソフトプルーニングフレームワークを提案する。提案手法は,クラス固有のチャネルを効率的に識別しながら,畳み込みフィルタと区切られた特徴表現をデコレーションする。
論文参考訳（メタデータ） (2025-06-24T09:52:04Z)
Training Long-Context LLMs Efficiently via Chunk-wise Optimization [60.05884946552877]
textitSequential Chunk-wise Optimization (SeCO) は、長い入力を管理可能なチャンクに分割するメモリ効率の訓練パラダイムである。 textitSparse Chunk-wise Optimization (SpaCO)を導入し、特定のチャンクへの勾配を選択的に伝播することで計算オーバーヘッドを削減する。 SpaCOは、コンテキスト長からバックプロパゲーションの計算コストを分離し、シーケンスが長くなるにつれて、トレーニング時間が徐々に推論時間に収束することを可能にする。
論文参考訳（メタデータ） (2025-05-22T14:11:34Z)
Effective and Efficient Training for Sequential Recommendation using Recency Sampling [91.02268704681124]
本稿では,新しいRecency-based Smpling of Sequencesトレーニング目標を提案する。提案手法により拡張されたモデルにより,最先端のBERT4Recに近い性能が得られることを示す。
論文参考訳（メタデータ） (2022-07-06T13:06:31Z)
Online Convolutional Re-parameterization [51.97831675242173]
2段階のパイプラインであるオンライン畳み込み再パラメータ化(OREPA)は、複雑なトレーニング時間ブロックを単一の畳み込みに絞ることで、巨大なトレーニングオーバーヘッドを低減することを目的としている。最先端のre-paramモデルと比較して、OREPAはトレーニング時間のメモリコストを約70%削減し、トレーニング速度を約2倍向上させることができる。また、オブジェクト検出とセマンティックセグメンテーションの実験を行い、下流タスクに一貫した改善を示す。
論文参考訳（メタデータ） (2022-04-02T09:50:19Z)
ProgFed: Effective, Communication, and Computation Efficient Federated Learning by Progressive Training [65.68511423300812]
本稿では,効率的なフェデレート学習のためのプログレッシブトレーニングフレームワークであるProgFedを提案する。 ProgFedは計算と双方向通信のコストを本質的に低減し、最終モデルの強力な性能を維持している。以上の結果から, ProgFed はフルモデルの標準トレーニングと同等の速度で収束することがわかった。
論文参考訳（メタデータ） (2021-10-11T14:45:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。