論文の概要: Intelligent Elastic Feature Fading: Enabling Model Retrain-Free Feature Efficiency Rollouts at Scale
- arxiv url: http://arxiv.org/abs/2605.00324v1
- Date: Fri, 01 May 2026 01:03:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.80627
- Title: Intelligent Elastic Feature Fading: Enabling Model Retrain-Free Feature Efficiency Rollouts at Scale
- Title(参考訳): インテリジェントな機能フェーディング - モデルの再トレーニング不要な機能効率ロールアウトの大規模化
- Authors: Jieming Di, Xiaoyu Chen, Ying She, Siyu Wang, Lizzie Liu, Fenggang Wu, Jiaoying Mu, Tony Tsui, Amr Elroumy, Hsing Tang, Zewei Jiang, Qiao Yang, Lin Qi, Haibo Lin, Weifeng Cui, Daniel Li, Kapil Gupta, Shivendra Pratap Singh, Jie Zheng, Arnold Overwijk, Ling Leng, Sri Reddy, Robert Malkin, Rocky Liu,
- Abstract要約: 大規模ランキングシステムは、複数の時間軸にまたがるユーザー行動から派生した何千もの機能に依存している。
本稿では,リトレーニング不要な機能のロールアウトを可能にする生産基盤システムであるIntelligent Elastic Feature Fading(IEFF)を紹介する。
IEFFはインクリメンタルな機能カバレッジ調整をサポートし、モデルは繰り返しトレーニングによって適応し、明示的なリトレーニングサイクルへの依存性を排除している。
- 参考スコア(独自算出の注目度): 8.866668369478655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale ranking systems depend on thousands of features derived from user behavior across multiple time horizons. Typically requires model retraining -- resulting in long iteration cycles (3--6 months), substantial GPU resource consumption, and limited rollout throughput. We introduce Intelligent Elastic Feature Fading (IEFF), a production infrastructure system that enables retrain-free feature efficiency rollouts by elastically controlling feature coverage and distribution at serving time. IEFF supports incremental feature coverage adjustments while models adapt through recurring training, eliminating dependencies on explicit retraining cycles. The system incorporates strict safety guardrails, reversibility mechanisms, and comprehensive monitoring to ensure stability at scale. Across multiple production use cases, IEFF accelerates efficiency-related rollouts by 5$\times$, eliminates retraining-related GPU overhead, and enables faster capacity recycling. Extensive offline and online experiments demonstrate that gradual feature fading prevents 50--55\% of online performance degradation compared to abrupt feature removal, while maintaining stable model behavior. These results establish elastic, system-level feature fading as a practical and scalable approach for managing feature efficiency in modern industrial ranking systems.
- Abstract(参考訳): 大規模ランキングシステムは、複数の時間軸にまたがるユーザー行動から派生した何千もの機能に依存している。
結果として、長いイテレーションサイクル(3~6ヶ月)、相当量のGPUリソース消費、ロールアウトスループットの制限といった結果になる。
サービス時の機能カバレッジと分散を弾性的に制御することで、再トレーニング不要な機能効率のロールアウトを可能にする生産基盤システムであるIntelligent Elastic Feature Fading(IEFF)を紹介する。
IEFFはインクリメンタルな機能カバレッジ調整をサポートし、モデルは繰り返しトレーニングによって適応し、明示的なリトレーニングサイクルへの依存性を排除している。
このシステムには厳格な安全ガードレール、可逆性機構、大規模な安定性を確保するための包括的な監視が組み込まれている。
複数のプロダクションユースケースにわたって、IEFFは効率関連ロールアウトを5$\times$で高速化し、リトレーニング関連GPUオーバーヘッドを排除し、キャパシティの高速なリサイクルを可能にする。
大規模なオフラインおよびオンライン実験により、段階的な機能低下は、安定したモデル動作を維持しながら、突然の機能削除と比較して、オンラインのパフォーマンス低下の50~55%を防いでいることが示されている。
これらの結果は、現代の産業ランキングシステムにおける特徴効率を管理するための実用的でスケーラブルなアプローチとして、弾力性のあるシステムレベルの特徴フェードを確立している。
関連論文リスト
- A Systematic Post-Train Framework for Video Generation [76.26555417456773]
大規模ビデオ拡散モデルでは、高解像度でセマンティックにリッチなコンテンツを生成できることが顕著に示されている。
迅速な感度、時間的不整合、禁止的推論コストといった重要な問題のために、事前訓練されたパフォーマンスと実際のデプロイメント要件の間には、大きなギャップが残っている。
本研究では,事前学習されたモデルとユーザの意図を4つの相乗的段階を通して体系的に整合させる総合的なポストトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-28T09:34:51Z) - Drift-Aware Online Dynamic Learning for Nonstationary Multivariate Time Series: Application to Sintering Quality Prediction [8.77587871192859]
堅牢な多時間予測性能を維持するために,DA-MSDL(Drift-Aware Multi-Scale Dynamic Learning)フレームワークを提案する。
提案フレームワークは,非定常環境における品質モニタリングに有効なオンライン動的学習パラダイムを提供する。
論文 参考訳(メタデータ) (2026-04-10T14:30:57Z) - DropoutTS: Sample-Adaptive Dropout for Robust Time Series Forecasting [59.868414584142336]
DropoutTS はモデルに依存しないプラグインで、パラダイムを "What" から "How much" にシフトします。
ノイズを適応的なドロップアウト率にマッピングする - きめ細かい忠実さを維持しながら、急激な変動を選択的に抑制する。
論文 参考訳(メタデータ) (2026-01-29T13:49:20Z) - Each Prompt Matters: Scaling Reinforcement Learning Without Wasting Rollouts on Hundred-Billion-Scale MoE [16.58714489761542]
提案するCompassMax-V3-Thinkingは,1つの原理に基づいて構築された新しいRLフレームワークでトレーニングされた100億規模のMoE推論モデルである。
これらの課題を克服するために、いくつかの統一されたイノベーションを導入します。
結果として得られるモデルは、内部評価と公開評価の両方で強力なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2025-12-08T16:57:43Z) - Human-in-the-loop Online Rejection Sampling for Robotic Manipulation [55.99788088622936]
Hi-ORSは、オンライン微調整中に負の報酬を得たサンプルをフィルタリングすることで、値推定を安定化する。
Hi-ORSは、わずか1.5時間でコンタクトリッチな操作をマスターするためのpiベースのポリシーを微調整する。
論文 参考訳(メタデータ) (2025-10-30T11:53:08Z) - Continual Learning for Adaptive AI Systems [0.0]
クラスタ・アウェア・リプレイ(Cluster-Aware Replay, CAR)は、クラスバランスの小さなリプレイバッファと正規化用語を統合するハイブリッド連続学習フレームワークである。
CARは、微調整単独よりも初期のタスクパフォーマンスを保ちます。
論文 参考訳(メタデータ) (2025-10-09T00:44:32Z) - The Curious Case of In-Training Compression of State Space Models [49.819321766705514]
ステートスペースモデル(SSM)は、並列化可能なトレーニングと高速推論の両方を提供する。
鍵となる設計上の課題は、表現力の最大化と計算負荷の制限の間の適切なバランスを打つことだ。
我々のアプローチである textscCompreSSM はリニアリカレントユニットのような線形時間不変SSMに適用されるが、選択モデルにも拡張可能である。
論文 参考訳(メタデータ) (2025-10-03T09:02:33Z) - CBPNet: A Continual Backpropagation Prompt Network for Alleviating Plasticity Loss on Edge Devices [16.318540474216416]
塑性の低下は、トレーニング過程において未利用パラメータの更新活力の欠如に起因していると論じる。
本稿では,モデルの学習活力を回復するための有効かつパラメータ効率の高いフレームワークである連続バックプロパゲーション・プロンプト・ネットワーク(CBPNet)を提案する。
論文 参考訳(メタデータ) (2025-09-19T09:16:54Z) - PowerGrow: Feasible Co-Growth of Structures and Dynamics for Power Grid Synthesis [75.14189839277928]
本稿では,運用効率を維持しながら計算オーバーヘッドを大幅に削減する,共同生成フレームワークPowerGrowを提案する。
ベンチマーク設定による実験では、PowerGrowはフィデリティと多様性において、事前の拡散モデルよりも優れていた。
これは、運用上有効で現実的な電力グリッドシナリオを生成する能力を示している。
論文 参考訳(メタデータ) (2025-08-29T01:47:27Z) - Balancing Expressivity and Robustness: Constrained Rational Activations for Reinforcement Learning [9.120944934920141]
強化学習と継続学習の両方において、訓練可能な合理的なアクティベーションについて検討する。
我々の主な成果は、合理的なアクティベーションにおける表現性と可塑性のトレードオフを示すことである。
本研究は, 動的非定常環境におけるロバストかつトレーニング可能なアクティベーションに対して, 実用的な設計原理を提供する。
論文 参考訳(メタデータ) (2025-07-19T19:53:08Z) - SPEQ: Offline Stabilization Phases for Efficient Q-Learning in High Update-To-Data Ratio Reinforcement Learning [51.10866035483686]
強化学習(RL)における高アップデート・トゥ・データ(UTD)比のアルゴリズムは、サンプル効率を改善するが、高い計算コストを伴い、現実世界のスケーラビリティを制限している。
我々は、低UTDオンライントレーニングと周期的オフライン安定化フェーズを組み合わせたRLアルゴリズムである、効率的なQ-Learningのためのオフライン安定化フェーズ(SPEQ)を提案する。
これらのフェーズでは、Q-関数は固定されたリプレイバッファ上で高いUTD比で微調整され、サブ最適データの冗長な更新が削減される。
論文 参考訳(メタデータ) (2025-01-15T09:04:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。