論文の概要: Plasticity-Aware Mixture of Experts for Learning Under QoE Shifts in Adaptive Video Streaming
- arxiv url: http://arxiv.org/abs/2504.09906v1
- Date: Mon, 14 Apr 2025 06:02:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:50:03.915060
- Title: Plasticity-Aware Mixture of Experts for Learning Under QoE Shifts in Adaptive Video Streaming
- Title(参考訳): 適応型ビデオストリーミングにおけるQoEシフト下での学習エキスパートの塑性認識混合
- Authors: Zhiqiang He, Zhi Liu,
- Abstract要約: Plasticity-Aware Mixture of Experts (PA-MoE)は、記憶保持と選択的忘れのバランスをとることによって、ネットワークの可塑性を調節する新しい学習フレームワークである。
PA-MoEは、動的ストリーミング環境における競合ベースラインよりも45.5%のQoE改善を実現していることを示す。
- 参考スコア(独自算出の注目度): 7.036243456626816
- License:
- Abstract: Adaptive video streaming systems are designed to optimize Quality of Experience (QoE) and, in turn, enhance user satisfaction. However, differences in user profiles and video content lead to different weights for QoE factors, resulting in user-specific QoE functions and, thus, varying optimization objectives. This variability poses significant challenges for neural networks, as they often struggle to generalize under evolving targets - a phenomenon known as plasticity loss that prevents conventional models from adapting effectively to changing optimization objectives. To address this limitation, we propose the Plasticity-Aware Mixture of Experts (PA-MoE), a novel learning framework that dynamically modulates network plasticity by balancing memory retention with selective forgetting. In particular, PA-MoE leverages noise injection to promote the selective forgetting of outdated knowledge, thereby endowing neural networks with enhanced adaptive capabilities. In addition, we present a rigorous theoretical analysis of PA-MoE by deriving a regret bound that quantifies its learning performance. Experimental evaluations demonstrate that PA-MoE achieves a 45.5% improvement in QoE over competitive baselines in dynamic streaming environments. Further analysis reveals that the model effectively mitigates plasticity loss by optimizing neuron utilization. Finally, a parameter sensitivity study is performed by injecting varying levels of noise, and the results align closely with our theoretical predictions.
- Abstract(参考訳): 適応型ビデオストリーミングシステムは、QoE(Quality of Experience)を最適化し、ユーザの満足度を高めるように設計されている。
しかし、ユーザプロファイルとビデオコンテンツの違いはQoE要因の重み付けに違いをもたらし、結果としてユーザ固有のQoE関数が生まれ、最適化の目的も様々になる。
この可変性は、進化するターゲットの下での一般化に苦しむニューラルネットワークにとって大きな課題となる。
この制限に対処するために,記憶保持と選択的忘れのバランスをとることによってネットワークの可塑性を動的に調節する新しい学習フレームワークであるPlasticity-Aware Mixture of Experts (PA-MoE)を提案する。
特に、PA-MoEはノイズ注入を利用して、時代遅れの知識を選択的に忘れることを促進する。
さらに,PA-MoEの学習性能を定量的に評価する後悔境界を導出することにより,PA-MoEの厳密な理論的解析を行う。
実験により、PA-MoEは動的ストリーミング環境における競合ベースラインよりも45.5%のQoE改善を実現していることが示された。
さらなる分析により、このモデルはニューロンの利用を最適化することにより、効果的に可塑性損失を緩和することが明らかとなった。
最後に,様々な騒音レベルを注入してパラメータ感度の研究を行い,その結果を理論的予測と密接に一致させた。
関連論文リスト
- Dynamic Noise Preference Optimization for LLM Self-Improvement via Synthetic Data [51.62162460809116]
我々は、イテレーション間で一貫した改善を保証するために、動的ノイズ優先最適化(DNPO)を導入します。
Zephyr-7Bでの実験では、DNPOは既存の手法を一貫して上回り、平均性能は2.6%向上した。
DNPOは、GPT-4評価のベースラインに比べて29.4%のウィンロス率差で、モデル生成データの品質が大幅に向上したことを示している。
論文 参考訳(メタデータ) (2025-02-08T01:20:09Z) - Dynamic Weight Adjusting Deep Q-Networks for Real-Time Environmental Adaptation [3.2162648244439684]
本研究では、動的重み調整をDeep Q-Networks(DQN)に統合し、適応性を高めることを検討する。
これらの調整は、経験リプレイにおけるサンプリング確率を変更して、モデルがより重要な遷移に焦点を合わせるようにすることで実施する。
動的環境をうまくナビゲートする新しいDQNのためのインタラクティブ・ダイナミック・アセスメント・メソッド(IDEM)を設計する。
論文 参考訳(メタデータ) (2024-11-04T19:47:23Z) - Impact of ML Optimization Tactics on Greener Pre-Trained ML Models [46.78148962732881]
本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。
画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。
動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
論文 参考訳(メタデータ) (2024-09-19T16:23:03Z) - Adaptive Friction in Deep Learning: Enhancing Optimizers with Sigmoid and Tanh Function [0.0]
我々は適応摩擦係数を統合する2つの新しい勾配であるsigSignGradとtanhSignGradを紹介する。
我々の理論解析は,摩擦係数Sの広帯域調整能力を示す。
ResNet50 と ViT アーキテクチャを用いた CIFAR-10, Mini-Image-Net 実験により,提案手法の優れた性能が確認された。
論文 参考訳(メタデータ) (2024-08-07T03:20:46Z) - Adaptive Training of Grid-Dependent Physics-Informed Kolmogorov-Arnold Networks [4.216184112447278]
物理インフォームドニューラルネットワーク(PINN)は、部分微分方程式(PDE)を解くための堅牢なフレームワークとして登場した。
本稿では、PDEを解くために、グリッド依存のKolmogorov-Arnold Networks(PIKAN)の高速なJAXベースの実装を提案する。
適応的特徴は解の精度を著しく向上させ,基準解に対するL2誤差を最大43.02%減少させることを示した。
論文 参考訳(メタデータ) (2024-07-24T19:55:08Z) - Edge-Efficient Deep Learning Models for Automatic Modulation Classification: A Performance Analysis [0.7428236410246183]
無線信号の自動変調分類(AMC)のための最適化畳み込みニューラルネットワーク(CNN)について検討した。
本稿では,これらの手法を組み合わせて最適化モデルを提案する。
実験結果から,提案手法と組み合わせ最適化手法は,複雑度が著しく低いモデルの開発に極めて有効であることが示唆された。
論文 参考訳(メタデータ) (2024-04-11T06:08:23Z) - Efficient and Flexible Neural Network Training through Layer-wise Feedback Propagation [49.44309457870649]
ニューラルネットワークのような予測器のための新しいトレーニング原理であるLFP(Layer-wise Feedback Propagation)を提案する。
LFPは、与えられたタスクの解決へのそれぞれの貢献に基づいて、個々のニューロンに報酬を分解する。
提案手法は,ネットワークの有用な部分を補強し,有害な部分を弱めるという欲求的アプローチを実現する。
論文 参考訳(メタデータ) (2023-08-23T10:48:28Z) - ILCAS: Imitation Learning-Based Configuration-Adaptive Streaming for
Live Video Analytics with Cross-Camera Collaboration [53.29046841099947]
本稿では,最初の模倣学習 (IL) に基づく構成適応型ライブビデオ分析 (VA) ストリーミングシステムを提案する。
ILCASは、オフラインの最適ポリシーとして設計された専門家から収集されたデモでエージェントを訓練する。
ILCASは最先端のソリューションに比べて優れており、平均精度は2-20.9%改善し、チャンクアップロードラグは19.9-85.3%削減された。
論文 参考訳(メタデータ) (2023-08-19T16:20:59Z) - PLASTIC: Improving Input and Label Plasticity for Sample Efficient
Reinforcement Learning [54.409634256153154]
強化学習(RL)では, サンプル効率の向上が重要である。
原則として、非政治的なRLアルゴリズムは、環境相互作用毎に複数の更新を可能にすることで、サンプル効率を向上させることができる。
本研究は, この現象の原因を, 塑性を2つの側面に分けて検討した。
論文 参考訳(メタデータ) (2023-06-19T06:14:51Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Interpreting Robust Optimization via Adversarial Influence Functions [24.937845875059928]
本稿では、ロバストな最適化によって生成されるソリューションを調査するためのツールとして、AIF(Adversarial Influence Function)を紹介する。
AIFの使用法を説明するために、モデル感度(自然データにおける予測損失の変化を捉えるために定義された量)について検討する。
AIFを用いて、モデルの複雑さとランダムな平滑化が、特定のモデルに対するモデルの感度にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2020-10-03T01:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。