論文の概要: A Tri-Dynamic Preprocessing Framework for UGC Video Compression
- arxiv url: http://arxiv.org/abs/2512.16101v1
- Date: Thu, 18 Dec 2025 02:38:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.886146
- Title: A Tri-Dynamic Preprocessing Framework for UGC Video Compression
- Title(参考訳): UGCビデオ圧縮のためのトライダイナミック前処理フレームワーク
- Authors: Fei Zhao, Mengxi Guo, Shijie Zhao, Junlin Li, Li Zhang, Xiaodong Xie,
- Abstract要約: テストビデオのエンコーディングのためのTri-Dynamic Preprocessingフレームワークを提案する。
我々は、前処理強度を調節する適応係数と、シミュレータを微調整する適応量子化レベルを用いる。
大規模テストセットの実験結果から,本手法が優れた性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 26.253209831074184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, user generated content (UGC) has become the dominant force in internet traffic. However, UGC videos exhibit a higher degree of variability and diverse characteristics compared to traditional encoding test videos. This variance challenges the effectiveness of data-driven machine learning algorithms for optimizing encoding in the broader context of UGC scenarios. To address this issue, we propose a Tri-Dynamic Preprocessing framework for UGC. Firstly, we employ an adaptive factor to regulate preprocessing intensity. Secondly, an adaptive quantization level is employed to fine-tune the codec simulator. Thirdly, we utilize an adaptive lambda tradeoff to adjust the rate-distortion loss function. Experimental results on large-scale test sets demonstrate that our method attains exceptional performance.
- Abstract(参考訳): 近年,ユーザ生成コンテンツ(UGC)がインターネットトラフィックの主流となっている。
しかし、UGCビデオは従来の符号化テストビデオと比較して、多様性と多様な特性を示す。
この分散は、UGCシナリオのより広いコンテキストでエンコーディングを最適化するために、データ駆動機械学習アルゴリズムの有効性に挑戦する。
この問題に対処するため,UGCのためのTri-Dynamic Preprocessingフレームワークを提案する。
まず,前処理強度の調整に適応係数を用いる。
次に、コーデックシミュレータを微調整するために適応量子化レベルを用いる。
第3に、適応的なラムダトレードオフを用いて、速度歪み損失関数を調整します。
大規模テストセットの実験結果から,本手法が優れた性能を発揮することが示された。
関連論文リスト
- Content Adaptive based Motion Alignment Framework for Learned Video Compression [72.13599533975413]
本稿では,コンテンツ適応型モーションアライメントフレームワークを提案する。
まず、粗いオフセット予測とマスク変調により動き補償を洗練させる2段階の流動誘導変形防止機構を導入する。
第2に,基準品質に基づいて歪み重みを調整するマルチ参照品質認識戦略を提案する。
第3に,スムーズな動き推定を得るために,フレームを大きさと解像度でダウンサンプルするトレーニングフリーモジュールを統合する。
論文 参考訳(メタデータ) (2025-12-15T02:51:47Z) - Adaptive 3D Gaussian Splatting Video Streaming: Visual Saliency-Aware Tiling and Meta-Learning-Based Bitrate Adaptation [9.779419462403144]
3D Splatting Video(3DGS)ストリーミングは、アカデミックと業界の両方で研究ホットスポットとして浮上している。
本研究では,空間的特徴と時間的特徴を統合した適応型3DGSタイリング手法を提案する。
また、ストリーミング中の3DGS表現における空間領域の劣化と結果の2Dレンダリング画像の品質を共同で評価する3DGSビデオの品質評価フレームワークについても紹介する。
論文 参考訳(メタデータ) (2025-07-19T03:00:36Z) - Learning from Streaming Video with Orthogonal Gradients [62.51504086522027]
本稿では,映像の連続的ストリームからの表現学習を自己指導的に行うという課題に対処する。
これは、トレーニング中にビデオが切り刻まれ、シャッフルされ、非冗長なバッチを生成する、ビデオ学習の標準的なアプローチとは異なる。
3つのタスクでシャッフルからシーケンシャルな学習に移行する際のパフォーマンスの低下を実演する。
論文 参考訳(メタデータ) (2025-04-02T17:59:57Z) - Exploiting Latent Properties to Optimize Neural Codecs [5.725546754007691]
本稿では,ベクトル量子化とエントロピー勾配の利点を利用して,市販コーデックの性能を向上させることを提案する。
これらの手法は、様々な事前訓練された手法で同じ品質の1~3%のコストを節約できることが示される。
論文 参考訳(メタデータ) (2025-01-02T12:45:31Z) - Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC [13.122745400640305]
3次元(3D)点雲は3Dオブジェクトやシーンを表現するためにますます人気が高まっている。
この課題に対処するため、Moving Picture Experts Groupは、GeometryベースのPoint Cloud Compression(G-PCC)標準を積極的に開発している。
RAHTの適応スキップ手法を提案し,最後の数層の残余を符号化するか否かを適応的に決定する。
論文 参考訳(メタデータ) (2024-12-07T07:43:44Z) - Prediction and Reference Quality Adaptation for Learned Video Compression [54.58691829087094]
時間予測はビデオ圧縮において最も重要な技術の一つである。
従来のビデオコーデックは、予測品質と基準品質に応じて最適な符号化モードを適応的に決定する。
本稿では,信頼性に基づく予測品質適応(PQA)モジュールと基準品質適応(RQA)モジュールを提案する。
論文 参考訳(メタデータ) (2024-06-20T09:03:26Z) - Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly
Detectors [117.61449210940955]
ビデオフレームレベルで適用された軽量マスク付きオートエンコーダ(AE)に基づく効率的な異常事象検出モデルを提案する。
動き勾配に基づく重みトークンへのアプローチを導入し、静的背景シーンから前景オブジェクトへ焦点を移す。
トレーニングビデオの強化のために合成異常事象を生成し,マスク付きAEモデルを用いてオリジナルのフレームを共同で再構築する。
論文 参考訳(メタデータ) (2023-06-21T06:18:05Z) - End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional
Video Compression [10.885590093103344]
学習VCは、非線形変換、運動、エントロピーモデルのエンドツーエンドの速度歪み(R-D)最適化トレーニングを同時に行うことができる。
本稿では,階層型モーションサンプリングとエンドツーエンド最適化の利点を組み合わせた,学習型階層型双方向ビデオ(LHBDC)を提案する。
論文 参考訳(メタデータ) (2021-12-17T14:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。