論文の概要: Recent Advances of End-to-End Video Coding Technologies for AVS Standard Development
- arxiv url: http://arxiv.org/abs/2602.00483v1
- Date: Sat, 31 Jan 2026 03:07:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.214745
- Title: Recent Advances of End-to-End Video Coding Technologies for AVS Standard Development
- Title(参考訳): AVS規格開発におけるエンド・ツー・エンドビデオ符号化技術の最近の進歩
- Authors: Xihua Sheng, Xiongzhuang Liang, Chuanbo Tang, Zhirui Zuo, Yifan Bian, Yutao Xie, Zhuoyuan Li, Yuqi Li, Hui Xiang, Li Li, Dong Liu,
- Abstract要約: ビデオ圧縮効率の向上を追求するため、AVSビデオ符号化ワーキンググループは、エンドツーエンドのインテリジェントなビデオコーディングの標準化調査を開始した。
AVS-EEMの中核となる設計原則は、本質的に低い計算複雑性を特徴とする実用的展開に焦点を当てている。
本稿では、AVS-EEMの開発経緯を詳述し、その主要な技術フレームワークについて体系的な紹介を行う。
- 参考スコア(独自算出の注目度): 20.833873802580147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video coding standards are essential to enable the interoperability and widespread adoption of efficient video compression technologies. In pursuit of greater video compression efficiency, the AVS video coding working group launched the standardization exploration of end-to-end intelligent video coding, establishing the AVS End-to-End Intelligent Video Coding Exploration Model (AVS-EEM) project. A core design principle of AVS-EEM is its focus on practical deployment, featuring inherently low computational complexity and requiring strict adherence to the common test conditions of conventional video coding. This paper details the development history of AVS-EEM and provides a systematic introduction to its key technical framework, covering model architectures, training strategies, and inference optimizations. These innovations have collectively driven the project's rapid performance evolution, enabling continuous and significant gains under strict complexity constraints. Through over two years of iterative refinement and collaborative effort, the coding performance of AVS-EEM has seen substantial improvement. Experimental results demonstrate that its latest model achieves superior compression efficiency compared to the conventional AVS3 reference software, marking a significant step toward a deployable intelligent video coding standard.
- Abstract(参考訳): ビデオ符号化標準は、効率的なビデオ圧縮技術との相互運用性と広範な採用を可能にするために不可欠である。
ビデオ圧縮効率の向上を目指して、AVSビデオ符号化ワーキンググループは、エンドツーエンドのインテリジェントなビデオコーディングの標準化調査を開始し、AVS-EEM(End-to-End Intelligent Video Coding Exploration Model)プロジェクトを設立した。
AVS-EEMの中核となる設計原則は、計算の複雑さが本質的に低く、従来のビデオ符号化の一般的なテスト条件に厳格に従わなければならないという特徴を持つ、実践的な展開に重点を置いていることである。
本稿では, AVS-EEMの開発経緯を詳述するとともに, モデルアーキテクチャ, トレーニング戦略, 推論最適化など, 主要な技術フレームワークの体系的な紹介を行う。
これらのイノベーションは、プロジェクトの急速なパフォーマンスの進化を加速させ、厳格な複雑さの制約の下で、継続的かつ重要な利益を可能にしました。
AVS-EEMのコーディング性能は、2年以上にわたる反復的な改良と共同作業を通じて大幅に改善されている。
実験により, 従来のAVS3参照ソフトウェアと比較して圧縮効率が向上し, 実装可能なインテリジェントビデオコーディング標準に向けた重要なステップが示された。
関連論文リスト
- Compression Tells Intelligence: Visual Coding, Visual Token Technology, and the Unification [23.26600803714466]
人工知能の研究、特に(マルチモーダル)大規模言語モデル(LLMs/MLLMs)が支援されている。
本稿では,ビジュアルコーディングとビジョントークン技術という2つの主要な技術ファミリについて概観する。
我々は,マルチモーダルLLM(MLLM),AIGC(AIGC),具体的AIといった,より実用的なタスクにおけるタスク指向トークン開発の可能性について実験的に示す。
論文 参考訳(メタデータ) (2026-01-28T16:18:20Z) - EVEv2: Improved Baselines for Encoder-Free Vision-Language Models [72.07868838411474]
既存のエンコーダフリービジョン言語モデル(VLM)は、エンコーダベースモデルと性能ギャップを狭めている。
我々は,主流のエンコーダをベースとしたVLMと競合するエンコーダフリーVLMの効率的な戦略を開発する。
統一モデルにおいて、視覚と言語を適切に階層的に関連付けることで、モダリティ間の干渉を減少させることを示す。
論文 参考訳(メタデータ) (2025-02-10T18:59:58Z) - Standardizing Generative Face Video Compression using Supplemental Enhancement Information [32.11815096626186]
本稿では,補助強調情報(SEI)を用いたGFVC(Generative Face Video Compression)アプローチを提案する。
この記事執筆時点では,SEIメッセージを用いたGFVC方式がVersatile Supplemental Enhancement Information (VSEI)標準のドラフト修正に含まれている。
著者の知識を最大限活用するために、JVETが提案したSEIベースのGFVCアプローチは、生成ビデオ圧縮のための最初の標準化活動である。
論文 参考訳(メタデータ) (2024-10-19T13:37:24Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Video Coding for Machines: A Paradigm of Collaborative Compression and
Intelligent Analytics [127.65410486227007]
フレーム全体を圧縮、再構成することを目的としたビデオ符号化と、最も重要な情報のみを保存し、送信する特徴圧縮は、スケールの2つの端に立つ。
最近のビデオ圧縮の急激なトレンド、例えばディープラーニングベースのコーディングツールやエンドツーエンドの画像/ビデオコーディング、MPEG-7のコンパクトな特徴記述子標準などの取り組みは、持続的かつ迅速な開発を促進する。
本稿では,新たな領域であるVCM(Video Coding for Machines)の探索を行う。
論文 参考訳(メタデータ) (2020-01-10T17:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。