論文の概要: NeR-SC: Adapting Neural Video Representation to Screen Content
- arxiv url: http://arxiv.org/abs/2605.27024v1
- Date: Tue, 26 May 2026 13:43:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.195347
- Title: NeR-SC: Adapting Neural Video Representation to Screen Content
- Title(参考訳): NeR-SC: 画面コンテンツへのニューラルビデオの適応
- Authors: Ruohan Shi, Jiaoyan Zhao, Haogang Feng,
- Abstract要約: 暗黙の神経表現は、ビデオ圧縮の有望なパラダイムとして現れている。
スクリーンコンテンツビデオには、シャープエッジ、限られたカラーパレット、強い時間的冗長性といった、異なる統計が示されています。
スクリーンコンテンツビデオに適したニューラル表現フレームワークNeR-SCを提案する。
- 参考スコア(独自算出の注目度): 0.9176056742068813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Implicit neural representations have emerged as a promising paradigm for video compression, with recent methods achieving competitive performance on natural video. However, screen content video -- common in remote desktop, online education, and cloud gaming -- exhibits distinct statistics: sharp edges, limited color palettes, and strong temporal redundancy. Existing neural representation methods, designed for natural scenes, lack mechanisms to exploit these properties, leaving substantial room for improvement. In this paper, we propose NeR-SC, a neural representation framework tailored for screen content video. Building on the SNeRV backbone, NeR-SC introduces three screen-content-specific modules: (i) a learnable color palette that models the discrete color structure of screen content by restricting the low-frequency sub-band to a learned color set; (ii) a multi-gate dense fusion module that replaces sequential feature fusion with dense, attention-gated cross-stage interaction; and (iii) an embedding-level frame skip strategy that bypasses redundant decoder invocations for static frames, with zero training overhead. Experiments on DSCVC and VCD show that NeR-SC achieves 40.32~dB and 41.73~dB average PSNR, outperforming representative neural video representation methods and, at low bitrates, surpassing H.264 and H.265. The skip strategy enables real-time decoding with no loss in quality.
- Abstract(参考訳): 暗黙的なニューラル表現はビデオ圧縮の有望なパラダイムとして登場し、近年では自然ビデオ上での競合性能を達成する方法が提案されている。
しかし、リモートデスクトップ、オンライン教育、クラウドゲームで一般的なスクリーンコンテンツビデオは、シャープエッジ、限られたカラーパレット、強い時間的冗長性といった、異なる統計を示している。
自然界のために設計された既存の神経表現法では、これらの特性を利用するメカニズムが欠如しており、改善の余地は残されている。
本稿では,スクリーンコンテンツビデオに適したニューラル表現フレームワークNeR-SCを提案する。
SNeRVのバックボーン上に構築されたNeR-SCには,3つのスクリーンコンテンツ固有のモジュールが導入されている。
一 低周波のサブバンドを学習色集合に制限することにより、画面内容の離散色構造をモデル化する学習可能なカラーパレット
(ii) 逐次的特徴融合に置き換える多ゲート高密度核融合モジュール
3) 静的フレームに対する冗長なデコーダ呼び出しを回避し、トレーニングオーバーヘッドをゼロにする埋め込みレベルのフレームスキップ戦略。
DSCVCとVCDの実験では、NeR-SCは40.32~dBと41.73~dBの平均PSNRを達成し、代表的ニューラルビデオ表現法を上回り、低ビットレートではH.264とH.265を上回っている。
スキップ戦略は、品質を損なうことなくリアルタイムデコードを可能にする。
関連論文リスト
- NeRV-Diffusion: Diffuse Implicit Neural Representations for Video Synthesis [48.35964370809449]
NeRV-Diffusionは暗黙の潜伏ビデオ拡散モデルであり、ニューラルネットワークの重みを生成することによってビデオを合成する。
フレームワイドな特徴マップにビデオをエンコードする従来のビデオトークンとは対照的に、NEV-Diffusionは圧縮して、統一されたニューラルネットワークとしてビデオを生成する。
論文 参考訳(メタデータ) (2025-09-29T06:53:08Z) - NERV++: An Enhanced Implicit Neural Video Representation [11.25130799452367]
強調された暗黙的ニューラルビデオ表現であるNeRV++のニューラル表現を導入する。
NeRV++は、オリジナルのNeRVデコーダアーキテクチャよりも単純だが効果的な拡張である。
提案手法をUVG,MCL JVC,Bunnyのデータセット上で評価し,INRによる映像圧縮の競合性を実現する。
論文 参考訳(メタデータ) (2024-02-28T13:00:32Z) - Boosting Neural Representations for Videos with a Conditional Decoder [28.073607937396552]
Inlicit Neural representations (INRs) は、ビデオストレージと処理において有望なアプローチとして登場した。
本稿では,現在の暗黙的ビデオ表現手法のための普遍的なブースティングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T08:32:19Z) - Progressive Fourier Neural Representation for Sequential Video
Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。
本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。
我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文 参考訳(メタデータ) (2023-06-20T06:02:19Z) - DNeRV: Modeling Inherent Dynamics via Difference Neural Representation
for Videos [53.077189668346705]
映像の差分表現(eRV)
我々はこれを制限関数の適合性とフレーム差の重要性の観点から分析する。
DNeRVは最先端のニューラル圧縮アプローチと競合する結果を得る。
論文 参考訳(メタデータ) (2023-04-13T13:53:49Z) - HNeRV: A Hybrid Neural Representation for Videos [56.492309149698606]
暗黙の神経表現は、動画をニューラルネットワークとして保存する。
ビデオ用ハイブリッドニューラル表現法(HNeRV)を提案する。
コンテンツ適応型埋め込みと再設計アーキテクチャにより、HNeRVはビデオレグレッションタスクにおいて暗黙のメソッドよりも優れる。
論文 参考訳(メタデータ) (2023-04-05T17:55:04Z) - Towards Scalable Neural Representation for Diverse Videos [68.73612099741956]
Inlicit Neural representations (INR)は、3Dシーンや画像の表現において注目を集めている。
既存のINRベースの手法は、冗長な視覚コンテンツを持つ短いビデオの符号化に限られている。
本稿では,多種多様な視覚コンテンツを持つ長編・多作ビデオの符号化のためのニューラル表現の開発に焦点をあてる。
論文 参考訳(メタデータ) (2023-03-24T16:32:19Z) - FFNeRV: Flow-Guided Frame-Wise Neural Representations for Videos [5.958701846880935]
ビデオ中のフレーム間の時間的冗長性を利用するために,フロー情報をフレームワイズ表現に組み込む新しい手法であるFFNeRVを提案する。
モデル圧縮技術により、FFNeRVは広く使われている標準ビデオコーデック(H.264とHEVC)より優れ、最先端のビデオ圧縮アルゴリズムと同等に動作する。
論文 参考訳(メタデータ) (2022-12-23T12:51:42Z) - Scalable Neural Video Representations with Learnable Positional Features [73.51591757726493]
我々は,学習可能な位置特徴(NVP)を用いて,映像を潜時符号として効果的に再生するニューラル表現の訓練方法を示す。
一般的なUVGベンチマークにおけるNVPの優位性を実証し,先行技術と比較して,NVPは2倍の速度(5分以内)で走行するだけでなく,符号化品質も34.07rightarrow$34.57(PSNR測定値で測定)に上回っている。
論文 参考訳(メタデータ) (2022-10-13T08:15:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。