論文の概要: PocketDVDNet: Realtime Video Denoising for Real Camera Noise
- arxiv url: http://arxiv.org/abs/2601.16780v1
- Date: Fri, 23 Jan 2026 14:27:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.721433
- Title: PocketDVDNet: Realtime Video Denoising for Real Camera Noise
- Title(参考訳): PocketDVDNet: リアルカメラのノイズをリアルタイムに再現する
- Authors: Crispian Morris, Imogen Dexter, Fan Zhang, David R. Bull, Nantheera Anantrasirichai,
- Abstract要約: モデル圧縮フレームワークを用いて開発した軽量ビデオデノイザであるPocketDVDNetを提案する。
我々は、スパーシリティを誘導し、ターゲットチャネルプルーニングを適用し、現実的なマルチコンポーネントノイズで教師を再訓練する。
PocketDVDNetは、オリジナルのモデルサイズを74%削減し、品質を劣化させ、5フレームのパッチをリアルタイムで処理する。
- 参考スコア(独自算出の注目度): 7.3429091913205164
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Live video denoising under realistic, multi-component sensor noise remains challenging for applications such as autofocus, autonomous driving, and surveillance. We propose PocketDVDNet, a lightweight video denoiser developed using our model compression framework that combines sparsity-guided structured pruning, a physics-informed noise model, and knowledge distillation to achieve high-quality restoration with reduced resource demands. Starting from a reference model, we induce sparsity, apply targeted channel pruning, and retrain a teacher on realistic multi-component noise. The student network learns implicit noise handling, eliminating the need for explicit noise-map inputs. PocketDVDNet reduces the original model size by 74% while improving denoising quality and processing 5-frame patches in real-time. These results demonstrate that aggressive compression, combined with domain-adapted distillation, can reconcile performance and efficiency for practical, real-time video denoising.
- Abstract(参考訳): オートフォーカス、自律運転、監視といったアプリケーションでは、現実的でマルチコンポーネントのセンサーノイズの下でライブ動画を飾ることは依然として困難である。
提案するPocketDVDNetは,空間性誘導型構造化プルーニングと物理インフォームドノイズモデルと知識蒸留を組み合わせた,資源需要の低減による高品質な復元を実現する軽量ビデオデノイザである。
参照モデルから、スパーシリティを誘導し、ターゲットチャネルプルーニングを適用し、現実的なマルチコンポーネントノイズで教師を再訓練する。
学生ネットワークは暗黙のノイズハンドリングを学習し、明示的なノイズマップ入力を不要にする。
PocketDVDNetは、オリジナルのモデルサイズを74%削減し、品質を劣化させ、5フレームのパッチをリアルタイムで処理する。
これらの結果から, 積極的圧縮とドメイン適応蒸留を組み合わせることで, 実時間ビデオデノイングの性能と効率を再現できることが示唆された。
関連論文リスト
- RViDeformer: Efficient Raw Video Denoising Transformer with a Larger Benchmark Dataset [15.340530514779804]
教師付き生ビデオのデノベーションのためのリアルな動きを持つ大規模なデータセットは存在しない。
ノイズクリーンな120グループからなるビデオデノケーションデータセット(ReCRVDと名づけられた)を構築した。
短距離・長距離の相関関係を探索するRViDeformer(RViDeformer)を提案する。
論文 参考訳(メタデータ) (2023-05-01T11:06:58Z) - Low Latency Video Denoising for Online Conferencing Using CNN
Architectures [4.7805617044617446]
本稿では,ランタイムコストが低く,知覚品質の高いリアルタイムビデオデノナイズのためのパイプラインを提案する。
カスタムノイズ検出器アナライザは、重みに適応し、モデルの出力を改善するためにリアルタイムフィードバックを提供する。
論文 参考訳(メタデータ) (2023-02-17T00:55:54Z) - Learning Task-Oriented Flows to Mutually Guide Feature Alignment in
Synthesized and Real Video Denoising [137.5080784570804]
Video Denoisingは、クリーンなノイズを回復するためにビデオからノイズを取り除くことを目的としている。
既存の研究によっては、近辺のフレームから追加の空間的時間的手がかりを利用することで、光学的流れがノイズ発生の助けとなることが示されている。
本稿では,様々なノイズレベルに対してより堅牢なマルチスケール光フロー誘導型ビデオデノイング法を提案する。
論文 参考訳(メタデータ) (2022-08-25T00:09:18Z) - Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware
Adversarial Training [50.018580462619425]
我々は,PNGAN(Pixel-level Noise-aware Generative Adrial Network)という新しいフレームワークを提案する。
PNGANは、トレーニング済みのリアルデノイザーを使用して、フェイク画像とリアルノイズ画像をほぼノイズのないソリューション空間にマッピングする。
より優れたノイズフィッティングを実現するため,ジェネレータとしてSimple Multi-versa-scale Network (SMNet) を提案する。
論文 参考訳(メタデータ) (2022-04-06T14:09:02Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - Neural Compression-Based Feature Learning for Video Restoration [29.021502115116736]
本稿では,映像の再生を支援するために,ノイズ・ロバストな特徴表現の学習を提案する。
ニューラル圧縮モジュールを設計し、ノイズをフィルタリングし、最も有用な情報をビデオ復元の機能として保持する。
論文 参考訳(メタデータ) (2022-03-17T09:59:26Z) - Learning Spatial and Spatio-Temporal Pixel Aggregations for Image and
Video Denoising [104.59305271099967]
ピクセル集計ネットワークを提示し、画像デノイジングのためのピクセルサンプリングと平均戦略を学びます。
時間空間にまたがるサンプル画素をビデオデノナイズするための画素集約ネットワークを開発した。
本手法は,動的シーンにおける大きな動きに起因する誤認問題を解決することができる。
論文 参考訳(メタデータ) (2021-01-26T13:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。