論文の概要: Progressive Deep Video Dehazing without Explicit Alignment Estimation
- arxiv url: http://arxiv.org/abs/2107.07837v1
- Date: Fri, 16 Jul 2021 11:57:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-19 19:24:35.743189
- Title: Progressive Deep Video Dehazing without Explicit Alignment Estimation
- Title(参考訳): 明示的なアライメント推定を伴わないプログレッシブディープビデオデハジング
- Authors: Runde Li
- Abstract要約: ビデオデハジングのためのプログレッシブアライメントと復元法を提案する。
このアライメントプロセスは、光フロー推定を使わずに、連続した隣接するフレームをステージごとにアライメントする。
復元プロセスはアライメントプロセス下で実施されるだけでなく、改良ネットワークを使用してネットワーク全体の脱ハージング性能を向上させる。
- 参考スコア(独自算出の注目度): 2.766648389933265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To solve the issue of video dehazing, there are two main tasks to attain: how
to align adjacent frames to the reference frame; how to restore the reference
frame. Some papers adopt explicit approaches (e.g., the Markov random field,
optical flow, deformable convolution, 3D convolution) to align neighboring
frames with the reference frame in feature space or image space, they then use
various restoration methods to achieve the final dehazing results. In this
paper, we propose a progressive alignment and restoration method for video
dehazing. The alignment process aligns consecutive neighboring frames stage by
stage without using the optical flow estimation. The restoration process is not
only implemented under the alignment process but also uses a refinement network
to improve the dehazing performance of the whole network. The proposed networks
include four fusion networks and one refinement network. To decrease the
parameters of networks, three fusion networks in the first fusion stage share
the same parameters. Extensive experiments demonstrate that the proposed video
dehazing method achieves outstanding performance against the-state-of-art
methods.
- Abstract(参考訳): ビデオデハージングの問題を解決するために、隣接するフレームを基準フレームに合わせる方法、参照フレームを復元する方法の2つの主要なタスクが達成される。
一部の論文では、マルコフランダム場、光学フロー、変形可能な畳み込み、3D畳み込みといった明示的なアプローチを採用して、特徴空間や画像空間における参照フレームと隣り合うフレームを整列させ、最終的な退化結果を達成するために様々な復元手法を用いる。
本稿では,ビデオデハージングのための進行的アライメントと復元手法を提案する。
このアライメントプロセスは、光フロー推定を使わずに連続する隣接フレームステージを段階的に整列する。
復元プロセスはアライメントプロセス下で実施されるだけでなく、改良ネットワークを使用してネットワーク全体の脱ハージング性能を向上させる。
提案ネットワークは4つの融合ネットワークと1つの改良ネットワークを含む。
ネットワークのパラメータを減らすために、第1の融合段階における3つの融合ネットワークは同じパラメータを共有する。
広汎な実験により,提案手法は最先端の手法に対して優れた性能を発揮することが示された。
関連論文リスト
- Optical-Flow Guided Prompt Optimization for Coherent Video Generation [51.430833518070145]
我々は,光フローによる映像生成プロセスをガイドするMotionPromptというフレームワークを提案する。
ランダムフレーム対に適用した訓練された識別器の勾配を用いて,逆サンプリングステップにおける学習可能なトークン埋め込みを最適化する。
提案手法により,生成したコンテンツの忠実さを損なうことなく,自然な動きのダイナミクスを忠実に反映した視覚的コヒーレントな映像シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-11-23T12:26:52Z) - Motion-Aware Video Frame Interpolation [49.49668436390514]
我々は、連続するフレームから中間光の流れを直接推定する動き対応ビデオフレーム補間(MA-VFI)ネットワークを導入する。
受容場が異なる入力フレームからグローバルな意味関係と空間的詳細を抽出するだけでなく、必要な計算コストと複雑さを効果的に削減する。
論文 参考訳(メタデータ) (2024-02-05T11:00:14Z) - Training-Free Semantic Video Composition via Pre-trained Diffusion Model [96.0168609879295]
現在のアプローチは、主に前景の色と照明を調整したビデオで訓練されており、表面的な調整以上の深い意味の相違に対処するのに苦労している。
本研究では,事前知識を付加した事前学習拡散モデルを用いた学習自由パイプラインを提案する。
実験の結果,我々のパイプラインは出力の視覚的調和とフレーム間のコヒーレンスを確実にすることがわかった。
論文 参考訳(メタデータ) (2024-01-17T13:07:22Z) - Meta-Auxiliary Network for 3D GAN Inversion [18.777352198191004]
本稿では,新たに開発された3D GANをジェネレータとして利用しながら,新しいメタ補助フレームワークを提案する。
最初の段階では、オフザシェルフインバージョン技術を用いて、入力画像を編集可能な潜在コードに変換する。
補助的ネットワークは、与えられた画像を入力としてジェネレータパラメータを洗練し、畳み込み層の重み付けとボリュームレンダリングのサンプリング位置のオフセットを予測する。
第2段階では、入力された画像に補助ネットワークを高速に適応させるメタラーニングを行い、その後、メタラーニングされた補助ネットワークを介して最終再構成画像を合成する。
論文 参考訳(メタデータ) (2023-05-18T11:26:27Z) - TimeLens: Event-based Video Frame Interpolation [54.28139783383213]
本稿では,合成法とフロー法の両方の利点を生かした,等価寄与法であるTime Lensを紹介する。
最先端のフレームベースおよびイベントベース手法よりもPSNRが最大5.21dB向上したことを示す。
論文 参考訳(メタデータ) (2021-06-14T10:33:47Z) - EA-Net: Edge-Aware Network for Flow-based Video Frame Interpolation [101.75999290175412]
補間フレーム内のエッジを保存することにより,画像のぼかしを低減し,オブジェクトの明確な形状を得る。
提案するエッジアウェアネットワーク(eanet)は、エッジ情報をフレームタスクに統合する。
フローマップの推定において,フレームエッジを強調する3つのエッジアウェア機構が開発されている。
論文 参考訳(メタデータ) (2021-05-17T08:44:34Z) - FDAN: Flow-guided Deformable Alignment Network for Video
Super-Resolution [12.844337773258678]
変形可能なコンボリューションに光流を統合するために,フロー誘導変形モジュール (FDM) を提案する。
FDANは、2つのベンチマークデータセットで最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2021-05-12T13:18:36Z) - Video Frame Interpolation via Structure-Motion based Iterative Fusion [19.499969588931414]
映像フレーム補間のための構造運動に基づく反復融合法を提案する。
観客が前景や背景の物体に対して異なる視覚的嗜好を持つという観察に触発されて,私たちは初めて,映像フレーム補間作業の評価プロセスにサリエンシマスクを使うことを提案する。
論文 参考訳(メタデータ) (2021-05-11T22:11:17Z) - Restoration of Video Frames from a Single Blurred Image with Motion
Understanding [69.90724075337194]
単一モーション赤画像からクリーンな映像フレームを生成するための新しいフレームワークを提案する。
一つのぼやけた画像からの映像復元を逆問題として、クリーンな画像シーケンスとそれぞれの動きを潜伏要因として設定する。
提案手法は,空間トランスフォーマネットワークモジュールを用いたanblur-decoder構造に基づいている。
論文 参考訳(メタデータ) (2021-04-19T08:32:57Z) - Multi-Stage Raw Video Denoising with Adversarial Loss and Gradient Mask [14.265454188161819]
低照度下で撮影した生映像を消音する学習型手法を提案する。
まず、畳み込みニューラルネットワーク(CNN)を用いて、隣接するフレームを現在のフレームに明示的にアライメントする。
次に、登録されたフレームを別のCNNを使って融合し、最終識別フレームを得る。
論文 参考訳(メタデータ) (2021-03-04T06:57:48Z) - FineNet: Frame Interpolation and Enhancement for Face Video Deblurring [18.49184807837449]
この作品の目的は、顔のビデオを破壊することです。
本稿では,(1)ぼやけたフレームの強化,(2)ぼやけたフレームを欠落した値として扱い,目的によって見積もる方法を提案する。
3つの実および合成ビデオデータセットを用いた実験により,本手法が従来の最先端手法よりも定量的および質的結果において大きな差を示した。
論文 参考訳(メタデータ) (2021-03-01T09:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。