論文の概要: A New Real-World Video Dataset for the Comparison of Defogging
Algorithms
- arxiv url: http://arxiv.org/abs/2310.01020v1
- Date: Mon, 2 Oct 2023 09:12:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 22:42:26.743681
- Title: A New Real-World Video Dataset for the Comparison of Defogging
Algorithms
- Title(参考訳): デファジグアルゴリズムの比較のための新しい実世界のビデオデータセット
- Authors: Alexandra Duminil, Jean-Philippe Tarel, Roland Br\'emond
- Abstract要約: 我々は, 霧の密度や地底の真実を無霧で比較するために, 新たなReal-world VIdeoデータセットを提案する。
ビデオデフォッギングアルゴリズムも言及されており、時間的冗長性を利用してアーチファクトを最小化し、フレーム間の露出変動を最小化するというキーアイデアがある。
様々なアプリケーションのためのディープラーニングにおけるTransformersアーキテクチャの成功に触発されて、ニューラルネットワークでこの種のアーキテクチャを選択し、提案したデータセットの関連性を示す。
- 参考スコア(独自算出の注目度): 45.023332704223755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video restoration for noise removal, deblurring or super-resolution is
attracting more and more attention in the fields of image processing and
computer vision. Works on video restoration with data-driven approaches for fog
removal are rare however, due to the lack of datasets containing videos in both
clear and foggy conditions which are required for deep learning and
benchmarking. A new dataset, called REVIDE, was recently proposed for just that
purpose. In this paper, we implement the same approach by proposing a new
REal-world VIdeo dataset for the comparison of Defogging Algorithms (VIREDA),
with various fog densities and ground truths without fog. This small database
can serve as a test base for defogging algorithms. A video defogging algorithm
is also mentioned (still under development), with the key idea of using
temporal redundancy to minimize artefacts and exposure variations between
frames. Inspired by the success of Transformers architecture in deep learning
for various applications, we select this kind of architecture in a neural
network to show the relevance of the proposed dataset.
- Abstract(参考訳): 画像処理やコンピュータビジョンの分野では、ノイズ除去、劣化、超解像のためのビデオ修復がますます注目を集めている。
霧除去のためのデータ駆動アプローチによるビデオ復元作業は、深層学習やベンチマークに必要なクリア条件と霧条件の両方でビデオを含むデータセットが不足していることから、まれである。
この目的のために、REVIDEと呼ばれる新しいデータセットが最近提案された。
本稿では,異なる霧密度とグラウンド真理を霧無しで比較するための新しい実世界ビデオデータセットを提案することにより,同様のアプローチを実現する。
この小さなデータベースは、アルゴリズムを除外するためのテストベースとして機能する。
フレーム間のアーティファクトや露出の変動を最小限に抑えるために、時間的冗長性を使うという重要なアイデアと共に、ビデオデオグジングアルゴリズム(まだ開発中)も言及されている。
様々なアプリケーションのためのディープラーニングにおけるTransformersアーキテクチャの成功に触発されて、ニューラルネットワークでこの種のアーキテクチャを選択し、提案したデータセットの関連性を示す。
関連論文リスト
- BVI-RLV: A Fully Registered Dataset and Benchmarks for Low-Light Video Enhancement [56.97766265018334]
本稿では,2つの異なる低照度条件下での様々な動きシナリオを持つ40のシーンからなる低照度映像データセットを提案する。
我々は、プログラム可能なモータードリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供し、異なる光レベルにわたるピクセルワイドフレームアライメントのための画像ベースアプローチによりそれを洗練する。
実験の結果,Low-light Video enhancement (LLVE) における完全登録ビデオペアの重要性が示された。
論文 参考訳(メタデータ) (2024-07-03T22:41:49Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - A Simple Baseline for Video Restoration with Grouped Spatial-temporal
Shift [36.71578909392314]
本研究では,ビデオ復元のための簡易かつ効果的なフレームワークを提案する。
我々のアプローチは、軽量で簡単な手法であるグループ化された時空間シフトに基づいている。
我々のフレームワークは従来の最先端手法よりも優れており、計算コストの4分の1以下である。
論文 参考訳(メタデータ) (2022-06-22T02:16:47Z) - Deep Recurrent Neural Network with Multi-scale Bi-directional
Propagation for Video Deblurring [36.94523101375519]
本稿では,RNN-MBP(Multiscale Bi-directional Propagation)を用いたディープリカレントニューラルネットワークを提案する。
提案したアルゴリズムと既存の最先端の手法を現実世界のぼやけたシーンでよりよく評価するために、リアルワールドのぼやけたビデオデータセットも作成する。
提案アルゴリズムは3つの典型的なベンチマークにおける最先端の手法に対して良好に動作する。
論文 参考訳(メタデータ) (2021-12-09T11:02:56Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - rSVDdpd: A Robust Scalable Video Surveillance Background Modelling
Algorithm [13.535770763481905]
本稿では,新しいロバストな特異値分解手法rSVDdpdに基づくビデオ監視背景モデリングアルゴリズムを提案する。
また,提案アルゴリズムは,カメラの改ざんの有無で,ベンチマークデータセットとリアルタイムビデオ監視データセットに優越することを示した。
論文 参考訳(メタデータ) (2021-09-22T12:20:44Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - Multiple Instance-Based Video Anomaly Detection using Deep Temporal
Encoding-Decoding [5.255783459833821]
本稿では,監視ビデオにおける異常検出のための時間的深部符号化復号化手法を提案する。
提案手法はトレーニング期間中に異常ビデオクリップと正常ビデオクリップの両方を使用する。
提案手法は,ビデオ監視アプリケーションにおける異常検出の最先端ソリューションと同等かそれ以上に動作することを示す。
論文 参考訳(メタデータ) (2020-07-03T08:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。