論文の概要: A New Real-World Video Dataset for the Comparison of Defogging
Algorithms
- arxiv url: http://arxiv.org/abs/2310.01020v1
- Date: Mon, 2 Oct 2023 09:12:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 22:42:26.743681
- Title: A New Real-World Video Dataset for the Comparison of Defogging
Algorithms
- Title(参考訳): デファジグアルゴリズムの比較のための新しい実世界のビデオデータセット
- Authors: Alexandra Duminil, Jean-Philippe Tarel, Roland Br\'emond
- Abstract要約: 我々は, 霧の密度や地底の真実を無霧で比較するために, 新たなReal-world VIdeoデータセットを提案する。
ビデオデフォッギングアルゴリズムも言及されており、時間的冗長性を利用してアーチファクトを最小化し、フレーム間の露出変動を最小化するというキーアイデアがある。
様々なアプリケーションのためのディープラーニングにおけるTransformersアーキテクチャの成功に触発されて、ニューラルネットワークでこの種のアーキテクチャを選択し、提案したデータセットの関連性を示す。
- 参考スコア(独自算出の注目度): 45.023332704223755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video restoration for noise removal, deblurring or super-resolution is
attracting more and more attention in the fields of image processing and
computer vision. Works on video restoration with data-driven approaches for fog
removal are rare however, due to the lack of datasets containing videos in both
clear and foggy conditions which are required for deep learning and
benchmarking. A new dataset, called REVIDE, was recently proposed for just that
purpose. In this paper, we implement the same approach by proposing a new
REal-world VIdeo dataset for the comparison of Defogging Algorithms (VIREDA),
with various fog densities and ground truths without fog. This small database
can serve as a test base for defogging algorithms. A video defogging algorithm
is also mentioned (still under development), with the key idea of using
temporal redundancy to minimize artefacts and exposure variations between
frames. Inspired by the success of Transformers architecture in deep learning
for various applications, we select this kind of architecture in a neural
network to show the relevance of the proposed dataset.
- Abstract(参考訳): 画像処理やコンピュータビジョンの分野では、ノイズ除去、劣化、超解像のためのビデオ修復がますます注目を集めている。
霧除去のためのデータ駆動アプローチによるビデオ復元作業は、深層学習やベンチマークに必要なクリア条件と霧条件の両方でビデオを含むデータセットが不足していることから、まれである。
この目的のために、REVIDEと呼ばれる新しいデータセットが最近提案された。
本稿では,異なる霧密度とグラウンド真理を霧無しで比較するための新しい実世界ビデオデータセットを提案することにより,同様のアプローチを実現する。
この小さなデータベースは、アルゴリズムを除外するためのテストベースとして機能する。
フレーム間のアーティファクトや露出の変動を最小限に抑えるために、時間的冗長性を使うという重要なアイデアと共に、ビデオデオグジングアルゴリズム(まだ開発中)も言及されている。
様々なアプリケーションのためのディープラーニングにおけるTransformersアーキテクチャの成功に触発されて、ニューラルネットワークでこの種のアーキテクチャを選択し、提案したデータセットの関連性を示す。
関連論文リスト
- Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Progressive Fourier Neural Representation for Sequential Video
Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。
本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。
我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文 参考訳(メタデータ) (2023-06-20T06:02:19Z) - PhysBench: A Benchmark Framework for rPPG with a New Dataset and
Baseline [8.857250526608954]
顔画像から生理的信号を回復するための、完全かつ効率的なエンドツーエンドトレーニングおよびテストフレームワークを提案する。
データセットには、58人の被験者による32時間(3.53Mフレーム)のビデオが含まれている。
論文 参考訳(メタデータ) (2023-05-07T02:26:00Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - A Simple Baseline for Video Restoration with Grouped Spatial-temporal
Shift [36.71578909392314]
本研究では,ビデオ復元のための簡易かつ効果的なフレームワークを提案する。
我々のアプローチは、軽量で簡単な手法であるグループ化された時空間シフトに基づいている。
我々のフレームワークは従来の最先端手法よりも優れており、計算コストの4分の1以下である。
論文 参考訳(メタデータ) (2022-06-22T02:16:47Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - rSVDdpd: A Robust Scalable Video Surveillance Background Modelling
Algorithm [13.535770763481905]
本稿では,新しいロバストな特異値分解手法rSVDdpdに基づくビデオ監視背景モデリングアルゴリズムを提案する。
また,提案アルゴリズムは,カメラの改ざんの有無で,ベンチマークデータセットとリアルタイムビデオ監視データセットに優越することを示した。
論文 参考訳(メタデータ) (2021-09-22T12:20:44Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - Multiple Instance-Based Video Anomaly Detection using Deep Temporal
Encoding-Decoding [5.255783459833821]
本稿では,監視ビデオにおける異常検出のための時間的深部符号化復号化手法を提案する。
提案手法はトレーニング期間中に異常ビデオクリップと正常ビデオクリップの両方を使用する。
提案手法は,ビデオ監視アプリケーションにおける異常検出の最先端ソリューションと同等かそれ以上に動作することを示す。
論文 参考訳(メタデータ) (2020-07-03T08:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。