論文の概要: BASED: Benchmarking, Analysis, and Structural Estimation of Deblurring
- arxiv url: http://arxiv.org/abs/2305.17477v1
- Date: Sat, 27 May 2023 13:47:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 18:55:59.172491
- Title: BASED: Benchmarking, Analysis, and Structural Estimation of Deblurring
- Title(参考訳): BASED:デブロアリングのベンチマーク、分析、構造推定
- Authors: Nikita Alutis, Egor Chistov, Mikhail Dremin, Dmitriy Vatolin
- Abstract要約: 我々はビームスプリッタを用いた新しいモーションブルーデータセットを作成する。
我々は、メートル法開発を支援するために、2つの大きな主観的比較を行う。
結果、GTフレームは必要とせず、ぼかしの主観的人間の知覚とよく相関する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper discusses the challenges of evaluating deblurring-methods quality
and proposes a reduced-reference metric based on machine learning. Traditional
quality-assessment metrics such as PSNR and SSIM are common for this task, but
not only do they correlate poorly with subjective assessments, they also
require ground-truth (GT) frames, which can be difficult to obtain in the case
of deblurring. To develop and evaluate our metric, we created a new motion-blur
dataset using a beam splitter. The setup captured various motion types using a
static camera, as most scenes in existing datasets include blur due to camera
motion. We also conducted two large subjective comparisons to aid in metric
development. Our resulting metric requires no GT frames, and it correlates well
with subjective human perception of blur.
- Abstract(参考訳): 本稿では,デブラリング手法の品質評価の課題について考察し,機械学習に基づく基準の削減を提案する。
PSNRやSSIMのような従来の品質評価指標は、このタスクには一般的なものであるが、主観的な評価と相関するだけでなく、デブロアの場合は入手が困難であるグラウンド・トゥルース(GT)フレームも必要である。
測定値の開発と評価のために,ビームスプリッタを用いた新しいモーションブラインドデータセットを開発した。
既存のデータセットのほとんどのシーンは、カメラの動きによるぼやけを含むため、スタティックカメラを使用して様々なモーションタイプをキャプチャした。
また,メートル法開発支援のための主観的比較を2回行った。
結果、GTフレームは必要とせず、ぼかしの主観的人間の知覚とよく相関する。
関連論文リスト
- AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance [0.562479170374811]
Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文 参考訳(メタデータ) (2024-01-03T21:24:44Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - The Drunkard's Odometry: Estimating Camera Motion in Deforming Scenes [79.00228778543553]
このデータセットは、3Dシーンの中で地上の真実を語る最初の大規模なカメラ軌道である。
リアルな3Dビルディングのシミュレーションでは、膨大な量のデータと地上の真実のラベルが得られます。
本稿では,光学的フロー推定を剛体カメラ運動に分解するDrunkard's Odometryと呼ばれる,変形可能な新しいオドメトリー法を提案する。
論文 参考訳(メタデータ) (2023-06-29T13:09:31Z) - TAP-Vid: A Benchmark for Tracking Any Point in a Video [84.94877216665793]
我々は、より長いビデオクリップで表面上の任意の物理点を追跡するという問題を定式化し、任意の点(TAP)を追尾する。
そこで本研究では,実世界の映像に正確な点線アノテーションを付加したTAP-Vidと,完全な接地木線トラックを付加した合成ビデオとを併用したベンチマーク,TAP-Vidを提案する。
本稿では, 簡易な終端点追跡モデルTAP-Netを提案する。
論文 参考訳(メタデータ) (2022-11-07T17:57:02Z) - HVC-Net: Unifying Homography, Visibility, and Confidence Learning for
Planar Object Tracking [5.236567998857959]
我々は、ホモグラフィ、可視性、信頼性を共同で検討する統合畳み込みニューラルネットワーク(CNN)モデルを提案する。
提案手法は,パブリックPOTおよびTMTデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2022-09-19T11:11:56Z) - ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving
Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。
不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。
MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文 参考訳(メタデータ) (2022-07-19T09:19:45Z) - Adaptive Poincar\'e Point to Set Distance for Few-Shot Classification [30.84627437310717]
我々は,学習した集合に関連付けられた点と集合の間の距離を特徴付けるために,文脈対応の双曲的計量を学習する。
実験によって,このような測定値が外接点の存在下で得られることが示され,ベースラインモデルよりも明確な改善が達成される。
論文 参考訳(メタデータ) (2021-12-03T05:08:11Z) - MC-Blur: A Comprehensive Benchmark for Image Deblurring [127.6301230023318]
ほとんどの実世界の画像では、ブラーは動きやデフォーカスなど様々な要因によって引き起こされる。
我々は,MC-Blurと呼ばれる大規模マルチライク画像デブロアリングデータセットを新たに構築する。
MC-Blurデータセットに基づいて,異なるシナリオにおけるSOTA法の比較を行う。
論文 参考訳(メタデータ) (2021-12-01T02:10:42Z) - How to cheat with metrics in single-image HDR reconstruction [19.361293438802264]
近年, 深層学習に適した問題として, シングルイメージハイダイナミックレンジ (SI-The) 再構成が登場している。
本稿では、客観的な測定値の改善が、必ずしも視覚的に優れた画像に変換されるとは限らないことを強調する。
これらの結果が知覚された品質を表わさないこと、SI-再構成がより良い評価プロトコルを必要とすることを示します。
論文 参考訳(メタデータ) (2021-08-19T14:29:15Z) - Benchmarking Unsupervised Object Representations for Video Sequences [111.81492107649889]
ViMON, OP3, TBA, SCALORの4つのオブジェクト中心アプローチの知覚能力を比較した。
この結果から,制約のない潜在表現を持つアーキテクチャは,オブジェクト検出やセグメンテーション,トラッキングといった観点から,より強力な表現を学習できる可能性が示唆された。
我々のベンチマークは、より堅牢なオブジェクト中心のビデオ表現を学習するための実りあるガイダンスを提供するかもしれない。
論文 参考訳(メタデータ) (2020-06-12T09:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。