論文の概要: Identifying and Mitigating Flaws of Deep Perceptual Similarity Metrics
- arxiv url: http://arxiv.org/abs/2207.02512v1
- Date: Wed, 6 Jul 2022 08:28:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 13:56:34.002483
- Title: Identifying and Mitigating Flaws of Deep Perceptual Similarity Metrics
- Title(参考訳): 深い知覚的類似度指標の欠陥の同定と軽減
- Authors: Oskar Sj\"ogren, Gustav Grund Pihlgren, Fredrik Sandin, Marcus Liwicki
- Abstract要約: 本研究は,Deep Perceptual similarity(DPS)メトリクスの利点と欠点について考察する。
メトリクスは、メトリクスの長所と短所を理解するために、詳細に分析されます。
この研究は、DPSの欠陥に関する新たな洞察に寄与し、さらにメトリクスの改善を提案する。
- 参考スコア(独自算出の注目度): 1.484528358552186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Measuring the similarity of images is a fundamental problem to computer
vision for which no universal solution exists. While simple metrics such as the
pixel-wise L2-norm have been shown to have significant flaws, they remain
popular. One group of recent state-of-the-art metrics that mitigates some of
those flaws are Deep Perceptual Similarity (DPS) metrics, where the similarity
is evaluated as the distance in the deep features of neural networks. However,
DPS metrics themselves have been less thoroughly examined for their benefits
and, especially, their flaws. This work investigates the most common DPS
metric, where deep features are compared by spatial position, along with
metrics comparing the averaged and sorted deep features. The metrics are
analyzed in-depth to understand the strengths and weaknesses of the metrics by
using images designed specifically to challenge them. This work contributes
with new insights into the flaws of DPS, and further suggests improvements to
the metrics. An implementation of this work is available online:
https://github.com/guspih/deep_perceptual_similarity_analysis/
- Abstract(参考訳): 画像の類似性を測定することは、普遍的な解決策が存在しないコンピュータビジョンの根本的な問題である。
ピクセル単位のl2ノルムのような単純な指標は重大な欠陥があることが示されているが、依然として人気がある。
これらの欠陥のいくつかを緩和する最近の最先端メトリクスの1つがDeep Perceptual similarity(DPS)メトリクスであり、類似性はニューラルネットワークの深い特徴の距離として評価されている。
しかし、DPSメトリクス自体は、その利点、特にその欠陥について徹底的に調べられていない。
本研究は,深部特徴を空間的位置で比較する最も一般的なdps指標と,平均的特徴と分類された深部特徴を比較する指標について検討する。
メトリクスは、それらに挑戦するために特別に設計されたイメージを使用することで、メトリクスの強みと弱みを理解するために、詳細に分析されます。
この研究は、DPSの欠陥に関する新たな洞察に寄与し、さらにメトリクスの改善を提案する。
この実装はhttps://github.com/guspih/deep_perceptual_ similarity_ analysis/という形で公開されている。
関連論文リスト
- Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-05-16T03:01:06Z) - UniDepth: Universal Monocular Metric Depth Estimation [81.80512457953903]
ドメインをまたいだ単一の画像からメートル法3Dシーンを再構成できる新しいモデルUniDepthを提案する。
我々のモデルは擬似球面出力表現を利用しており、カメラと奥行きの表現を歪めている。
ゼロショット方式における10のデータセットの詳細な評価は、一貫してUniDepthの優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-27T18:06:31Z) - LipSim: A Provably Robust Perceptual Similarity Metric [56.03417732498859]
敵攻撃に対するViTベースの特徴抽出器のアンサンブルに基づく,最先端の知覚的類似度指標の脆弱性を示す。
次に、証明可能な保証とともに、LipSimと呼ばれる堅牢な知覚的類似度メトリックをトレーニングするためのフレームワークを提案する。
LipSimは、各データポイント周辺の保護された領域と、$ell$ ball内のすべての摂動の証明書を提供する。
論文 参考訳(メタデータ) (2023-10-27T16:59:51Z) - A Geometrical Approach to Evaluate the Adversarial Robustness of Deep
Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。
我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文 参考訳(メタデータ) (2023-10-10T09:39:38Z) - R-LPIPS: An Adversarially Robust Perceptual Similarity Metric [71.33812578529006]
本稿では,Robust Learned Perceptual Image Patch similarity(R-LPIPS)メトリクスを提案する。
R-LPIPSは、敵対的に訓練された深い特徴を活用する新しい指標である。
従来のLPIPSメトリックと比較して,R-LPIPSの優位性を示す。
論文 参考訳(メタデータ) (2023-07-27T19:11:31Z) - Deep Perceptual Similarity is Adaptable to Ambiguous Contexts [1.6217405839281338]
画像類似性の概念は曖昧であり、ある文脈では似ていて、別の文脈では似ていない。
この研究は、与えられたコンテキストに適応する深層知覚類似度(DPS)メトリクスの能力について考察する。
適応されたメトリクスは知覚的類似性データセットで評価され、ランキングへの適応が以前のパフォーマンスに影響するかどうかを評価する。
論文 参考訳(メタデータ) (2023-04-05T07:31:44Z) - Evaluation of FEM and MLFEM AI-explainers in Image Classification tasks
with reference-based and no-reference metrics [0.0]
画像と映像の分類タスクにおけるCNNの説明のために設計された,最近提案されたポストホック説明器 FEM と MLFEM を思い出させる。
基準ベースおよび非参照メトリクスを用いて評価を行う。
非参照計量として、Alvarez-Melis と Jaakkola によって提案された「安定」計量を用いる。
論文 参考訳(メタデータ) (2022-12-02T14:55:31Z) - Shift-tolerant Perceptual Similarity Metric [5.326626090397465]
既存の知覚的類似度指標は、画像とその参照がよく一致していると仮定する。
本稿では,入力画像と参照画像の小さなずれが既存の指標に与える影響について検討する。
我々は,新しいディープニューラルネットワークに基づく知覚的類似度測定法を開発した。
論文 参考訳(メタデータ) (2022-07-27T17:55:04Z) - Towards Interpretable Deep Metric Learning with Structural Matching [86.16700459215383]
より透過的な埋め込み学習のための深層解釈可能なメトリック学習(DIML)法を提案する。
本手法は,既製のバックボーンネットワークやメトリック学習手法に適用可能な,モデルに依存しない手法である。
我々は,CUB200-2011,Cars196,Stanford Online Productsの3つの大規模メトリクス学習ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2021-08-12T17:59:09Z) - Reliable Fidelity and Diversity Metrics for Generative Models [30.941563781926202]
Fr'echet Inception Distance (FID)スコアは、Fr'echet Inception Distance(FID)スコアである。
最新の精度とリコール基準でさえまだ信頼性が低いことを示す。
上記の問題を解決するための密度とカバレッジの指標を提案する。
論文 参考訳(メタデータ) (2020-02-23T00:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。