論文の概要: A new Image Similarity Metric for a Perceptual and Transparent Geometric and Chromatic Assessment
- arxiv url: http://arxiv.org/abs/2601.19680v1
- Date: Tue, 27 Jan 2026 14:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.358778
- Title: A new Image Similarity Metric for a Perceptual and Transparent Geometric and Chromatic Assessment
- Title(参考訳): 視覚的・透明な幾何学的・色彩的評価のための新しい画像類似度尺度
- Authors: Antonio Di Marino, Vincenzo Bevilacqua, Emanuel Di Nardo, Angelo Ciaramella, Ivanoe De Falco, Giovanna Sannino,
- Abstract要約: 2つの項からなる新しい知覚計量を提案する。
第1項は、アース・モーバーの距離を用いて、2つの画像のテクスチャの相違を評価する。
第2項はオクラブの知覚色空間における2つの画像間の色相異性を評価する。
- 参考スコア(独自算出の注目度): 0.5243318687178913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the literature, several studies have shown that state-of-the-art image similarity metrics are not perceptual metrics; moreover, they have difficulty evaluating images, especially when texture distortion is also present. In this work, we propose a new perceptual metric composed of two terms. The first term evaluates the dissimilarity between the textures of two images using Earth Mover's Distance. The second term evaluates the chromatic dissimilarity between two images in the Oklab perceptual color space. We evaluated the performance of our metric on a non-traditional dataset, called Berkeley-Adobe Perceptual Patch Similarity, which contains a wide range of complex distortions in shapes and colors. We have shown that our metric outperforms the state of the art, especially when images contain shape distortions, confirming also its greater perceptiveness. Furthermore, although deep black-box metrics could be very accurate, they only provide similarity scores between two images, without explaining their main differences and similarities. Our metric, on the other hand, provides visual explanations to support the calculated score, making the similarity assessment transparent and justified.
- Abstract(参考訳): 文献では、最先端の画像類似度指標は知覚的指標ではなく、特にテクスチャの歪みがある場合、画像の評価が難しいことが示されている。
本研究では,2つの項からなる新しい知覚計量を提案する。
第1項は、アース・モーバーの距離を用いて、2つの画像のテクスチャの相違を評価する。
第2項はオクラブの知覚色空間における2つの画像間の色相異性を評価する。
我々は、形状や色に幅広い複雑な歪みを含む、バークレー・Adobe知覚パッチ類似性(Berkeley-Adobe Perceptual Patch similarity)と呼ばれる非伝統的なデータセット上で、メトリックのパフォーマンスを評価した。
以上の結果から,画像に形状歪みがあり,その知覚性も高いことが確認できた。
さらに、深いブラックボックスのメトリクスは非常に正確であるが、2つの画像間の類似点しか示さず、主な相違点と類似点を説明できない。
一方、我々の測定基準は、計算されたスコアをサポートするための視覚的説明を提供し、類似性評価を透過的かつ正当化する。
関連論文リスト
- Relational Visual Similarity [75.39827145344957]
リレーショナルな類似性は、認知科学者によって、人間と他の種を区別するものとして論じられる。
現在広く使われている視覚的類似度指標はすべて、知覚的属性類似性のみに焦点を当てている。
我々の研究は、リレーショナルな類似性は多くの実世界のアプリケーションを持っているが、既存の画像類似性モデルはそれを捉えていないことを示している。
論文 参考訳(メタデータ) (2025-12-08T18:59:56Z) - Multiscale Sliced Wasserstein Distances as Perceptual Color Difference Measures [34.8728594246521]
マルチスケールスライスされたワッサースタイン距離に基づく知覚CD測度について述べる。
実験結果から,写真画像のCD評価においてCD測定が好適であることが示唆された。
数学的な意味では測度として機能し、画像やビデオのカラー転送タスクの損失関数としてその可能性を示す。
論文 参考訳(メタデータ) (2024-07-14T12:48:16Z) - Interpretable Measures of Conceptual Similarity by
Complexity-Constrained Descriptive Auto-Encoding [112.0878081944858]
画像間の類似度を定量化することは、画像ベースの機械学習にとって重要な著作権問題である。
我々は,高次関係を捉えた画像間での「概念的類似性」の概念を定義し,計算することを目指している。
2つの非常に異種な画像は、その記述の早い段階で識別できるが、概念的に異種な画像は、より詳細を区別する必要がある。
論文 参考訳(メタデータ) (2024-02-14T03:31:17Z) - DreamSim: Learning New Dimensions of Human Visual Similarity using
Synthetic Data [43.247597420676044]
現在の知覚的類似度メトリクスは、ピクセルとパッチのレベルで動作します。
これらのメトリクスは、低レベルの色やテクスチャの観点から画像を比較するが、画像レイアウト、オブジェクトポーズ、セマンティック内容の中間レベルの類似点や相違点をキャプチャできない。
我々は,画像の全体的評価を行う知覚的指標を開発した。
論文 参考訳(メタデータ) (2023-06-15T17:59:50Z) - Introspective Deep Metric Learning for Image Retrieval [80.29866561553483]
良好な類似性モデルは、より堅牢なトレーニングのために曖昧なイメージをよりよく扱うように注意しながら、意味的な相違を考慮すべきである、と我々は主張する。
本稿では,画像の意味的特徴とあいまいさを記述した,意味的埋め込みだけでなく,付随する不確実性埋め込みを用いて画像を表現することを提案する。
提案したIDMLフレームワークは,不確実性モデリングによるディープメトリック学習の性能向上を実現し,広く使用されているCUB-200-2011,Cars196,Stanford Online Productsデータセットの最先端結果を得る。
論文 参考訳(メタデータ) (2022-05-09T17:51:44Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。