論文の概要: CatSIM: A Categorical Image Similarity Metric
- arxiv url: http://arxiv.org/abs/2004.09073v1
- Date: Mon, 20 Apr 2020 06:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 17:36:04.147311
- Title: CatSIM: A Categorical Image Similarity Metric
- Title(参考訳): CatSIM:カテゴリー的な画像類似性指標
- Authors: Geoffrey Z. Thompson and Ranjan Maitra
- Abstract要約: CatSIMは2次元・2次元・3次元画像とボリュームの新しい類似度指標である。
人工データセット、画像品質評価サーベイおよび2つの画像アプリケーションで評価する。
- 参考スコア(独自算出の注目度): 8.528384027684194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce CatSIM, a new similarity metric for binary and multinary two-
and three-dimensional images and volumes. CatSIM uses a structural similarity
image quality paradigm and is robust to small perturbations in location so that
structures in similar, but not entirely overlapping, regions of two images are
rated higher than using simple matching. The metric can also compare arbitrary
regions inside images. CatSIM is evaluated on artificial data sets, image
quality assessment surveys and two imaging applications
- Abstract(参考訳): 2次元および2次元および3次元画像とボリュームのための新しい類似度指標catsimを紹介する。
catsimは構造的類似性(structure similarity)のイメージ品質パラダイムを使用しており、位置の小さな摂動に頑健であるため、2つの画像の領域は単純なマッチングよりも高い評価を受けている。
メトリックは画像内の任意の領域を比較することもできる。
CatSIMは、人工データセット、画像品質評価サーベイおよび2つのイメージングアプリケーションで評価される
関連論文リスト
- CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment [2.3874115898130865]
画像類似度メトリクスは、画像処理、コンピュータビジョン、機械学習で使用されるため、コンピュータビジョンアプリケーションにおいて重要な役割を果たす。
PSNR、MSE、SSIM、ISSM、FSIMといった既存のメトリクスは、画像の小さな変更に対する速度、複雑さ、感度のいずれにおいても制限に直面していることが多い。
本稿では,画像の微妙な変化に敏感でありながらリアルタイムに組み合わせた新しい画像類似度指標CSIMについて検討する。
論文 参考訳(メタデータ) (2024-10-02T10:46:05Z) - Doppelgangers: Learning to Disambiguate Images of Similar Structures [76.61267007774089]
幻像マッチングは、人間が区別することは困難であり、3D再構成アルゴリズムに誤った結果をもたらす可能性がある。
本稿では,視覚的曖昧化に対する学習に基づくアプローチを提案し,イメージペア上でのバイナリ分類タスクとして定式化する。
本手法は, 難易度の高い画像の一致を識別し, SfMパイプラインに統合することにより, 正確な3次元再構成を実現できることを示す。
論文 参考訳(メタデータ) (2023-09-05T17:50:36Z) - Integrating Visual and Semantic Similarity Using Hierarchies for Image
Retrieval [0.46040036610482665]
視覚的階層構造を用いて視覚的および意味的類似性の両方をキャプチャするCBIRの手法を提案する。
階層構造は、分類のために訓練されたディープニューラルネットワークの潜在空間に重複する特徴を持つクラスをマージすることによって構築される。
本手法は,既存の画像検索手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-08-16T15:23:14Z) - Siamese Image Modeling for Self-Supervised Vision Representation
Learning [73.78790119050056]
自己教師付き学習(SSL)は、さまざまな下流視覚タスクにおいて優れたパフォーマンスを提供している。
2つのメインストリームSSLフレームワーク、すなわちインスタンス識別(ID)とマスク画像モデリング(MIM)が提案されている。
本稿では,拡張ビューの濃密な表現を予測できるSiamese Image Modeling (SIM)を提案する。
論文 参考訳(メタデータ) (2022-06-02T17:59:58Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Two-stream Hierarchical Similarity Reasoning for Image-text Matching [66.43071159630006]
文脈情報を自動的に抽出する階層的類似性推論モジュールを提案する。
従来のアプローチでは、シングルストリームの類似性アライメントを学習することしか検討されていなかった。
イメージ・ツー・テキスト・レベルの類似性計算とテキスト・ツー・テキスト・レベルの類似性計算に画像・テキストマッチングを分解する2ストリームアーキテクチャを開発した。
論文 参考訳(メタデータ) (2022-03-10T12:56:10Z) - DSSIM: a structural similarity index for floating-point data [68.8204255655161]
我々は、データSSIM(DSSIM)と呼ばれる浮動小数点データに直接適用可能な、人気のあるSSIMの代替案を提案する。
DSSIMは,大量のシミュレーションデータに対する圧縮損失による差分評価の文脈において有用性を示す一方で,シミュレーションや画像データを含む他の多くのアプリケーションにおいて有用であることを示す。
論文 参考訳(メタデータ) (2022-02-05T19:18:33Z) - Predicting Visual Overlap of Images Through Interpretable Non-Metric Box
Embeddings [29.412748394892105]
本稿では,大規模空間における探索を本質的に検索に削減する,解釈可能な画像埋め込みを提案する。
この埋め込みによって、よりシンプルで、高速で、人間によって解釈可能な画像マッチング結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-13T10:01:07Z) - Determining Image similarity with Quasi-Euclidean Metric [0.0]
擬似ユークリッド計量を画像類似度尺度として評価し,SSIMやユークリッド計量といった既存の標準手法とどのように一致しているかを分析する。
いくつかのケースでは、我々の方法論は顕著な性能を予測しており、我々の実装が類似性を認識するための一歩であることを証明していることも興味深い。
論文 参考訳(メタデータ) (2020-06-25T18:12:21Z) - Image Quality Assessment: Unifying Structure and Texture Similarity [38.05659069533254]
テクスチャリサンプリングに対する耐性を明示した,最初のフル参照画像品質モデルを開発した。
畳み込みニューラルネットワークを用いて、画像をオーバーコンプリート表現に変換するインジェクティブで微分可能な関数を構築する。
論文 参考訳(メタデータ) (2020-04-16T16:11:46Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。