Fugu-MT 論文翻訳(概要): CBIR using features derived by Deep Learning

論文の概要: CBIR using features derived by Deep Learning

arxiv url: http://arxiv.org/abs/2002.07877v1
Date: Thu, 13 Feb 2020 21:26:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 09:44:57.032030
Title: CBIR using features derived by Deep Learning
Title（参考訳）: 深層学習に基づくCBIR
Authors: Subhadip Maji and Smarajit Bose
Abstract要約: CBIR(Content Based Image Retrieval)システムでは、クエリ画像が与えられた大きなデータベースから同様の画像を検索する。本稿では,大規模な画像分類問題に対して学習したディープラーニング畳み込みネットワークから,事前学習したネットワークモデルから派生した特徴を用いることを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In a Content Based Image Retrieval (CBIR) System, the task is to retrieve similar images from a large database given a query image. The usual procedure is to extract some useful features from the query image, and retrieve images which have similar set of features. For this purpose, a suitable similarity measure is chosen, and images with high similarity scores are retrieved. Naturally the choice of these features play a very important role in the success of this system, and high level features are required to reduce the semantic gap. In this paper, we propose to use features derived from pre-trained network models from a deep-learning convolution network trained for a large image classification problem. This approach appears to produce vastly superior results for a variety of databases, and it outperforms many contemporary CBIR systems. We analyse the retrieval time of the method, and also propose a pre-clustering of the database based on the above-mentioned features which yields comparable results in a much shorter time in most of the cases.
Abstract（参考訳）: CBIR(Content Based Image Retrieval)システムでは、クエリ画像が与えられた大きなデータベースから同様の画像を検索する。通常、クエリ画像からいくつかの有用な特徴を抽出し、類似した特徴セットを持つ画像を取得する。この目的のために適切な類似度尺度が選択され、類似度スコアの高い画像が検索される。当然、これらの機能の選択は、このシステムの成功において非常に重要な役割を果たす。本稿では,大規模な画像分類問題に対して学習したディープラーニング畳み込みネットワークから,事前学習ネットワークモデルから派生した特徴を利用する。このアプローチは様々なデータベースに対して非常に優れた結果をもたらし、現代のCBIRシステムよりも優れています。そこで本研究では,本手法の検索時間を解析し,上述の特徴に基づくデータベースの事前クラスタ化を提案する。

関連論文リスト

QuARI: Query Adaptive Retrieval Improvement [10.896025071832055]
本稿では, 関心領域に関連する部分空間を強調することにより, 実例検索のために訓練したVLM機能の線形変換により, 性能の向上が期待できることを示す。この変換は線形であるため、数百万の画像埋め込みに最小の計算コストで適用することができる。以上の結果から,この手法は問合せ時に桁違いに多くの命令を必要とするものなど,最先端の代替手段を一貫して上回っていることが示唆された。
論文参考訳（メタデータ） (2025-05-27T18:21:48Z)
Advancing Image Retrieval with Few-Shot Learning and Relevance Feedback [5.770351255180495]
Image Retrieval with Relevance Feedback (IRRF) は、検索プロセス中に反復的なヒューマンインタラクションを伴う。本稿では,タスクに適したハイパーネットワークに基づく新しいスキームを提案し,ユーザフィードバックの迅速な調整を容易にする。提案手法は,数発の1クラス分類でSoTAを達成でき,数発のオープンセット認識のバイナリ分類タスクで同等の結果が得られることを示す。
論文参考訳（メタデータ） (2023-12-18T10:20:28Z)
Object-Centric Open-Vocabulary Image-Retrieval with Aggregated Features [12.14013374452918]
本稿では,オブジェクト中心のオープン語彙画像検索に対して,シンプルながら効果的なアプローチを提案する。提案手法は,CLIPから抽出した濃密な埋め込みをコンパクトな表現に集約する。 3つのデータセットのグローバルな特徴的アプローチよりもはるかに優れた結果を得ることで,タスクに対する提案手法の有効性を示す。
論文参考訳（メタデータ） (2023-09-26T15:13:09Z)
Integrating Visual and Semantic Similarity Using Hierarchies for Image Retrieval [0.46040036610482665]
視覚的階層構造を用いて視覚的および意味的類似性の両方をキャプチャするCBIRの手法を提案する。階層構造は、分類のために訓練されたディープニューラルネットワークの潜在空間に重複する特徴を持つクラスをマージすることによって構築される。本手法は,既存の画像検索手法と比較して優れた性能を実現する。
論文参考訳（メタデータ） (2023-08-16T15:23:14Z)
Progressive Learning for Image Retrieval with Hybrid-Modality Queries [48.79599320198615]
ハイブリッドモダリティクエリによる画像検索(CTI-IR) 我々は、CTI-IRタスクを3段階の学習問題に分解し、ハイブリッドモダリティクエリを用いて画像検索のための複雑な知識を段階的に学習する。提案モデルは,Fashion-IQおよびShoesベンチマークデータセットにおいて,Recall@K平均の最先端手法を24.9%,9.5%向上させる。
論文参考訳（メタデータ） (2022-04-24T08:10:06Z)
Cross-Modality Sub-Image Retrieval using Contrastive Multimodal Image Representations [3.3754780158324564]
異なるモダリティによってキャプチャされた類似(または同じ)コンテンツのイメージは、共通の構造をほとんど共有しないため、モダリティ間の画像検索は困難である。本稿では,モダリティ間の逆(サブ)画像検索のためのアプリケーション非依存のコンテンツベース画像検索システムを提案する。
論文参考訳（メタデータ） (2022-01-10T19:04:28Z)
GPR1200: A Benchmark for General-Purpose Content-Based Image Retrieval [2.421459418045937]
本研究では,大規模な事前学習が検索性能を大幅に向上させることを示すとともに,適切な微調整を行うことで,これらの特性をさらに向上させる実験を行う。これらの有望な成果により、汎用CBIRの研究分野への関心を高めたい。
論文参考訳（メタデータ） (2021-11-25T15:19:21Z)
Contextual Similarity Aggregation with Self-attention for Visual Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文参考訳（メタデータ） (2021-10-26T06:20:31Z)
Cross-Modal Retrieval Augmentation for Multi-Modal Classification [61.5253261560224]
画像の非構造化外部知識源とそれに対応するキャプションを用いて視覚的質問応答を改善する。まず,画像とキャプションを同一空間に埋め込むための新しいアライメントモデルを訓練し,画像検索の大幅な改善を実現する。第2に、トレーニングされたアライメントモデルを用いた検索強化マルチモーダルトランスは、強いベースライン上でのVQAの結果を改善することを示す。
論文参考訳（メタデータ） (2021-04-16T13:27:45Z)
Saliency-driven Class Impressions for Feature Visualization of Deep Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文参考訳（メタデータ） (2020-07-31T06:11:06Z)
Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文参考訳（メタデータ） (2020-03-21T15:36:38Z)
Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文参考訳（メタデータ） (2020-03-15T11:04:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。