論文の概要: Optimized Feature Space Learning for Generating Efficient Binary Codes
for Image Retrieval
- arxiv url: http://arxiv.org/abs/2001.11400v1
- Date: Thu, 30 Jan 2020 15:30:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 12:38:01.430397
- Title: Optimized Feature Space Learning for Generating Efficient Binary Codes
for Image Retrieval
- Title(参考訳): 画像検索のための効率的なバイナリコード生成のための最適特徴空間学習
- Authors: Abin Jose, Erik Stefan Ottlik, Christian Rohlfing, Jens-Rainer Ohm
- Abstract要約: 本稿では,最小クラス内分散と最大クラス間分散を用いた低次元最適化特徴空間の学習手法を提案する。
生成した特徴ベクトルを、人気の反復量子化(ITQ)アプローチでバイナライズし、画像検索のために所望のビット長のバイナリコードを生成するアンサンブルネットワークを提案する。
- 参考スコア(独自算出の注目度): 9.470008343329892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose an approach for learning low dimensional optimized
feature space with minimum intra-class variance and maximum inter-class
variance. We address the problem of high-dimensionality of feature vectors
extracted from neural networks by taking care of the global statistics of
feature space. Classical approach of Linear Discriminant Analysis (LDA) is
generally used for generating an optimized low dimensional feature space for
single-labeled images. Since, image retrieval involves both multi-labeled and
single-labeled images, we utilize the equivalence between LDA and Canonical
Correlation Analysis (CCA) to generate an optimized feature space for
single-labeled images and use CCA to generate an optimized feature space for
multi-labeled images. Our approach correlates the projections of feature
vectors with label vectors in our CCA based network architecture. The neural
network minimize a loss function which maximizes the correlation coefficients.
We binarize our generated feature vectors with the popular Iterative
Quantization (ITQ) approach and also propose an ensemble network to generate
binary codes of desired bit length for image retrieval. Our measurement of mean
average precision shows competitive results on other state-of-the-art
single-labeled and multi-labeled image retrieval datasets.
- Abstract(参考訳): 本稿では,最小クラス内分散と最大クラス間分散を用いた低次元最適化特徴空間の学習手法を提案する。
本稿では,ニューラルネットワークから抽出した特徴ベクトルの高次元性の問題に,特徴空間のグローバル統計を手掛けて対処する。
線形判別分析(LDA)の古典的アプローチは、一般にシングルラベル画像に対して最適化された低次元特徴空間を生成するために用いられる。
そのため、LDAとCanonical correlation Analysis(CCA)の等価性を利用して、単一ラベル画像に最適化された特徴空間を生成し、CCAを用いて多ラベル画像に最適化された特徴空間を生成する。
提案手法は,CCAに基づくネットワークアーキテクチャにおいて特徴ベクトルとラベルベクトルのプロジェクションを関連付ける。
ニューラルネットワークは、相関係数を最大化する損失関数を最小化する。
生成した特徴ベクトルを、人気の反復量子化(ITQ)アプローチでバイナライズし、画像検索のために所望のビット長のバイナリコードを生成するアンサンブルネットワークを提案する。
平均精度の測定は、他の最先端のシングルラベル・マルチラベル画像検索データセットと競合する結果を示す。
関連論文リスト
- Superpixel Graph Contrastive Clustering with Semantic-Invariant
Augmentations for Hyperspectral Images [64.72242126879503]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - Semi-supervised segmentation of land cover images using nonlinear
canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。
本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。
提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文 参考訳(メタデータ) (2024-01-22T17:56:07Z) - Optimize and Reduce: A Top-Down Approach for Image Vectorization [12.998637003026273]
高速かつドメインに依存しないベクトル化へのトップダウンアプローチであるOptimize & Reduce (O&R)を提案する。
O&Rの目的は、B'ezier曲線パラメータを反復的に最適化することで、入力画像のコンパクトな表現を実現することである。
提案手法はドメインに依存しないものであり,固定された形状に対する再現性および知覚的品質の両方において,既存の作品よりも優れることを示す。
論文 参考訳(メタデータ) (2023-12-18T16:41:03Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Hyperspectral Remote Sensing Image Classification Based on Multi-scale
Cross Graphic Convolution [20.42582692786715]
マルチスケール機能マイニング学習アルゴリズム(MGRNet)を提案する。
MGRNetは、主成分分析を用いて、元のハイパースペクトル画像(HSI)の次元を減少させ、その意味情報の99.99%を保持する。
3つの一般的なハイパースペクトルデータセットの実験により,本論文で提案したMGRNetアルゴリズムは,認識精度において従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-06-28T15:28:09Z) - A Feature Fusion-Net Using Deep Spatial Context Encoder and
Nonstationary Joint Statistical Model for High Resolution SAR Image
Classification [10.152675581771113]
HR SAR画像に対して, エンドツーエンドの教師付き分類法を提案する。
より効果的な空間特徴を抽出するために,新しい深部空間コンテキストエンコーダネットワーク(DSCEN)を提案する。
統計の多様性を高めるため、非定常連成統計モデル(NS-JSM)が採用され、グローバルな統計特性を形成する。
論文 参考訳(メタデータ) (2021-05-11T06:20:14Z) - DeepEMD: Differentiable Earth Mover's Distance for Few-Shot Learning [122.51237307910878]
我々は,画像領域間の最適なマッチングの新しい視点から,少数ショット画像分類法を開発した。
我々は、高密度画像表現間の構造距離を計算するために、Earth Mover's Distance (EMD) を用いている。
定式化において重要な要素の重みを生成するために,我々は相互参照機構を設計する。
論文 参考訳(メタデータ) (2020-03-15T08:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。