論文の概要: A Novel Triplet Sampling Method for Multi-Label Remote Sensing Image
Search and Retrieval
- arxiv url: http://arxiv.org/abs/2105.03647v1
- Date: Sat, 8 May 2021 09:16:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 09:55:31.550755
- Title: A Novel Triplet Sampling Method for Multi-Label Remote Sensing Image
Search and Retrieval
- Title(参考訳): マルチラベルリモートセンシング画像検索・検索のための新しい三重項サンプリング法
- Authors: Tristan Kreuziger, Mahdyar Ravanbakhsh, Beg\"um Demir
- Abstract要約: 計量空間を学ぶための一般的なアプローチは、類似した(正の)画像と異種(負の)画像の選択に依存する。
マルチラベルRS CBIR問題に対して定義されたディープニューラルネットワーク(DNNs)の枠組みにおける新しいトリプレットサンプリング法を提案する。
- 参考スコア(独自算出の注目度): 1.123376893295777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning the similarity between remote sensing (RS) images forms the
foundation for content based RS image retrieval (CBIR). Recently, deep metric
learning approaches that map the semantic similarity of images into an
embedding space have been found very popular in RS. A common approach for
learning the metric space relies on the selection of triplets of similar
(positive) and dissimilar (negative) images to a reference image called as an
anchor. Choosing triplets is a difficult task particularly for multi-label RS
CBIR, where each training image is annotated by multiple class labels. To
address this problem, in this paper we propose a novel triplet sampling method
in the framework of deep neural networks (DNNs) defined for multi-label RS CBIR
problems. The proposed method selects a small set of the most representative
and informative triplets based on two main steps. In the first step, a set of
anchors that are diverse to each other in the embedding space is selected from
the current mini-batch using an iterative algorithm. In the second step,
different sets of positive and negative images are chosen for each anchor by
evaluating relevancy, hardness, and diversity of the images among each other
based on a novel ranking strategy. Experimental results obtained on two
multi-label benchmark achieves show that the selection of the most informative
and representative triplets in the context of DNNs results in: i) reducing the
computational complexity of the training phase of the DNNs without any
significant loss on the performance; and ii) an increase in learning speed
since informative triplets allow fast convergence. The code of the proposed
method is publicly available at
https://git.tu-berlin.de/rsim/image-retrieval-from-triplets.
- Abstract(参考訳): リモートセンシング(RS)画像の類似性を学習することは、コンテンツベースRS画像検索(CBIR)の基礎となる。
近年,画像の意味的類似性を埋め込み空間にマッピングするディープメトリック学習手法が,RSで非常に人気がある。
計量空間を学習するための一般的なアプローチは、アンカーと呼ばれる参照画像に対する類似(正)および異(負)の画像の選択に依存する。
特にマルチラベルRS CBIRでは,各トレーニングイメージに複数のクラスラベルがアノテートされるため,トリプレットの選択は難しい課題である。
本稿では,多ラベルRS CBIR問題に対して定義されたディープニューラルネットワーク(DNN)の枠組みにおける新しいトリプルトサンプリング手法を提案する。
提案手法は,2つの主要なステップに基づいて,最も代表的なトリプレットと情報トリプレットの小さなセットを選択する。
第1のステップでは、反復アルゴリズムを用いて現在のミニバッチから、埋め込み空間内で互いに多様なアンカー群を選択する。
第2のステップでは、新たなランキング戦略に基づいて、画像の関連性、硬度、多様性を評価することにより、各アンカーに対して異なる正と負のイメージセットを選択する。
2つのマルチラベルベンチマークで得られた実験結果から,dnnsの文脈における最も有益で代表的な三重項の選択は,(1)性能を損なうことなく,dnnのトレーニングフェーズの計算複雑性を低減すること,(2)有益三重項が高速収束を可能にするため,学習速度が向上すること,という結果が得られた。
提案手法のコードは https://git.tu-berlin.de/rsim/image-retrieval-from-triplets で公開されている。
関連論文リスト
- Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval [3.2109665109975696]
ANNEALは、類似した、異種のイメージペアで構成された、小さくて情報的なトレーニングセットを作成することを目的としている。
不確実性と多様性の基準を組み合わせることにより、画像対の情報性を評価する。
このアノテート方式は、ランド・ユース・ランド・カバー・クラスラベルによるアノテート画像と比較して、アノテーションコストを著しく削減する。
論文 参考訳(メタデータ) (2024-06-14T15:08:04Z) - Visual Delta Generator with Large Multi-modal Models for Semi-supervised Composed Image Retrieval [50.72924579220149]
Composed Image Retrieval (CIR)は、提供されるテキスト修正に基づいて、クエリに似たイメージを取得するタスクである。
現在の技術は、基準画像、テキスト、ターゲット画像のラベル付き三重項を用いたCIRモデルの教師あり学習に依存している。
本稿では,参照とその関連対象画像を補助データとして検索する半教師付きCIR手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T21:00:22Z) - Advancing Image Retrieval with Few-Shot Learning and Relevance Feedback [5.770351255180495]
Image Retrieval with Relevance Feedback (IRRF) は、検索プロセス中に反復的なヒューマンインタラクションを伴う。
本稿では,タスクに適したハイパーネットワークに基づく新しいスキームを提案し,ユーザフィードバックの迅速な調整を容易にする。
提案手法は,数発の1クラス分類でSoTAを達成でき,数発のオープンセット認識のバイナリ分類タスクで同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2023-12-18T10:20:28Z) - Ranking-aware Uncertainty for Text-guided Image Retrieval [17.70430913227593]
本稿では,多対多対応をモデル化する新しいランキングアウェア不確実性手法を提案する。
既存の最先端手法と比較して,提案手法は2つの公開データセットに対して有意な結果が得られる。
論文 参考訳(メタデータ) (2023-08-16T03:48:19Z) - A Triplet-loss Dilated Residual Network for High-Resolution
Representation Learning in Image Retrieval [0.0]
ローカライゼーションなどのいくつかのアプリケーションでは、画像検索が最初のステップとして使用される。
本論文では,トレーニング可能なパラメータが少ない,単純かつ効率的な画像検索システムを提案する。
提案手法は三重項損失を有する拡張残差畳み込みニューラルネットワークの利点である。
論文 参考訳(メタデータ) (2023-03-15T07:01:44Z) - Pic2Word: Mapping Pictures to Words for Zero-shot Composed Image
Retrieval [84.11127588805138]
Composed Image Retrieval (CIR)は、クエリイメージとテキストを組み合わせて、対象とするターゲットを記述する。
既存の方法は、クエリ画像、テキスト仕様、ターゲット画像からなるラベル付き三重項を用いたCIRモデルの教師あり学習に依存している。
我々は,ラベル付き三重項学習を必要とせずにCIRモデルを構築することを目的として,Zero-Shot Composed Image Retrieval (ZS-CIR)を提案する。
論文 参考訳(メタデータ) (2023-02-06T19:40:04Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Rank-Consistency Deep Hashing for Scalable Multi-Label Image Search [90.30623718137244]
スケーラブルなマルチラベル画像検索のための新しいディープハッシュ法を提案する。
2つの空間の類似性順序を整列するために、新しい階数整合性目的を適用した。
強力な損失関数は、意味的類似性とハミング距離が一致しないサンプルをペナルティ化するように設計されている。
論文 参考訳(メタデータ) (2021-02-02T13:46:58Z) - Learning to Focus: Cascaded Feature Matching Network for Few-shot Image
Recognition [38.49419948988415]
ディープネットワークは、多数の画像でトレーニングすることで、カテゴリのオブジェクトを正確に認識することを学ぶことができる。
低ショット画像認識タスク(low-shot image recognition task)として知られるメタラーニングの課題は、1つのカテゴリの認識モデルを学ぶためにアノテーション付き画像しか利用できない場合に発生する。
この問題を解決するため,Cascaded Feature Matching Network (CFMN) と呼ばれる手法を提案する。
EmphminiImageNet と Omniglot の2つの標準データセットを用いた数ショット学習実験により,本手法の有効性が確認された。
論文 参考訳(メタデータ) (2021-01-13T11:37:28Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。