論文の概要: A Zero-Shot Sketch-based Inter-Modal Object Retrieval Scheme for Remote
Sensing Images
- arxiv url: http://arxiv.org/abs/2008.05225v1
- Date: Wed, 12 Aug 2020 10:51:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 05:32:57.351291
- Title: A Zero-Shot Sketch-based Inter-Modal Object Retrieval Scheme for Remote
Sensing Images
- Title(参考訳): ゼロショットスケッチに基づくリモートセンシング画像のためのモード間オブジェクト検索方式
- Authors: Ushasi Chaudhuri, Biplab Banerjee, Avik Bhattacharya, Mihai Datcu
- Abstract要約: 本稿では,RSデータのスケッチベース表現を用いたモーダル三重項に基づくゼロショット検索手法を提案する。
提案手法は、スケッチ表現が画像の極端にプロトタイプである場合でも効率よく動作する。
- 参考スコア(独自算出の注目度): 26.48516754642218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional existing retrieval methods in remote sensing (RS) are often
based on a uni-modal data retrieval framework. In this work, we propose a novel
inter-modal triplet-based zero-shot retrieval scheme utilizing a sketch-based
representation of RS data. The proposed scheme performs efficiently even when
the sketch representations are marginally prototypical of the image. We
conducted experiments on a new bi-modal image-sketch dataset called Earth on
Canvas (EoC) conceived during this study. We perform a thorough bench-marking
of this dataset and demonstrate that the proposed network outperforms other
state-of-the-art methods for zero-shot sketch-based retrieval framework in
remote sensing.
- Abstract(参考訳): リモートセンシング(RS)における従来の既存の検索方法は、しばしばユニモーダルなデータ検索フレームワークに基づいている。
本研究では,RSデータのスケッチベース表現を用いたモーダル三重項に基づくゼロショット検索手法を提案する。
提案手法は、スケッチ表現が画像の極端にプロトタイプである場合でも効率よく動作する。
本研究では,本研究で考案された Earth on Canvas (EoC) というバイモーダルな画像スケッチデータセットの実験を行った。
このデータセットの詳細なベンチマーキングを行い,提案手法がリモートセンシングにおけるゼロショットスケッチに基づく検索フレームワークの最先端手法よりも優れていることを示す。
関連論文リスト
- Modality-Aware Representation Learning for Zero-shot Sketch-based Image
Retrieval [10.568851068989973]
ゼロショット学習は、機械学習モデルが目に見えないカテゴリを扱うための効率的なソリューションを提供する。
そこで本研究では,スケッチや写真をテキストで対比して間接的にアライメントする新しいフレームワークを提案する。
データから学習したモダリティを明示的に符号化することで、モダリティ固有の情報からモダリティに依存しないセマンティクスを分離する。
論文 参考訳(メタデータ) (2024-01-10T00:39:03Z) - Symmetrical Bidirectional Knowledge Alignment for Zero-Shot Sketch-Based
Image Retrieval [69.46139774646308]
本稿ではゼロショットスケッチベース画像検索(ZS-SBIR)の問題点について検討する。
目に見えないカテゴリのスケッチをクエリとして使用して、同じカテゴリのイメージにマッチさせることが目的だ。
ゼロショットスケッチに基づく画像検索(SBKA)のための新しい対称双方向知識アライメントを提案する。
論文 参考訳(メタデータ) (2023-12-16T04:50:34Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Sketch-an-Anchor: Sub-epoch Fast Model Adaptation for Zero-shot
Sketch-based Image Retrieval [1.52292571922932]
Sketch-an-Anchorは、最先端のZSSBIR(Zero-shot Image Retrieval)モデルをエポック下でトレーニングする新しい方法である。
我々の高速収束モデルは、スケッチから類似した表現を抽出することを学びながら、単一ドメインのパフォーマンスを維持します。
論文 参考訳(メタデータ) (2023-03-29T15:00:02Z) - BDA-SketRet: Bi-Level Domain Adaptation for Zero-Shot SBIR [52.78253400327191]
BDA-SketRetは、視覚データペアの空間的特徴と意味的特徴を整合させるために、バイレベルドメイン適応を実行する新しいフレームワークである。
拡張されたSketchy、TU-Berlin、QuickDrawの実験結果は、文献よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-01-17T18:45:55Z) - Domain-Smoothing Network for Zero-Shot Sketch-Based Image Retrieval [66.37346493506737]
Zero-Shot Sketch-Based Image Retrieval (ZS-SBIR) は、新しいクロスモーダル検索タスクである。
ZS-SBIRのための新しいドメイン・スムーシング・ネットワーク(DSN)を提案する。
我々のアプローチは、SketchyとTU-Berlinの両方のデータセットで最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-06-22T14:58:08Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z) - Semantically Tied Paired Cycle Consistency for Any-Shot Sketch-based
Image Retrieval [55.29233996427243]
ローショットスケッチに基づく画像検索はコンピュータビジョンの新たな課題である。
本稿では,ゼロショットおよび少数ショットのスケッチベース画像検索(SBIR)タスクについて述べる。
これらの課題を解決するために,SEM-PCYC(SEM-PCYC)を提案する。
以上の結果から,Sketchy,TU-Berlin,QuickDrawのデータセットを拡張したバージョンでは,最先端の撮影性能が大幅に向上した。
論文 参考訳(メタデータ) (2020-06-20T22:43:53Z) - Image Retrieval using Multi-scale CNN Features Pooling [26.811290793232313]
本稿では,NetVLADに基づく新しいマルチスケールローカルプールと,サンプルの難易度に基づくトリプルトマイニング手法を利用して,効率的な画像表現を実現するエンド・ツー・エンドのトレーニング可能なネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-21T00:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。