論文の概要: Resolving Semantic Confusions for Improved Zero-Shot Detection
- arxiv url: http://arxiv.org/abs/2212.06097v1
- Date: Mon, 12 Dec 2022 18:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 17:05:31.849267
- Title: Resolving Semantic Confusions for Improved Zero-Shot Detection
- Title(参考訳): ゼロショット検出における意味的混乱の解消
- Authors: Sandipan Sarma, Sushil Kumar, Arijit Sur
- Abstract要約: 本稿では,クラス間の相違度を認識する三重項損失を考慮した生成モデルを提案する。
クラスの生成した視覚的サンプルが、自身のセマンティクスに高度に対応していることを保証するために、サイクリック一貫性損失も実施される。
- 参考スコア(独自算出の注目度): 6.72910827751713
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Zero-shot detection (ZSD) is a challenging task where we aim to recognize and
localize objects simultaneously, even when our model has not been trained with
visual samples of a few target ("unseen") classes. Recently, methods employing
generative models like GANs have shown some of the best results, where
unseen-class samples are generated based on their semantics by a GAN trained on
seen-class data, enabling vanilla object detectors to recognize unseen objects.
However, the problem of semantic confusion still remains, where the model is
sometimes unable to distinguish between semantically-similar classes. In this
work, we propose to train a generative model incorporating a triplet loss that
acknowledges the degree of dissimilarity between classes and reflects them in
the generated samples. Moreover, a cyclic-consistency loss is also enforced to
ensure that generated visual samples of a class highly correspond to their own
semantics. Extensive experiments on two benchmark ZSD datasets - MSCOCO and
PASCAL-VOC - demonstrate significant gains over the current ZSD methods,
reducing semantic confusion and improving detection for the unseen classes.
- Abstract(参考訳): ゼロショット検出(zsd)は、モデルがいくつかのターゲット("unseen")クラスの視覚的なサンプルでトレーニングされていなくても、オブジェクトの認識とローカライズを同時に行なおうとする、難しいタスクです。
近年、GANのような生成モデルを用いた手法は、目に見えるデータに基づいて訓練されたGANによって、目に見えないサンプルが生成され、バニラオブジェクト検出器が見えないオブジェクトを認識できるという、最良の結果を示している。
しかし、意味的混乱の問題はまだ残っており、モデルが意味的類似クラスを区別できないこともある。
本研究では,クラス間の相違の度合いを認識し,生成したサンプルに反映する三重項損失を取り入れた生成モデルを訓練することを提案する。
さらに、クラスの生成したビジュアルサンプルが、自身のセマンティクスに高度に対応することを保証するために、サイクリック一貫性損失も実施される。
MSCOCOとPASCAL-VOCの2つのベンチマークZSDデータセットに対する大規模な実験は、現在のZSDメソッドよりも大幅に向上し、意味的混乱を低減し、目に見えないクラスの検出を改善する。
関連論文リスト
- Zero-Shot Temporal Action Detection via Vision-Language Prompting [134.26292288193298]
視覚言語プロンプト(STALE)を用いた新しいゼロショット時間行動検出モデルを提案する。
我々のモデルは最先端の代替品を著しく上回っている。
我々のモデルは、近年の強力な競合相手よりも監督的TADにおいて優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-07-17T13:59:46Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - DUET: Cross-modal Semantic Grounding for Contrastive Zero-shot Learning [37.48292304239107]
本稿では, DUET という変換器を用いたエンドツーエンドZSL手法を提案する。
画像からセマンティック属性を分離するモデルの能力を調べるために,モーダルなセマンティックグラウンドネットワークを開発した。
DUETは、しばしば最先端のパフォーマンスを達成することができ、そのコンポーネントは有効であり、予測は解釈可能である。
論文 参考訳(メタデータ) (2022-07-04T11:12:12Z) - Bias-Eliminated Semantic Refinement for Any-Shot Learning [27.374052527155623]
我々は、任意のショット学習タスクの粗粒度意味記述を洗練する。
セマンティック・リファインメント(セマンティック・リファインメント)のワッサーシュタイン生成逆数ネットワーク(SRWGAN)モデルが設計されている。
6つのベンチマークデータセットでモデル性能を広範囲に評価した。
論文 参考訳(メタデータ) (2022-02-10T04:15:50Z) - Semantics-Guided Contrastive Network for Zero-Shot Object detection [67.61512036994458]
ゼロショット物体検出(ZSD)はコンピュータビジョンにおける新しい課題である。
ゼロショット検出の領域にコントラスト学習機構をもたらすフレームワークであるContrastZSDを開発した。
本手法は,ZSDタスクと一般化ZSDタスクの両方において,従来の最先端技術よりも優れていた。
論文 参考訳(メタデータ) (2021-09-04T03:32:15Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Incrementally Zero-Shot Detection by an Extreme Value Analyzer [0.0]
本稿では,実世界の物体検出におけるゼロショット学習とクラスインクリメンタル学習の両方のための新しい戦略を提案する。
本稿では,新しい極値解析器を提案し,古い見え方,新しい見え方,見えないクラスからオブジェクトを同時に検出する。
実験では, 対象物の検出におけるモデルの有効性を実証し, Pascal VOCおよびMSCOCOデータセット上での代替モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-03-23T15:06:30Z) - Entropy-Based Uncertainty Calibration for Generalized Zero-Shot Learning [49.04790688256481]
一般化ゼロショット学習(GZSL)の目的は、目に見えないクラスと見えないクラスの両方を認識することである。
ほとんどのGZSLメソッドは、通常、見えないクラスの意味情報から視覚表現を合成することを学ぶ。
本論文では,三重項損失を持つ2重変分オートエンコーダを利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T05:21:27Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。