論文の概要: Learning unbiased zero-shot semantic segmentation networks via
transductive transfer
- arxiv url: http://arxiv.org/abs/2007.00515v1
- Date: Wed, 1 Jul 2020 14:25:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:21:27.668398
- Title: Learning unbiased zero-shot semantic segmentation networks via
transductive transfer
- Title(参考訳): トランスダクティブ転送による非バイアスゼロショットセマンティックセグメンテーションネットワークの学習
- Authors: Haiyang Liu, Yichen Wang, Jiayi Zhao, Guowu Yang, Fengmao Lv
- Abstract要約: ゼロショットセマンティックセグメンテーションにおける予測バイアスを軽減するために, 簡単に実装可能なトランスダクティブ手法を提案する。
本手法は,全画素レベルのラベルを持つソースイメージと,未ラベルのターゲットイメージの両方をトレーニング中に利用できると仮定する。
- 参考スコア(独自算出の注目度): 14.55508599873219
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation, which aims to acquire a detailed understanding of
images, is an essential issue in computer vision. However, in practical
scenarios, new categories that are different from the categories in training
usually appear. Since it is impractical to collect labeled data for all
categories, how to conduct zero-shot learning in semantic segmentation
establishes an important problem. Although the attribute embedding of
categories can promote effective knowledge transfer across different
categories, the prediction of segmentation network reveals obvious bias to seen
categories. In this paper, we propose an easy-to-implement transductive
approach to alleviate the prediction bias in zero-shot semantic segmentation.
Our method assumes that both the source images with full pixel-level labels and
unlabeled target images are available during training. To be specific, the
source images are used to learn the relationship between visual images and
semantic embeddings, while the target images are used to alleviate the
prediction bias towards seen categories. We conduct comprehensive experiments
on diverse split s of the PASCAL dataset. The experimental results clearly
demonstrate the effectiveness of our method.
- Abstract(参考訳): 画像の詳細な理解を目的としたセマンティックセグメンテーションは,コンピュータビジョンにおいて重要な課題である。
しかし、実際的なシナリオでは、トレーニングのカテゴリとは異なる新しいカテゴリが通常現れます。
全てのカテゴリのラベル付きデータを収集するのは現実的ではないため、セグメンテーションにおけるゼロショット学習の実施は重要な課題である。
カテゴリーの属性埋め込みは、異なるカテゴリ間で効果的な知識伝達を促進することができるが、セグメンテーションネットワークの予測は、見るカテゴリーに対する明らかなバイアスを明らかにする。
本稿では,ゼロショットセマンティックセグメンテーションにおける予測バイアスを軽減するための,実装が容易なトランスダクティブ手法を提案する。
本手法は,全画素レベルのラベル付きソース画像とラベルなしターゲット画像の両方をトレーニング中に利用できると仮定する。
具体的に言うと、ソースイメージは視覚画像と意味埋め込みの関係を学習するために使用され、ターゲットイメージは見えるカテゴリに対する予測バイアスを緩和するために使用される。
PASCALデータセットの多種多様な分割について包括的実験を行った。
実験の結果,本手法の有効性が明らかとなった。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Hierarchical Semantic Segmentation using Psychometric Learning [17.417302703539367]
我々は,心理測定テストに基づいて,専門家からセグメンテーションアノテーションを収集する手法を開発した。
本手法は, 心理測定試験, アクティブクエリ選択, クエリ強化, ディープメトリック学習モデルから構成される。
本稿では, 合成画像, 空中画像, 組織像について評価し, 提案手法の有用性を示す。
論文 参考訳(メタデータ) (2021-07-07T13:38:33Z) - Task-Independent Knowledge Makes for Transferable Representations for
Generalized Zero-Shot Learning [77.0715029826957]
一般化されたゼロショット学習(GZSL)は、転送可能な画像表現を学習することによって新しいカテゴリを認識する。
タスク固有とタスク非依存の知識を同時に学習する新しいデュアルコントラスト埋め込みネットワーク(DCEN)を提案する。
論文 参考訳(メタデータ) (2021-04-05T10:05:48Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Realizing Pixel-Level Semantic Learning in Complex Driving Scenes based
on Only One Annotated Pixel per Class [17.481116352112682]
本稿では,複雑な運転シーン下でのセマンティックセマンティックセマンティクスタスクを提案する。
3段階のプロセスは擬似ラベル生成のために構築され、各カテゴリに最適な特徴表現を徐々に実装する。
Cityscapesデータセットの実験は、提案手法が弱教師付きセマンティックセマンティックセマンティクスタスクを解決するための実現可能な方法であることを示した。
論文 参考訳(メタデータ) (2020-03-10T12:57:55Z) - Relevance Prediction from Eye-movements Using Semi-interpretable
Convolutional Neural Networks [9.007191808968242]
眼球運動からテキスト文書の認識関連性を予測するための画像分類手法を提案する。
視線追跡調査では、参加者は短いニュース記事を読み、引き金の質問に答えるために関連性または無関係であると評価した。
参加者の眼球運動スキャンパスを画像としてエンコードし、これらのスキャンパス画像を用いて畳み込みニューラルネットワーク分類器を訓練する。
論文 参考訳(メタデータ) (2020-01-15T07:02:14Z) - Discovering Latent Classes for Semi-Supervised Semantic Segmentation [18.5909667833129]
本稿では,半教師付きセマンティックセグメンテーションの問題について検討する。
ラベル付き画像のセマンティッククラスと一致した潜在クラスを学習する。
提案手法は,半教師付きセマンティックセグメンテーションのための技術結果の状態を達成している。
論文 参考訳(メタデータ) (2019-12-30T14:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。