論文の概要: Self-supervised Learning with Fully Convolutional Networks
- arxiv url: http://arxiv.org/abs/2012.10017v1
- Date: Fri, 18 Dec 2020 02:31:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:14:16.827314
- Title: Self-supervised Learning with Fully Convolutional Networks
- Title(参考訳): 完全畳み込みネットワークによる自己教師型学習
- Authors: Zhengeng Yang, Hongshan Yu, Yong He, Zhi-Hong Mao, Ajmal Mian
- Abstract要約: セマンティックセグメンテーションのためのラベルのないデータから表現を学習する問題に焦点を当てる。
2つのパッチベース手法に着想を得て,新しい自己教師付き学習フレームワークを開発した。
ベースラインモデルに対して5.8ポイント改善を達成しました。
- 参考スコア(独自算出の注目度): 24.660086792201263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although deep learning based methods have achieved great success in many
computer vision tasks, their performance relies on a large number of densely
annotated samples that are typically difficult to obtain. In this paper, we
focus on the problem of learning representation from unlabeled data for
semantic segmentation. Inspired by two patch-based methods, we develop a novel
self-supervised learning framework by formulating the Jigsaw Puzzle problem as
a patch-wise classification process and solving it with a fully convolutional
network. By learning to solve a Jigsaw Puzzle problem with 25 patches and
transferring the learned features to semantic segmentation task on Cityscapes
dataset, we achieve a 5.8 percentage point improvement over the baseline model
that initialized from random values. Moreover, experiments show that our
self-supervised learning method can be applied to different datasets and
models. In particular, we achieved competitive performance with the
state-of-the-art methods on the PASCAL VOC2012 dataset using significant fewer
training images.
- Abstract(参考訳): 深層学習に基づく手法は多くのコンピュータビジョンタスクで大きな成功を収めてきたが、その性能は典型的には入手が困難である大量の注釈付きサンプルに依存している。
本稿では,セマンティックセグメンテーションのためのラベルのないデータから表現を学習する問題に焦点を当てる。
2つのパッチベース手法に着想を得て,jigsawパズル問題をパッチワイズ分類プロセスとして定式化し,完全畳み込みネットワークを用いて解く,新しい自己教師付き学習フレームワークを開発した。
Jigsaw Puzzleを25のパッチで解決し、学習した機能をCityscapesデータセットのセマンティックセグメンテーションタスクに転送することで、ランダムな値から初期化したベースラインモデルよりも5.8ポイント改善できる。
さらに,本研究の自己教師型学習手法が,異なるデータセットやモデルに適用可能であることを示す。
特に,PASCAL VOC2012データセットの最先端手法との競合性能は,少ないトレーニング画像を用いて達成した。
関連論文リスト
- CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - BatchFormer: Learning to Explore Sample Relationships for Robust
Representation Learning [93.38239238988719]
本稿では,各ミニバッチからサンプル関係を学習可能なディープニューラルネットワークを提案する。
BatchFormerは各ミニバッチのバッチ次元に適用され、トレーニング中のサンプル関係を暗黙的に探索する。
我々は10以上のデータセットに対して広範な実験を行い、提案手法は異なるデータ不足アプリケーションにおいて大幅な改善を実現する。
論文 参考訳(メタデータ) (2022-03-03T05:31:33Z) - Reasoning for Complex Data through Ensemble-based Self-Supervised
Learning [77.49763012201429]
最近の研究は、基礎となるクラスが意味的に大きな違いがある場合、印象的な結果を示している。
一般的な自己教師付き学習手法は、クラスがより近いセマンティクスを持つ場合、識別的特徴を学習できない。
本稿では,この課題に対処し,異なるクラスからのサンプルが顕著に多様性がない場合でも,ラベルのないデータから学習できるようにする戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - MEAL: Manifold Embedding-based Active Learning [0.0]
アクティブな学習は、ラベル付けのための最も有望なサンプルを提案することで、少量のデータから学ぶのに役立つ。
本稿では,各獲得ステップにおいて,有望な画像領域を提案するアクティブラーニングのためのプールベースの新しい手法を提案する。
また,Cityscapesでは,Cityscapesでは,CamVidの性能向上が認められなかった。
論文 参考訳(メタデータ) (2021-06-22T15:22:56Z) - Robust Pooling through the Data Mode [5.7564383437854625]
本稿では,新しいロバストなプール層を含む新しいディープラーニングソリューションを提案する。
提案するプール層では,クラスタがモデルを示すため,RANSACとヒストグラムという2つの手法を用いて,モデム/クラスタのデータを探す。
我々は、プーリング層をポイントベースやグラフベースニューラルネットワークなどのフレームワークでテストし、ロバスト・オブ・ザ・アーティカルな手法と比較して、ロバストなロバスト性を示した。
論文 参考訳(メタデータ) (2021-06-21T04:35:24Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。
ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。
さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文 参考訳(メタデータ) (2020-12-31T08:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。