論文の概要: FenceMask: A Data Augmentation Approach for Pre-extracted Image Features
- arxiv url: http://arxiv.org/abs/2006.07877v1
- Date: Sun, 14 Jun 2020 12:16:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 13:13:24.330611
- Title: FenceMask: A Data Augmentation Approach for Pre-extracted Image Features
- Title(参考訳): fencemask: 抽出済み画像機能のためのデータ拡張アプローチ
- Authors: Pu Li, Xiangyang Li, Xiang Long
- Abstract要約: 本稿では,FenceMaskという新しいデータ拡張手法を提案する。
様々なコンピュータビジョンタスクにおいて優れたパフォーマンスを示す。
提案手法は,細粒度視覚分類タスクとVisDroneデータセットにおいて,大幅な性能向上を実現した。
- 参考スコア(独自算出の注目度): 18.299882139724684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel data augmentation method named 'FenceMask' that exhibits
outstanding performance in various computer vision tasks. It is based on the
'simulation of object occlusion' strategy, which aim to achieve the balance
between object occlusion and information retention of the input data. By
enhancing the sparsity and regularity of the occlusion block, our augmentation
method overcome the difficulty of small object augmentation and notably improve
performance over baselines. Sufficient experiments prove the performance of our
method is better than other simulate object occlusion approaches. We tested it
on CIFAR10, CIFAR100 and ImageNet datasets for Coarse-grained classification,
COCO2017 and VisDrone datasets for detection, Oxford Flowers, Cornel Leaf and
Stanford Dogs datasets for Fine-Grained Visual Categorization. Our method
achieved significant performance improvement on Fine-Grained Visual
Categorization task and VisDrone dataset.
- Abstract(参考訳): 本稿では,コンピュータビジョンタスクにおいて優れた性能を示す新しいデータ拡張手法「FenceMask」を提案する。
オブジェクトの隠蔽と入力データの情報保持のバランスをとることを目的とした「オブジェクトの隠蔽のシミュレーション」戦略に基づいている。
咬合ブロックのスパース性と正則性を高めることにより,小物体の増強の難しさを克服し,ベースラインに対する性能を著しく向上した。
本手法の性能が他のシミュレート対象閉塞法よりも優れていることを示す十分な実験を行った。
粒度分類のためのcifar10, cifar100, imagenetデータセット,coco2017およびvisdroneデータセット,検出のためのoxford flowers,cornel leafおよびstanford dogsデータセットでテストした。
本手法は,細粒度視覚分類タスクとvisdroneデータセットにおいて有意な性能改善を達成した。
関連論文リスト
- Adaptive Masking Enhances Visual Grounding [12.793586888511978]
ローショット学習シナリオにおける語彙接地を改善するために,ガウス放射変調を用いた画像解釈型マスキングを提案する。
我々はCOCOやODinWを含むベンチマークデータセットに対するアプローチの有効性を評価し、ゼロショットタスクや少数ショットタスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-04T05:48:02Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - ColMix -- A Simple Data Augmentation Framework to Improve Object
Detector Performance and Robustness in Aerial Images [1.9573380763700712]
セグメンテーションマスクを必要とせずに物体密度を増大させる,コラージュペーストと呼ばれる新しい拡張法を提案する。
コラージュペーストは、画像の破損など、特定の流通外シフトに対して脆弱であることがわかった。
PixMix Augmentation法とコラージュペーストを組み合わせるための2つの簡単な手法を導入し、組み合わせた手法をColMixと呼ぶ。
論文 参考訳(メタデータ) (2023-05-22T21:56:35Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Object-Based Augmentation Improves Quality of Remote SensingSemantic
Segmentation [0.0]
本研究では,オブジェクトベース拡張の開発とテストに焦点をあてる。
本研究では,トレーニングサンプル数を大幅に増加させるジオリファレンス画像拡張のための新しいパイプラインを提案する。
提示されたパイプラインはオブジェクトベースの拡張(OBA)と呼ばれ、オブジェクトのセグメンテーションマスクを利用して新しい現実的なトレーニングシーンを生成します。
論文 参考訳(メタデータ) (2021-05-12T08:54:55Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - GridMask Data Augmentation [76.79300104795966]
本稿では,新しいデータ拡張手法であるGridMaskを提案する。
情報除去を利用して、様々なコンピュータビジョンタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-01-13T07:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。