論文の概要: Use the Detection Transformer as a Data Augmenter
- arxiv url: http://arxiv.org/abs/2304.04554v2
- Date: Wed, 26 Apr 2023 02:44:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 17:21:19.377260
- Title: Use the Detection Transformer as a Data Augmenter
- Title(参考訳): データ拡張器として検出トランスを使用する
- Authors: Luping Wang, Bin Liu
- Abstract要約: DeMixは、シンプルだが非常に効果的なデータ拡張技術であるCutMix上に構築されている。
CutMixは、パッチを1つのイメージから別のイメージにカット&ペーストすることで、モデルのパフォーマンスを改善し、新しいイメージを生成する。
DeMixは、事前訓練されたDETRによって、セマンティックにリッチなパッチを精巧に選択する。
- 参考スコア(独自算出の注目度): 13.15197086963704
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Detection Transformer (DETR) is a Transformer architecture based object
detection model. In this paper, we demonstrate that it can also be used as a
data augmenter. We term our approach as DETR assisted CutMix, or DeMix for
short. DeMix builds on CutMix, a simple yet highly effective data augmentation
technique that has gained popularity in recent years. CutMix improves model
performance by cutting and pasting a patch from one image onto another,
yielding a new image. The corresponding label for this new example is specified
as the weighted average of the original labels, where the weight is
proportional to the area of the patch. CutMix selects a random patch to be cut.
In contrast, DeMix elaborately selects a semantically rich patch, located by a
pre-trained DETR. The label of the new image is specified in the same way as in
CutMix. Experimental results on benchmark datasets for image classification
demonstrate that DeMix significantly outperforms prior art data augmentation
methods including CutMix. Oue code is available at
https://github.com/ZJLAB-AMMI/DeMix.
- Abstract(参考訳): Detection Transformer (DETR) は、Transformerアーキテクチャに基づくオブジェクト検出モデルである。
本稿では,データ拡張器としても使用できることを実証する。
我々は、我々のアプローチを、略してDeTR支援のCutMixまたはDeMixと表現する。
DeMixは、シンプルだが非常に効果的なデータ拡張技術であるCutMix上に構築されている。
cutmixはパッチを1つのイメージから別のイメージにカット・ペーストし、新しいイメージを生成することで、モデルパフォーマンスを向上させる。
この新しい例に対応するラベルは、パッチの面積に比例する元のラベルの重み付き平均として指定される。
CutMixはカットすべきランダムパッチを選択する。
対照的にDeMixは、事前訓練されたDETRが配置する意味的にリッチなパッチを精巧に選択する。
新しい画像のラベルは、CutMixと同じ方法で指定される。
画像分類のためのベンチマークデータセットの実験結果は、demixがcutmixを含む先行技術データ拡張法を大幅に上回っていることを示している。
Oueコードはhttps://github.com/ZJLAB-AMMI/DeMixで入手できる。
関連論文リスト
- SpliceMix: A Cross-scale and Semantic Blending Augmentation Strategy for
Multi-label Image Classification [46.8141860303439]
マルチラベル画像分類,すなわちSpliceMixの簡易かつ効果的な拡張戦略を提案する。
本手法の「スプライス」は,1) 混合画像は, 混合に係わる画像のセマンティクスを, 共起バイアスを緩和するためのオブジェクト欠陥を伴わずにブレンドするグリッドの形で, 縮小された画像のスプライスであり, 2) 混合画像と元のミニバッチをスプリスして, 異なるスケールの画像を同時にトレーニングに寄与するSpliceMixed mini-batchを形成する。
論文 参考訳(メタデータ) (2023-11-26T05:45:27Z) - MixPro: Data Augmentation with MaskMix and Progressive Attention
Labeling for Vision Transformer [17.012278767127967]
画像とラベル空間におけるMaskMixとProgressive Attention Labelingを提案する。
画像空間の観点から、パッチのようなグリッドマスクをベースとした2つのイメージを混合したMaskMixを設計する。
ラベル空間の観点からPALを設計し, 混合注目ラベルの注意重みを動的に重み付けするプログレッシブファクターを設計する。
論文 参考訳(メタデータ) (2023-04-24T12:38:09Z) - SMMix: Self-Motivated Image Mixing for Vision Transformers [65.809376136455]
CutMixは視覚変換器(ViT)の性能と一般化能力を決定する重要な拡張戦略である
既存のCutMixの変種は、より一貫性のある混合画像やより正確な混合ラベルを生成することでこの問題に対処している。
本稿では,学習モデルによる画像とラベルの強調を動機づける,効率的かつ効果的な自己運動画像混合法を提案する。
論文 参考訳(メタデータ) (2022-12-26T00:19:39Z) - OAMixer: Object-aware Mixing Layer for Vision Transformers [73.10651373341933]
オブジェクトラベルに基づいてパッチベースモデルのパッチ混合層を校正するOAMixerを提案する。
オブジェクト中心の表現を学習することにより、OAMixerは様々なパッチベースモデルの分類精度と背景ロバスト性を向上することを示した。
論文 参考訳(メタデータ) (2022-12-13T14:14:48Z) - CropMix: Sampling a Rich Input Distribution via Multi-Scale Cropping [97.05377757299672]
そこで本研究では,元のデータセット分布からリッチな入力分布を生成するための簡単なCropMixを提案する。
CropMixは、分類タスクを実行するトレーニングレシピやニューラルネットワークアーキテクチャにシームレスに適用することができる。
CropMixは、より強力な表現に向けて、対照的な学習とマスクされた画像モデリングの両方に利益があることを示す。
論文 参考訳(メタデータ) (2022-05-31T16:57:28Z) - ResizeMix: Mixing Data with Preserved Object Information and True Labels [57.00554495298033]
本研究は,データ混合におけるサリエンシー情報の重要性について検討し,サリエンシー情報は増補性能向上のために必要ではないことを見出した。
本稿では,より効率的で実装が容易なresizemix法を提案する。
論文 参考訳(メタデータ) (2020-12-21T03:43:13Z) - SnapMix: Semantically Proportional Mixing for Augmenting Fine-grained
Data [124.95585891086894]
提案はSemantically Proportional Mixing(SnapMix)と呼ばれる
クラスアクティベーションマップ(CAM)を利用して、きめ細かいデータを強化する際にラベルノイズを低減します。
本手法は既存の混合型アプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2020-12-09T03:37:30Z) - FMix: Enhancing Mixed Sample Data Augmentation [5.820517596386667]
近年,Mixed Sample Data Augmentation (MSDA) が注目されている。
ここでは、MixUpがCutMixのように学習した関数を歪めていることを示す。
低周波画像にしきい値を適用したランダムなバイナリマスクを用いたMSDAであるFMixを提案する。
論文 参考訳(メタデータ) (2020-02-27T11:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。