論文の概要: SpliceMix: A Cross-scale and Semantic Blending Augmentation Strategy for
Multi-label Image Classification
- arxiv url: http://arxiv.org/abs/2311.15200v1
- Date: Sun, 26 Nov 2023 05:45:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 19:00:27.409389
- Title: SpliceMix: A Cross-scale and Semantic Blending Augmentation Strategy for
Multi-label Image Classification
- Title(参考訳): splicemix:マルチラベル画像分類のためのクロススケール・セマンティックブレンド拡張戦略
- Authors: Lei Wang and Yibing Zhan and Leilei Ma and Dapeng Tao and Liang Ding
and Chen Gong
- Abstract要約: マルチラベル画像分類,すなわちSpliceMixの簡易かつ効果的な拡張戦略を提案する。
本手法の「スプライス」は,1) 混合画像は, 混合に係わる画像のセマンティクスを, 共起バイアスを緩和するためのオブジェクト欠陥を伴わずにブレンドするグリッドの形で, 縮小された画像のスプライスであり, 2) 混合画像と元のミニバッチをスプリスして, 異なるスケールの画像を同時にトレーニングに寄与するSpliceMixed mini-batchを形成する。
- 参考スコア(独自算出の注目度): 46.8141860303439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, Mix-style data augmentation methods (e.g., Mixup and CutMix) have
shown promising performance in various visual tasks. However, these methods are
primarily designed for single-label images, ignoring the considerable
discrepancies between single- and multi-label images, i.e., a multi-label image
involves multiple co-occurred categories and fickle object scales. On the other
hand, previous multi-label image classification (MLIC) methods tend to design
elaborate models, bringing expensive computation. In this paper, we introduce a
simple but effective augmentation strategy for multi-label image
classification, namely SpliceMix. The "splice" in our method is two-fold: 1)
Each mixed image is a splice of several downsampled images in the form of a
grid, where the semantics of images attending to mixing are blended without
object deficiencies for alleviating co-occurred bias; 2) We splice mixed images
and the original mini-batch to form a new SpliceMixed mini-batch, which allows
an image with different scales to contribute to training together. Furthermore,
such splice in our SpliceMixed mini-batch enables interactions between mixed
images and original regular images. We also offer a simple and non-parametric
extension based on consistency learning (SpliceMix-CL) to show the flexible
extensibility of our SpliceMix. Extensive experiments on various tasks
demonstrate that only using SpliceMix with a baseline model (e.g., ResNet)
achieves better performance than state-of-the-art methods. Moreover, the
generalizability of our SpliceMix is further validated by the improvements in
current MLIC methods when married with our SpliceMix. The code is available at
https://github.com/zuiran/SpliceMix.
- Abstract(参考訳): 近年、ミックススタイルのデータ拡張手法(例えばmixupやcutmix)が様々なビジュアルタスクで有望なパフォーマンスを示している。
しかし、これらの手法は主にシングルラベル画像のために設計されており、シングルラベル画像とマルチラベル画像のかなりの差を無視している。
一方で、従来のマルチラベル画像分類(mlic)法は、複雑なモデルを設計する傾向があり、高価な計算をもたらす。
本稿では,マルチラベル画像分類,すなわちSpliceMixの簡易かつ効果的な拡張戦略を提案する。
私たちのメソッドのspliceは2倍です。
1) 混合画像は,複数のダウンサンプリングされた画像を格子状に分割し,混合に係わる画像の意味を,共起バイアスを緩和する対象の欠陥を伴わずにブレンドする。
2)混合画像とオリジナルのミニバッチをスプライシングし,新しいスプライス混合ミニバッチを形成した。
さらに、SpliceMixedのミニバッチは、混合画像と元の正規画像との相互作用を可能にする。
また,一貫性学習(splicemix-cl)に基づく簡易かつ非パラメトリックな拡張を提供し,splicemixの柔軟な拡張性を示す。
様々なタスクに関する大規模な実験は、ベースラインモデル(例えばResNet)でSpliceMixを使用するだけで、最先端のメソッドよりも優れたパフォーマンスが得られることを示した。
さらに、SpliceMixの一般化性は、SpliceMixとの結婚時に現在のMLICメソッドの改善によってさらに検証される。
コードはhttps://github.com/zuiran/splicemixで入手できる。
関連論文リスト
- SUMix: Mixup with Semantic and Uncertain Information [41.99721365685618]
混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。
そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文 参考訳(メタデータ) (2024-07-10T16:25:26Z) - SMMix: Self-Motivated Image Mixing for Vision Transformers [65.809376136455]
CutMixは視覚変換器(ViT)の性能と一般化能力を決定する重要な拡張戦略である
既存のCutMixの変種は、より一貫性のある混合画像やより正確な混合ラベルを生成することでこの問題に対処している。
本稿では,学習モデルによる画像とラベルの強調を動機づける,効率的かつ効果的な自己運動画像混合法を提案する。
論文 参考訳(メタデータ) (2022-12-26T00:19:39Z) - CropMix: Sampling a Rich Input Distribution via Multi-Scale Cropping [97.05377757299672]
そこで本研究では,元のデータセット分布からリッチな入力分布を生成するための簡単なCropMixを提案する。
CropMixは、分類タスクを実行するトレーニングレシピやニューラルネットワークアーキテクチャにシームレスに適用することができる。
CropMixは、より強力な表現に向けて、対照的な学習とマスクされた画像モデリングの両方に利益があることを示す。
論文 参考訳(メタデータ) (2022-05-31T16:57:28Z) - AlignMix: Improving representation by interpolating aligned features [19.465347590276114]
特徴空間に2つの画像を幾何学的にアライメントするAlignMixを紹介した。
自動エンコーダは、デコードされた画像を見ることなく、mixup下での表現学習を改善できることを示す。
論文 参考訳(メタデータ) (2021-03-29T07:03:18Z) - MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep Subnetworks [97.08677678499075]
マルチインプットマルチアウトプットディープワークを学ぶための新しいフレームワークであるMixMoを紹介します。
機能、特にCutMixのパッチによるバイナリの混合は、ワークをより強く、より多様なものにすることによって、結果を向上します。
実装が容易で、推論にコストがかかることに加えて、我々のモデルはよりコストの高いデータ拡張深層アンサンブルよりも優れています。
論文 参考訳(メタデータ) (2021-03-10T15:31:02Z) - ResizeMix: Mixing Data with Preserved Object Information and True Labels [57.00554495298033]
本研究は,データ混合におけるサリエンシー情報の重要性について検討し,サリエンシー情報は増補性能向上のために必要ではないことを見出した。
本稿では,より効率的で実装が容易なresizemix法を提案する。
論文 参考訳(メタデータ) (2020-12-21T03:43:13Z) - SnapMix: Semantically Proportional Mixing for Augmenting Fine-grained
Data [124.95585891086894]
提案はSemantically Proportional Mixing(SnapMix)と呼ばれる
クラスアクティベーションマップ(CAM)を利用して、きめ細かいデータを強化する際にラベルノイズを低減します。
本手法は既存の混合型アプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2020-12-09T03:37:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。