論文の概要: TdAttenMix: Top-Down Attention Guided Mixup
- arxiv url: http://arxiv.org/abs/2501.15409v1
- Date: Sun, 26 Jan 2025 05:32:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:59:11.649215
- Title: TdAttenMix: Top-Down Attention Guided Mixup
- Title(参考訳): TdAttenMix:トップダウン注意誘導ミックス
- Authors: Zhiming Wang, Lin Gu, Feng Lu,
- Abstract要約: CutMixは、イメージパッチをカット&ペーストしてトレーニングデータをミックスアップするデータ拡張戦略である。
私たちの知る限り、私たちは初めてヒトの視線を統合してカットミックスをガイドします。
本稿では,人間の視線に基づく新しい測度を導入し,この測度を用いて画像ラベルの不整合の問題を調査する。
- 参考スコア(独自算出の注目度): 15.928932537722575
- License:
- Abstract: CutMix is a data augmentation strategy that cuts and pastes image patches to mixup training data. Existing methods pick either random or salient areas which are often inconsistent to labels, thus misguiding the training model. By our knowledge, we integrate human gaze to guide cutmix for the first time. Since human attention is driven by both high-level recognition and low-level clues, we propose a controllable Top-down Attention Guided Module to obtain a general artificial attention which balances top-down and bottom-up attention. The proposed TdATttenMix then picks the patches and adjust the label mixing ratio that focuses on regions relevant to the current label. Experimental results demonstrate that our TdAttenMix outperforms existing state-of-the-art mixup methods across eight different benchmarks. Additionally, we introduce a new metric based on the human gaze and use this metric to investigate the issue of image-label inconsistency. Project page: \url{https://github.com/morning12138/TdAttenMix}
- Abstract(参考訳): CutMixは、イメージパッチをカット&ペーストしてトレーニングデータをミックスアップするデータ拡張戦略である。
既存の手法は、しばしばラベルと矛盾するランダムまたは健全な領域を選択し、トレーニングモデルを誤解させる。
私たちの知る限り、私たちは初めてヒトの視線を統合してカットミックスをガイドします。
人間の注意は高いレベルの認識と低レベルの手がかりの両方によって駆動されるため,トップダウンとボトムアップの両方の注意をバランスさせる一般的な人工的な注意を得るために,制御可能なトップダウン注意誘導モジュールを提案する。
提案したTdATttenMixはパッチを選択し、現在のラベルに関連する領域に焦点を当てたラベルの混合率を調整する。
実験の結果、TdAttenMixは8つのベンチマークで既存の最先端の混合手法よりも優れていることが示された。
さらに,人間の視線に基づく新しい指標を導入し,この指標を用いて画像ラベルの不整合の問題を調査する。
プロジェクトページ: \url{https://github.com/morning12138/TdAttenMix}
関連論文リスト
- SUMix: Mixup with Semantic and Uncertain Information [41.99721365685618]
混合データ拡張アプローチは、ディープラーニングの様々なタスクに応用されている。
そこで我々は,SUMix という新しい手法を提案し,混合率と混合試料の不確かさを学習する。
論文 参考訳(メタデータ) (2024-07-10T16:25:26Z) - AttentionMix: Data augmentation method that relies on BERT attention
mechanism [0.0]
本稿では,注意情報に依存する新しい混合手法であるAttentionMixを紹介する。
AttentionMixは3つの標準感情分類データセットで評価される。
その結果,NLP領域におけるデータ拡張において,注意に基づく情報を効果的に活用できることが確認された。
論文 参考訳(メタデータ) (2023-09-20T07:18:53Z) - SMMix: Self-Motivated Image Mixing for Vision Transformers [65.809376136455]
CutMixは視覚変換器(ViT)の性能と一般化能力を決定する重要な拡張戦略である
既存のCutMixの変種は、より一貫性のある混合画像やより正確な混合ラベルを生成することでこの問題に対処している。
本稿では,学習モデルによる画像とラベルの強調を動機づける,効率的かつ効果的な自己運動画像混合法を提案する。
論文 参考訳(メタデータ) (2022-12-26T00:19:39Z) - Expeditious Saliency-guided Mix-up through Random Gradient Thresholding [89.59134648542042]
混合学習アプローチはディープニューラルネットワークの一般化能力向上に有効であることが証明されている。
本稿では,両経路の分岐点に位置する新しい手法を提案する。
我々はR-Mixという手法を「Random Mix-up」という概念にちなむ。
より良い意思決定プロトコルが存在するかどうかという問題に対処するために、我々は、ミックスアップポリシーを決定する強化学習エージェントを訓練する。
論文 参考訳(メタデータ) (2022-12-09T14:29:57Z) - A Unified Analysis of Mixed Sample Data Augmentation: A Loss Function
Perspective [24.33244008451489]
混合サンプルデータ拡張(MSDA)の最初の統一的理論解析を提案する。
理論的結果から,MSDAは混合戦略の選択によらず,基礎となるトレーニング損失の画素レベルの正則化として振る舞うことが示唆された。
私たちの実装はMixupとCutMixの利点を活用できますが、実装は非常に効率的です。
論文 参考訳(メタデータ) (2022-08-21T15:54:25Z) - ResizeMix: Mixing Data with Preserved Object Information and True Labels [57.00554495298033]
本研究は,データ混合におけるサリエンシー情報の重要性について検討し,サリエンシー情報は増補性能向上のために必要ではないことを見出した。
本稿では,より効率的で実装が容易なresizemix法を提案する。
論文 参考訳(メタデータ) (2020-12-21T03:43:13Z) - SnapMix: Semantically Proportional Mixing for Augmenting Fine-grained
Data [124.95585891086894]
提案はSemantically Proportional Mixing(SnapMix)と呼ばれる
クラスアクティベーションマップ(CAM)を利用して、きめ細かいデータを強化する際にラベルノイズを低減します。
本手法は既存の混合型アプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2020-12-09T03:37:30Z) - MixText: Linguistically-Informed Interpolation of Hidden Space for
Semi-Supervised Text Classification [68.15015032551214]
MixTextはテキスト分類のための半教師付き学習手法である。
TMixは、隠れた空間でテキストを補間することで、大量の拡張トレーニングサンプルを生成する。
我々は、ラベルなしデータの低エントロピーラベルを推測するために、最近のデータ拡張の進歩を活用している。
論文 参考訳(メタデータ) (2020-04-25T21:37:36Z) - DivideMix: Learning with Noisy Labels as Semi-supervised Learning [111.03364864022261]
ノイズラベルを学習するためのフレームワークであるDivideMixを提案する。
複数のベンチマークデータセットの実験は、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2020-02-18T06:20:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。