論文の概要: DivAug: Plug-in Automated Data Augmentation with Explicit Diversity
Maximization
- arxiv url: http://arxiv.org/abs/2103.14545v1
- Date: Fri, 26 Mar 2021 16:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:40:35.178466
- Title: DivAug: Plug-in Automated Data Augmentation with Explicit Diversity
Maximization
- Title(参考訳): DivAug: 明示的な多様性の最大化によるプラグインの自動データ拡張
- Authors: Zirui Liu, Haifeng Jin, Ting-Hsiang Wang, Kaixiong Zhou, Xia Hu
- Abstract要約: 拡張データの多様性に関する2つの要因はまだ欠けている:1)多様性の明示的な定義(したがって測定)と2)多様性とその正規化効果の定量化可能な関係。
分散多様性(Variance Diversity)と呼ばれる多様性尺度を提案し、理論的にはデータ拡張の正規化効果がVariance Diversityによって約束されることを示した。
監視されていないサンプリングベースのフレームワークであるDivAugは、Variance Diversityを直接最大化し、正規化効果を強化するように設計されています。
- 参考スコア(独自算出の注目度): 41.82120128496555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-designed data augmentation strategies have been replaced by
automatically learned augmentation policy in the past two years. Specifically,
recent work has empirically shown that the superior performance of the
automated data augmentation methods stems from increasing the diversity of
augmented data. However, two factors regarding the diversity of augmented data
are still missing: 1) the explicit definition (and thus measurement) of
diversity and 2) the quantifiable relationship between diversity and its
regularization effects. To bridge this gap, we propose a diversity measure
called Variance Diversity and theoretically show that the regularization effect
of data augmentation is promised by Variance Diversity. We validate in
experiments that the relative gain from automated data augmentation in test
accuracy is highly correlated to Variance Diversity. An unsupervised
sampling-based framework, DivAug, is designed to directly maximize Variance
Diversity and hence strengthen the regularization effect. Without requiring a
separate search process, the performance gain from DivAug is comparable with
the state-of-the-art method with better efficiency. Moreover, under the
semi-supervised setting, our framework can further improve the performance of
semi-supervised learning algorithms when compared to RandAugment, making it
highly applicable to real-world problems, where labeled data is scarce.
- Abstract(参考訳): 人間の設計したデータ拡張戦略は、過去2年間に自動的に学習された拡張ポリシーに置き換えられた。
特に、最近の研究は、自動データ拡張手法の優れた性能が、拡張データの多様性の向上に起因することを実証的に示している。
しかし, 拡張データの多様性に関する2つの要因は, 1) 多様性の明示的な定義(および測定), 2) 多様性と正規化効果の定量化の関係である。
このギャップを埋めるため,変数多様性と呼ばれる多様性尺度を提案し,データ拡張の正規化効果が変数多様性によって約束されることを示す。
テスト精度における自動データ拡張による相対的な利益は分散多様性と高い相関関係にあることを実験で検証した。
教師なしサンプリングベースのフレームワークDivAugは、変数の多様性を直接最大化し、従って正規化効果を強化するように設計されている。
個別の検索プロセスを必要としないため、DivAugのパフォーマンス向上は最先端の手法に匹敵し、効率が良い。
さらに,半教師付き環境下では,RandAugmentと比較してセミ教師付き学習アルゴリズムの性能が向上し,ラベル付きデータが乏しい実世界の問題にも高い適用性が期待できる。
関連論文リスト
- $\textbf{Only-IF}$:Revealing the Decisive Effect of Instruction Diversity on Generalization [1.6958018695660049]
トレーニングデータがセマンティックドメインで十分に分散されている場合、textbfonlyが$であることを示す。
例えば$textit$textbfspecialist$$と$textit$textbf generalist$$$モデルの微調整などです。
論文 参考訳(メタデータ) (2024-10-07T03:15:11Z) - DualAug: Exploiting Additional Heavy Augmentation with OOD Data
Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。
教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文 参考訳(メタデータ) (2023-10-12T08:55:10Z) - Source-free Domain Adaptation Requires Penalized Diversity [60.04618512479438]
ソースデータがない場合、異なるドメイン間の知識伝達に対処するために、ソースフリードメイン適応(SFDA)が導入された。
教師なしのFDAでは、多様性はソース上の1つの仮説を学習するか、共有された特徴抽出器で複数の仮説を学習することに限定される。
本稿では,異なる特徴抽出器を用いて表現多様性を促進する新しい無教師付きSFDAアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-06T00:20:19Z) - RangeAugment: Efficient Online Augmentation with Range Learning [54.61514286212455]
RangeAugmentは、個々の大きさと複合オーグメンテーション操作を効率よく学習する。
本研究では,RangeAugmentの4~5倍の精度で,最先端自動拡張手法の競争性能が向上することを示す。
論文 参考訳(メタデータ) (2022-12-20T18:55:54Z) - Automatic Data Augmentation Selection and Parametrization in Contrastive
Self-Supervised Speech Representation Learning [21.423349835589793]
本研究では, 事前定義された値集合から, 拡張選択とそのパラメトリゼーションに関する適切な分布を自動的に選択できる条件付き独立性に基づく手法を提案する。
2つの異なる下流タスクで実施された実験は、拡張やベースライン拡張を伴わない実験よりも優れた結果を示す提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-04-08T16:30:50Z) - Learning Representational Invariances for Data-Efficient Action
Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文 参考訳(メタデータ) (2021-03-30T17:59:49Z) - CoDA: Contrast-enhanced and Diversity-promoting Data Augmentation for
Natural Language Understanding [67.61357003974153]
我々はCoDAと呼ばれる新しいデータ拡張フレームワークを提案する。
CoDAは、複数の変換を有機的に統合することで、多種多様な情報付加例を合成する。
すべてのデータサンプルのグローバルな関係を捉えるために、対照的な正則化の目的を導入する。
論文 参考訳(メタデータ) (2020-10-16T23:57:03Z) - Affinity and Diversity: Quantifying Mechanisms of Data Augmentation [25.384464387734802]
親和性と多様性(Affinity and Diversity)。
拡張性能は,いずれか単独で予測されるのではなく,共同最適化によって予測される。
論文 参考訳(メタデータ) (2020-02-20T19:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。