論文の概要: G-Augment: Searching For The Meta-Structure Of Data Augmentation
Policies For ASR
- arxiv url: http://arxiv.org/abs/2210.10879v1
- Date: Wed, 19 Oct 2022 20:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 14:06:30.543986
- Title: G-Augment: Searching For The Meta-Structure Of Data Augmentation
Policies For ASR
- Title(参考訳): G-Augment:ASRのデータ拡張ポリシーのメタ構造を検索
- Authors: Gary Wang, Ekin D.Cubuk, Andrew Rosenberg, Shuyang Cheng, Ron J.
Weiss, Bhuvana Ramabhadran, Pedro J. Moreno, Quoc V. Le, Daniel S. Park
- Abstract要約: Graph-Augmentは拡張空間を有向非巡回グラフ(DAG)として定義する手法である
我々は,G-Augment が作成するポリシが,計算予算が同じである場合,微調整タスクにおける SpecAugment のポリシーよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 85.5426366121322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is a ubiquitous technique used to provide robustness to
automatic speech recognition (ASR) training. However, even as so much of the
ASR training process has become automated and more "end-to-end", the data
augmentation policy (what augmentation functions to use, and how to apply them)
remains hand-crafted. We present Graph-Augment, a technique to define the
augmentation space as directed acyclic graphs (DAGs) and search over this space
to optimize the augmentation policy itself. We show that given the same
computational budget, policies produced by G-Augment are able to perform better
than SpecAugment policies obtained by random search on fine-tuning tasks on
CHiME-6 and AMI. G-Augment is also able to establish a new state-of-the-art ASR
performance on the CHiME-6 evaluation set (30.7% WER). We further demonstrate
that G-Augment policies show better transfer properties across warm-start to
cold-start training and model size compared to random-searched SpecAugment
policies.
- Abstract(参考訳): データ拡張は、自動音声認識(ASR)訓練に堅牢性を提供するために使われるユビキタスなテクニックである。
しかし、多くのASRトレーニングプロセスが自動化され、より"エンドツーエンド"になったとしても、データ拡張ポリシー(使用すべき機能と適用方法)は手作業のままである。
本稿では、拡張空間を有向非巡回グラフ(DAG)として定義し、拡張ポリシー自体を最適化するためにこの空間を探索する手法であるグラフ拡張を提案する。
計算予算が同じならば,CHiME-6 および AMI 上の微調整タスクをランダムに探索することで,G-Augment が生成したポリシーが SpecAugment のポリシーより優れていることを示す。
G-Augmentはまた、CHiME-6評価セット(30.7% WER)上で最先端のASRパフォーマンスを確立することができる。
さらに、G-Augmentポリシーは、ランダム検索されたSpecAugmentポリシーと比較して、ウォームスタートからコールドスタートトレーニング、モデルサイズに優れた転送特性を示すことを示す。
関連論文リスト
- Genetic Learning for Designing Sim-to-Real Data Augmentations [1.03590082373586]
データ拡張は、合成データのトレーニングにおいて、sim-to-realドメインギャップを閉じるのに有用である。
多くの画像増強技術があり、強度や確率などの異なる設定でパラメータ化されている。
本稿では、特定のsim-to-real設定に対して、ある拡張ポリシーがどの程度うまく機能するかを予測するために、組み合わせられる2つの異なる解釈可能な指標を提案する。
論文 参考訳(メタデータ) (2024-03-11T15:00:56Z) - Retrieval-Augmented Generation for AI-Generated Content: A Survey [38.50754568320154]
このような課題に対処するためのパラダイムとして,レトリーバル拡張生成(RAG)が登場している。
RAGは情報検索プロセスを導入し、利用可能なデータストアから関連オブジェクトを検索することで生成プロセスを強化する。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
論文 参考訳(メタデータ) (2024-02-29T18:59:01Z) - When to Learn What: Model-Adaptive Data Augmentation Curriculum [32.99634881669643]
本稿では,モデル適応型データ拡張(MADAug)を提案する。
従来の作業とは異なり、MADAugはトレーニング段階によって異なるモデル適応ポリシーにより、各入力画像に対する拡張演算子を選択し、より良い一般化のために最適化されたデータ拡張カリキュラムを生成する。
論文 参考訳(メタデータ) (2023-09-09T10:35:27Z) - RangeAugment: Efficient Online Augmentation with Range Learning [54.61514286212455]
RangeAugmentは、個々の大きさと複合オーグメンテーション操作を効率よく学習する。
本研究では,RangeAugmentの4~5倍の精度で,最先端自動拡張手法の競争性能が向上することを示す。
論文 参考訳(メタデータ) (2022-12-20T18:55:54Z) - Text AutoAugment: Learning Compositional Augmentation Policy for Text
Classification [29.539403965472943]
本研究では,データ拡張のための合成および学習可能なパラダイムを確立するためのフレームワークであるText AutoAugment (TAA)を提案する。
6つのベンチマークデータセットの実験では、TAAは、それぞれ平均8.8%と9.7%の低リソースとクラス不均衡のレギュレーションの分類精度を向上している。
論文 参考訳(メタデータ) (2021-09-01T11:16:21Z) - ParticleAugment: Sampling-Based Data Augmentation [80.44268663372233]
モデルトレーニング中に最適な拡張ポリシーとスケジュールを求めるために,粒子フィルタリングの定式化を提案する。
CIFAR-10, CIFAR-100, ImageNetデータセットにおいて, 自動拡張のための定式化が有望な結果に達することを示す。
論文 参考訳(メタデータ) (2021-06-16T10:56:02Z) - Scale-aware Automatic Augmentation for Object Detection [63.087930708444695]
オブジェクト検出のためのデータ拡張ポリシーを学ぶために,Scale-aware AutoAugを提案する。
実験では、Scale-aware AutoAugはさまざまな物体検出器に有意で一貫した改善をもたらす。
論文 参考訳(メタデータ) (2021-03-31T17:11:14Z) - Adaptive Weighting Scheme for Automatic Time-Series Data Augmentation [79.47771259100674]
データ拡張のための2つのサンプル適応自動重み付けスキームを提案する。
提案手法を大規模でノイズの多い財務データセットとUCRアーカイブからの時系列データセット上で検証する。
金融データセットでは、取引戦略と組み合わせた手法が50 $%$以上の年間収益の改善につながることを示し、時系列データでは、データセットの半分以上で最新モデルを上回るパフォーマンスを発揮し、他のものと同様の精度を達成しています。
論文 参考訳(メタデータ) (2021-02-16T17:50:51Z) - Automatic Data Augmentation for Generalization in Deep Reinforcement
Learning [39.477038093585726]
深層強化学習(RL)エージェントは、しばしば目に見えないシナリオへの一般化に失敗する。
近年,RL剤の試料効率と一般化が向上することが示されている。
エージェントはエージェントに影響を与えない環境の変化に対してより堅牢なポリシーや表現を学ぶ。
論文 参考訳(メタデータ) (2020-06-23T09:50:22Z) - Greedy Policy Search: A Simple Baseline for Learnable Test-Time
Augmentation [65.92151529708036]
我々は,テスト時間拡張のポリシーを学習するための簡易かつ高性能な方法として,greedy Policy Search (GPS)を導入した。
画像分類問題においてGPSで学習した拡張ポリシーが優れた予測性能を実現することを実証する。
論文 参考訳(メタデータ) (2020-02-21T02:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。