論文の概要: Automatic Data Augmentation via Invariance-Constrained Learning
- arxiv url: http://arxiv.org/abs/2209.15031v2
- Date: Fri, 15 Sep 2023 19:51:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 01:31:28.788591
- Title: Automatic Data Augmentation via Invariance-Constrained Learning
- Title(参考訳): 不変制約学習による自動データ拡張
- Authors: Ignacio Hounie, Luiz F. O. Chamon, Alejandro Ribeiro
- Abstract要約: 下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
- 参考スコア(独自算出の注目度): 94.27081585149836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underlying data structures, such as symmetries or invariances to
transformations, are often exploited to improve the solution of learning tasks.
However, embedding these properties in models or learning algorithms can be
challenging and computationally intensive. Data augmentation, on the other
hand, induces these symmetries during training by applying multiple
transformations to the input data. Despite its ubiquity, its effectiveness
depends on the choices of which transformations to apply, when to do so, and
how often. In fact, there is both empirical and theoretical evidence that the
indiscriminate use of data augmentation can introduce biases that outweigh its
benefits. This work tackles these issues by automatically adapting the data
augmentation while solving the learning task. To do so, it formulates data
augmentation as an invariance-constrained learning problem and leverages Monte
Carlo Markov Chain (MCMC) sampling to solve it. The result is a practical
algorithm that not only does away with a priori searches for augmentation
distributions, but also dynamically controls if and when data augmentation is
applied. Our experiments illustrate the performance of this method, which
achieves state-of-the-art results in automatic data augmentation benchmarks for
CIFAR datasets. Furthermore, this approach can be used to gather insights on
the actual symmetries underlying a learning task.
- Abstract(参考訳): 対称性や変換への不変といった下層データ構造は、しばしば学習タスクのソリューションを改善するために利用される。
しかし、これらの特性をモデルや学習アルゴリズムに組み込むことは、困難で計算集約的です。
一方、データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
ユビキタスであるにもかかわらず、その有効性は、どの変換を適用するか、いつ、どれくらい頻度で適用するかの選択に依存する。
実際、データ拡張の無差別な使用が、その利点を上回るバイアスをもたらすという経験的および理論的証拠がある。
この作業は、学習タスクを解きながら、データ拡張を自動的に適応することで、これらの問題に取り組む。
そのため、データの増大を不変制約学習問題として定式化し、モンテカルロ・マルコフ・チェイン(MCMC)サンプリングを利用して解決する。
その結果,データ拡張分布の事前検索を廃止するだけでなく,データ拡張が適用された場合に動的に制御する実用的なアルゴリズムが得られた。
実験では,CIFARデータセットの自動データ拡張ベンチマークにおいて,最新の結果が得られる手法の性能について述べる。
さらに、このアプローチは学習タスクの基礎となる実際の対称性についての洞察を集めるのに使うことができる。
関連論文リスト
- Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.242331892899543]
学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T00:25:07Z) - On Counterfactual Data Augmentation Under Confounding [30.76982059341284]
トレーニングデータのバイアスを緩和する手段として、対実データ拡張が出現している。
これらのバイアスは、データ生成プロセスにおいて観測され、観測されていない様々な共役変数によって生じる。
提案手法は,既存の最先端手法が優れた結果を得るのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2023-05-29T16:20:23Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - Personalized Decentralized Multi-Task Learning Over Dynamic
Communication Graphs [59.96266198512243]
本稿では,正と負の相関関係を持つタスクに対する分散・フェデレーション学習アルゴリズムを提案する。
本アルゴリズムでは,タスク間の相関関係を自動的に計算し,コミュニケーショングラフを動的に調整して相互に有益なタスクを接続し,互いに悪影響を及ぼす可能性のあるタスクを分離する。
合成ガウスデータセットと大規模セレブ属性(CelebA)データセットについて実験を行った。
論文 参考訳(メタデータ) (2022-12-21T18:58:24Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z) - CADDA: Class-wise Automatic Differentiable Data Augmentation for EEG
Signals [92.60744099084157]
本研究では、勾配に基づく学習に適した微分可能データ拡張を提案する。
本研究は,臨床関連睡眠ステージ分類課題におけるアプローチの意義を示す。
論文 参考訳(メタデータ) (2021-06-25T15:28:48Z) - Robust Representation Learning via Perceptual Similarity Metrics [18.842322467828502]
Contrastive Input Morphing (CIM) はデータの入力空間変換を学習する表現学習フレームワークである。
CIMは他の相互情報に基づく表現学習技術と相補的であることを示す。
論文 参考訳(メタデータ) (2021-06-11T21:45:44Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。