論文の概要: A Survey of Automated Data Augmentation Algorithms for Deep
Learning-based Image Classication Tasks
- arxiv url: http://arxiv.org/abs/2206.06544v1
- Date: Tue, 14 Jun 2022 01:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-16 07:27:59.809209
- Title: A Survey of Automated Data Augmentation Algorithms for Deep
Learning-based Image Classication Tasks
- Title(参考訳): 深層学習に基づく画像古典化タスクのための自動データ拡張アルゴリズムの検討
- Authors: Zihan Yang, Richard O. Sinnott, James Bailey, Qiuhong Ke
- Abstract要約: データ駆動技術であるディープモデルは、大量の正確なラベル付きトレーニングデータを必要とします。
Data Augmentation (DA)は、オリジナルのサンプルから新しいイメージを人工的に生成することができる。
データ拡張戦略はデータセットによって異なり、さまざまなデータ型がモデルのトレーニングを容易にするために異なる拡張を必要とする可能性がある。
AutoDAモデルの目的は、モデルの性能向上を最大化できる最適なDAポリシーを見つけることである。
- 参考スコア(独自算出の注目度): 21.557543146853174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, one of the most popular techniques in the computer vision
community has been the deep learning technique. As a data-driven technique,
deep model requires enormous amounts of accurately labelled training data,
which is often inaccessible in many real-world applications. A data-space
solution is Data Augmentation (DA), that can artificially generate new images
out of original samples. Image augmentation strategies can vary by dataset, as
different data types might require different augmentations to facilitate model
training. However, the design of DA policies has been largely decided by the
human experts with domain knowledge, which is considered to be highly
subjective and error-prone. To mitigate such problem, a novel direction is to
automatically learn the image augmentation policies from the given dataset
using Automated Data Augmentation (AutoDA) techniques. The goal of AutoDA
models is to find the optimal DA policies that can maximize the model
performance gains. This survey discusses the underlying reasons of the
emergence of AutoDA technology from the perspective of image classification. We
identify three key components of a standard AutoDA model: a search space, a
search algorithm and an evaluation function. Based on their architecture, we
provide a systematic taxonomy of existing image AutoDA approaches. This paper
presents the major works in AutoDA field, discussing their pros and cons, and
proposing several potential directions for future improvements.
- Abstract(参考訳): 近年、コンピュータビジョンコミュニティでもっとも人気のある技術の一つがディープラーニング技術である。
データ駆動のテクニックとして、深層モデルは大量の正確なラベル付きトレーニングデータを必要とする。
データスペースソリューションは、オリジナルのサンプルから人工的に新しい画像を生成するデータ拡張(da)である。
画像拡張戦略はデータセットによって異なり、異なるデータ型はモデルのトレーニングを容易にするために異なる拡張を必要とする可能性がある。
しかし、DAポリシーの設計はドメイン知識を持つ人間の専門家によって決定され、それは非常に主観的でエラーを起こしやすいと考えられている。
このような問題を解決するために、automated data augmentation (autoda) 技術を用いて、与えられたデータセットから画像拡張ポリシーを自動的に学習する。
AutoDAモデルの目的は、モデルの性能向上を最大化できる最適なDAポリシーを見つけることである。
本研究は,画像分類の観点からautoda技術の出現の根本的要因について考察する。
我々は,標準AutoDAモデルの3つの重要な構成要素,探索空間,探索アルゴリズム,評価関数を同定する。
彼らのアーキテクチャに基づいて、既存のイメージオートダアプローチを体系的に分類する。
本稿では, オートダ分野における研究成果を概説し, 長所と短所について議論し, 今後の改善に向けたいくつかの可能性の提案を行う。
関連論文リスト
- Augmentation Policy Generation for Image Classification Using Large Language Models [3.038642416291856]
本稿では,大規模言語モデルを用いて効率的な拡張ポリシーを自動生成する戦略を提案する。
提案手法は医用画像データセットを用いて評価され,最先端の手法よりも明確な改善が見られた。
論文 参考訳(メタデータ) (2024-10-17T11:26:10Z) - 3D-VirtFusion: Synthetic 3D Data Augmentation through Generative Diffusion Models and Controllable Editing [52.68314936128752]
本研究では,事前学習された大規模基盤モデルのパワーを活用して,3次元ラベル付きトレーニングデータを自動的に生成する新しいパラダイムを提案する。
各ターゲットセマンティッククラスに対して、まず、拡散モデルとチャットGPT生成したテキストプロンプトを介して、様々な構造と外観の1つのオブジェクトの2D画像を生成する。
我々は、これらの拡張画像を3Dオブジェクトに変換し、ランダムな合成によって仮想シーンを構築する。
論文 参考訳(メタデータ) (2024-08-25T09:31:22Z) - Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.2719115566879236]
拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。
DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。
この分野における現在の課題と今後の研究方向性について論じる。
論文 参考訳(メタデータ) (2024-07-04T18:06:48Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - A survey of synthetic data augmentation methods in computer vision [0.0]
本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文 参考訳(メタデータ) (2024-03-15T07:34:08Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - DINOv2: Learning Robust Visual Features without Supervision [75.42921276202522]
この研究は、既存の事前学習手法、特に自己教師付き手法が、多様なソースから十分なキュレートされたデータで訓練すれば、そのような特徴を生み出すことができることを示している。
技術的な貢献の多くは、大規模なトレーニングを加速し、安定化することを目的としています。
データの観点からは、自己組織化されていないデータではなく、専用で多様でキュレートされた画像データセットを構築するための自動パイプラインを提案する。
論文 参考訳(メタデータ) (2023-04-14T15:12:19Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Joint Progressive Knowledge Distillation and Unsupervised Domain
Adaptation [15.115086812609182]
そこで本研究では,CNNの協調最適化手法として,対象領域に適合する圧縮モデルを提案する。
提案手法は,Office31 と ImageClef-DA の2種類の UDA 分類データセットを用いて,最先端圧縮と UDA 技術との比較を行った。
論文 参考訳(メタデータ) (2020-05-16T01:07:03Z) - DADA: Differentiable Automatic Data Augmentation [58.560309490774976]
コストを大幅に削減する微分可能自動データ拡張(DADA)を提案する。
CIFAR-10, CIFAR-100, SVHN, ImageNetのデータセットについて広範な実験を行った。
その結果,DADAは最先端技術よりも1桁以上高速であり,精度は極めて高いことがわかった。
論文 参考訳(メタデータ) (2020-03-08T13:23:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。