論文の概要: A Comprehensive Survey of Image Augmentation Techniques for Deep
Learning
- arxiv url: http://arxiv.org/abs/2205.01491v1
- Date: Tue, 3 May 2022 13:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 14:25:04.691253
- Title: A Comprehensive Survey of Image Augmentation Techniques for Deep
Learning
- Title(参考訳): 深層学習のための画像拡張技術の包括的調査
- Authors: Mingle Xu and Sook Yoon and Alvaro Fuentes and Dong Sun Park
- Abstract要約: ディープラーニングは、大量の画像を必要とするコンピュータビジョンにおいて、まともなパフォーマンスを実現している。
この問題を緩和するために、多くの画像拡張アルゴリズムが効率的かつ効率的な戦略として提案されている。
本稿では,深層学習のための画像拡張に関する包括的調査を行い,新しい情報的分類法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning has been achieving decent performance in computer vision
requiring a large volume of images, however, collecting images is expensive and
difficult in many scenarios. To alleviate this issue, many image augmentation
algorithms have been proposed as effective and efficient strategies.
Understanding current algorithms is essential to find suitable methods or
develop novel techniques for given tasks. In this paper, we perform a
comprehensive survey on image augmentation for deep learning with a novel
informative taxonomy. To get the basic idea why we need image augmentation, we
introduce the challenges in computer vision tasks and vicinity distribution.
Then, the algorithms are split into three categories; model-free, model-based,
and optimizing policy-based. The model-free category employs image processing
methods while the model-based method leverages trainable image generation
models. In contrast, the optimizing policy-based approach aims to find the
optimal operations or their combinations. Furthermore, we discuss the current
trend of common applications with two more active topics, leveraging different
ways to understand image augmentation, such as group and kernel theory, and
deploying image augmentation for unsupervised learning. Based on the analysis,
we believe that our survey gives a better understanding helpful to choose
suitable methods or design novel algorithms for practical applications.
- Abstract(参考訳): ディープラーニングは、大量の画像を必要とするコンピュータビジョンでまともなパフォーマンスを達成しているが、画像の収集は多くのシナリオにおいて高価で困難である。
この問題を解決するために、多くの画像拡張アルゴリズムが効率的かつ効率的な戦略として提案されている。
現在のアルゴリズムを理解することは、与えられたタスクに適した方法を見つけたり、新しい技術を開発するのに不可欠である。
本稿では,深層学習のための画像拡張に関する包括的調査を行い,新しい情報的分類法を提案する。
画像拡張がなぜ必要かという基本的な理解を得るために,コンピュータビジョンタスクと周辺分布における課題を紹介する。
次に、アルゴリズムはモデルフリー、モデルベース、ポリシーベース最適化の3つのカテゴリに分けられる。
モデルフリーカテゴリは画像処理手法を、モデルベースカテゴリはトレーニング可能な画像生成モデルを利用する。
対照的に、ポリシーベースアプローチの最適化は、最適なオペレーションやそれらの組み合わせを見つけることを目的としている。
さらに,よりアクティブなトピックとして,グループやカーネル理論などの画像拡張の理解方法の相違,教師なし学習のための画像拡張の展開など,共通アプリケーションの現状について論じる。
この分析から,本調査は,実践的な応用に最適な手法の選択や,新しいアルゴリズムの設計に有効であると考えられる。
関連論文リスト
- Unsupervised Deep Learning-based Pansharpening with Jointly-Enhanced
Spectral and Spatial Fidelity [4.425982186154401]
本稿では,この手法の可能性をフル活用した,ディープラーニングに基づくパンシャーピングモデルを提案する。
提案モデルでは,パンシャーペンデータのスペクトルと空間的品質を協調的に向上する新たな損失関数を特徴とする。
挑戦的なシナリオで実施された多種多様なテスト画像の実験により,提案手法が技術状況と良好に比較できることが実証された。
論文 参考訳(メタデータ) (2023-07-26T17:25:28Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - Genetic Programming-Based Evolutionary Deep Learning for Data-Efficient
Image Classification [3.9310727060473476]
本稿では,データ効率のよい画像分類のための遺伝的プログラミングに基づく進化的深層学習手法を提案する。
この新しいアプローチは、画像領域と分類領域の両方から多くの重要な演算子を使用して、変数長モデルを自動的に進化させることができる。
フレキシブルな多層表現により、新しいアプローチは、タスクごとに浅いモデルや深いモデルやツリーを自動的に構築できる。
論文 参考訳(メタデータ) (2022-09-27T08:10:16Z) - Augmentation Learning for Semi-Supervised Classification [13.519613713213277]
本稿では,特定のデータセットに対して最も効果的なデータ拡張ポリシーを自動選択する半教師付き学習手法を提案する。
ImageNet以外のデータセットへの拡張にポリシー学習をどのように適用できるかを示す。
論文 参考訳(メタデータ) (2022-08-03T10:06:51Z) - TeachAugment: Data Augmentation Optimization Using Teacher Knowledge [11.696069523681178]
本稿では,TeachAugment と呼ばれる逆戦略に基づくデータ拡張最適化手法を提案する。
画像分類,セマンティックセグメンテーション,教師なし表現学習において,TeachAugmentは既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-25T06:22:51Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z) - NAS-DIP: Learning Deep Image Prior with Neural Architecture Search [65.79109790446257]
近年の研究では、深部畳み込みニューラルネットワークの構造が、以前に構造化された画像として利用できることが示されている。
我々は,より強い画像の先行を捉えるニューラルネットワークの探索を提案する。
既存のニューラルネットワーク探索アルゴリズムを利用して,改良されたネットワークを探索する。
論文 参考訳(メタデータ) (2020-08-26T17:59:36Z) - Depth image denoising using nuclear norm and learning graph model [107.51199787840066]
グループベース画像復元法は,パッチ間の類似性収集に有効である。
各パッチに対して、検索ウィンドウ内で最もよく似たパッチを見つけ、グループ化する。
提案手法は, 主観的, 客観的両面において, 最先端の復調法よりも優れている。
論文 参考訳(メタデータ) (2020-08-09T15:12:16Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。