論文の概要: A Comprehensive Survey of Image Augmentation Techniques for Deep
Learning
- arxiv url: http://arxiv.org/abs/2205.01491v1
- Date: Tue, 3 May 2022 13:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 14:25:04.691253
- Title: A Comprehensive Survey of Image Augmentation Techniques for Deep
Learning
- Title(参考訳): 深層学習のための画像拡張技術の包括的調査
- Authors: Mingle Xu and Sook Yoon and Alvaro Fuentes and Dong Sun Park
- Abstract要約: ディープラーニングは、大量の画像を必要とするコンピュータビジョンにおいて、まともなパフォーマンスを実現している。
この問題を緩和するために、多くの画像拡張アルゴリズムが効率的かつ効率的な戦略として提案されている。
本稿では,深層学習のための画像拡張に関する包括的調査を行い,新しい情報的分類法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning has been achieving decent performance in computer vision
requiring a large volume of images, however, collecting images is expensive and
difficult in many scenarios. To alleviate this issue, many image augmentation
algorithms have been proposed as effective and efficient strategies.
Understanding current algorithms is essential to find suitable methods or
develop novel techniques for given tasks. In this paper, we perform a
comprehensive survey on image augmentation for deep learning with a novel
informative taxonomy. To get the basic idea why we need image augmentation, we
introduce the challenges in computer vision tasks and vicinity distribution.
Then, the algorithms are split into three categories; model-free, model-based,
and optimizing policy-based. The model-free category employs image processing
methods while the model-based method leverages trainable image generation
models. In contrast, the optimizing policy-based approach aims to find the
optimal operations or their combinations. Furthermore, we discuss the current
trend of common applications with two more active topics, leveraging different
ways to understand image augmentation, such as group and kernel theory, and
deploying image augmentation for unsupervised learning. Based on the analysis,
we believe that our survey gives a better understanding helpful to choose
suitable methods or design novel algorithms for practical applications.
- Abstract(参考訳): ディープラーニングは、大量の画像を必要とするコンピュータビジョンでまともなパフォーマンスを達成しているが、画像の収集は多くのシナリオにおいて高価で困難である。
この問題を解決するために、多くの画像拡張アルゴリズムが効率的かつ効率的な戦略として提案されている。
現在のアルゴリズムを理解することは、与えられたタスクに適した方法を見つけたり、新しい技術を開発するのに不可欠である。
本稿では,深層学習のための画像拡張に関する包括的調査を行い,新しい情報的分類法を提案する。
画像拡張がなぜ必要かという基本的な理解を得るために,コンピュータビジョンタスクと周辺分布における課題を紹介する。
次に、アルゴリズムはモデルフリー、モデルベース、ポリシーベース最適化の3つのカテゴリに分けられる。
モデルフリーカテゴリは画像処理手法を、モデルベースカテゴリはトレーニング可能な画像生成モデルを利用する。
対照的に、ポリシーベースアプローチの最適化は、最適なオペレーションやそれらの組み合わせを見つけることを目的としている。
さらに,よりアクティブなトピックとして,グループやカーネル理論などの画像拡張の理解方法の相違,教師なし学習のための画像拡張の展開など,共通アプリケーションの現状について論じる。
この分析から,本調査は,実践的な応用に最適な手法の選択や,新しいアルゴリズムの設計に有効であると考えられる。
関連論文リスト
- Masked Image Modeling: A Survey [73.21154550957898]
マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文 参考訳(メタデータ) (2024-08-13T07:27:02Z) - Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.2719115566879236]
拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。
DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。
この分野における現在の課題と今後の研究方向性について論じる。
論文 参考訳(メタデータ) (2024-07-04T18:06:48Z) - One-Shot Image Restoration [0.0]
提案手法の適用性, 堅牢性, 計算効率を, 教師付き画像の劣化と超解像に応用できることを実験的に示す。
本結果は,学習モデルのサンプル効率,一般化,時間複雑性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2024-04-26T14:03:23Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - Augmentation Learning for Semi-Supervised Classification [13.519613713213277]
本稿では,特定のデータセットに対して最も効果的なデータ拡張ポリシーを自動選択する半教師付き学習手法を提案する。
ImageNet以外のデータセットへの拡張にポリシー学習をどのように適用できるかを示す。
論文 参考訳(メタデータ) (2022-08-03T10:06:51Z) - TeachAugment: Data Augmentation Optimization Using Teacher Knowledge [11.696069523681178]
本稿では,TeachAugment と呼ばれる逆戦略に基づくデータ拡張最適化手法を提案する。
画像分類,セマンティックセグメンテーション,教師なし表現学習において,TeachAugmentは既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-25T06:22:51Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z) - Depth image denoising using nuclear norm and learning graph model [107.51199787840066]
グループベース画像復元法は,パッチ間の類似性収集に有効である。
各パッチに対して、検索ウィンドウ内で最もよく似たパッチを見つけ、グループ化する。
提案手法は, 主観的, 客観的両面において, 最先端の復調法よりも優れている。
論文 参考訳(メタデータ) (2020-08-09T15:12:16Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。