論文の概要: Research Trends and Applications of Data Augmentation Algorithms
- arxiv url: http://arxiv.org/abs/2207.08817v1
- Date: Mon, 18 Jul 2022 11:38:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 14:15:32.085764
- Title: Research Trends and Applications of Data Augmentation Algorithms
- Title(参考訳): データ拡張アルゴリズムの研究動向と応用
- Authors: Joao Fonseca, Fernando Bacao
- Abstract要約: 我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In the Machine Learning research community, there is a consensus regarding
the relationship between model complexity and the required amount of data and
computation power. In real world applications, these computational requirements
are not always available, motivating research on regularization methods. In
addition, current and past research have shown that simpler classification
algorithms can reach state-of-the-art performance on computer vision tasks
given a robust method to artificially augment the training dataset. Because of
this, data augmentation techniques became a popular research topic in recent
years. However, existing data augmentation methods are generally less
transferable than other regularization methods. In this paper we identify the
main areas of application of data augmentation algorithms, the types of
algorithms used, significant research trends, their progression over time and
research gaps in data augmentation literature. To do this, the related
literature was collected through the Scopus database. Its analysis was done
following network science, text mining and exploratory analysis approaches. We
expect readers to understand the potential of data augmentation, as well as
identify future research directions and open questions within data augmentation
research.
- Abstract(参考訳): 機械学習研究コミュニティでは、モデルの複雑さと必要なデータ量と計算能力の関係について合意がある。
現実のアプリケーションでは、これらの計算要件は必ずしも利用可能ではなく、正規化手法の研究を動機付けている。
さらに、現在および過去の研究では、より単純な分類アルゴリズムが、トレーニングデータセットを人工的に増強する堅牢な方法によって、コンピュータビジョンタスクにおける最先端のパフォーマンスに達することが示されている。
このため、近年ではデータ拡張技術が研究の話題となっている。
しかし、既存のデータ拡張法は他の正規化法よりも転送可能ではない。
本稿では,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,データ拡張文学における研究ギャップについて述べる。
そのため、関連する文献はスコプスのデータベースを通じて収集された。
その分析は、ネットワーク科学、テキストマイニング、探索分析のアプローチに従って行われた。
我々は、読者がデータ拡張の可能性を理解し、データ拡張研究における将来の研究の方向性や疑問を明らかにすることを期待している。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - A Comprehensive Survey on Data Augmentation [55.355273602421384]
データ拡張(Data augmentation)は、既存のデータサンプルを操作することによって高品質な人工データを生成する技術である。
既存の文献調査では、特定のモダリティデータにのみ焦点が当てられている。
本稿では,異なる共通データモダリティのためのデータ拡張技術を含む,より啓蒙的な分類法を提案する。
論文 参考訳(メタデータ) (2024-05-15T11:58:08Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Mapping Computer Science Research: Trends, Influences, and Predictions [0.0]
我々は、トレンド研究領域を予測するために、決定木やロジスティック回帰モデルを含む高度な機械学習技術を採用している。
分析の結果,研究論文(参照数)に引用される参考資料の数は,トレンド研究領域を決定する上で重要な役割を担っていることが明らかとなった。
ロジスティック回帰モデルは、傾向を予測するために決定木モデルより優れ、高い精度、精度、リコール、F1スコアを示す。
論文 参考訳(メタデータ) (2023-08-01T16:59:25Z) - Advanced Data Augmentation Approaches: A Comprehensive Survey and Future
directions [57.30984060215482]
データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類法、および各技術の強さと弱点(可能ならば)を提供する。
また、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの3つの一般的なコンピュータビジョンタスクに対して、データ拡張効果の総合的な結果を提供する。
論文 参考訳(メタデータ) (2023-01-07T11:37:32Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z) - Deep Generative Modeling in Network Science with Applications to Public
Policy Research [0.0]
ネットワークデータは、量的かつデータ駆動の公共政策研究にますます利用されている。
深層生成法は、マイクロシミュレーションやエージェントベースモデルに有用なリアルな合成ネットワークを生成するために使用できる。
疫学モデルで一般的に使用される大規模社会接触ネットワークに適用可能な,新たな生成フレームワークを開発した。
論文 参考訳(メタデータ) (2020-10-15T16:47:34Z) - Deep Learning for Community Detection: Progress, Challenges and
Opportunities [79.26787486888549]
この記事では、ディープニューラルネットワークにおける様々なフレームワーク、モデル、アルゴリズムの貢献について要約する。
この記事では、ディープニューラルネットワークにおける様々なフレームワーク、モデル、アルゴリズムの貢献について要約する。
論文 参考訳(メタデータ) (2020-05-17T11:22:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。