論文の概要: A Unified Framework for Generative Data Augmentation: A Comprehensive
Survey
- arxiv url: http://arxiv.org/abs/2310.00277v1
- Date: Sat, 30 Sep 2023 07:01:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 05:34:19.618481
- Title: A Unified Framework for Generative Data Augmentation: A Comprehensive
Survey
- Title(参考訳): 生成データ拡張のための統一フレームワーク: 総合的な調査
- Authors: Yunhao Chen and Zihui Yan and Yunjie Zhu
- Abstract要約: GDA(Generative Data Augmentation)は、機械学習アプリケーションにおけるデータの不足を軽減するための有望なテクニックとして登場した。
この論文は、GDAランドスケープの総合的な調査と統合されたフレームワークを提示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative data augmentation (GDA) has emerged as a promising technique to
alleviate data scarcity in machine learning applications. This thesis presents
a comprehensive survey and unified framework of the GDA landscape. We first
provide an overview of GDA, discussing its motivation, taxonomy, and key
distinctions from synthetic data generation. We then systematically analyze the
critical aspects of GDA - selection of generative models, techniques to utilize
them, data selection methodologies, validation approaches, and diverse
applications. Our proposed unified framework categorizes the extensive GDA
literature, revealing gaps such as the lack of universal benchmarks. The thesis
summarises promising research directions, including , effective data selection,
theoretical development for large-scale models' application in GDA and
establishing a benchmark for GDA. By laying a structured foundation, this
thesis aims to nurture more cohesive development and accelerate progress in the
vital arena of generative data augmentation.
- Abstract(参考訳): ジェネレイティブデータ拡張(gda)は、機械学習アプリケーションにおけるデータの不足を緩和するための有望な技術として登場した。
本論文は,gda景観の包括的調査と統一的枠組みを提案する。
まず、GDAの概要を説明し、その動機、分類、および合成データ生成との大きな違いについて論じる。
次に,gdaの重要側面である生成モデルの選択,それらを利用する手法,データ選択手法,検証手法,多様な応用について体系的に分析する。
提案する統一フレームワークは,GDAの広範な文献を分類し,普遍ベンチマークの欠如などのギャップを明らかにする。
この論文は、有効なデータ選択、GDAにおける大規模モデルの応用の理論開発、GDAのベンチマークの確立など、有望な研究方向性を要約している。
この論文は、構造的基盤を築き、より密着的な発達を育み、生成的データ増強の重要な領域の進展を加速することを目的としている。
関連論文リスト
- Retrieval-Augmented Generation for Large Language Models: A Survey [19.139461618363605]
大きな言語モデル(LLM)は重要な能力を示すが、幻覚、時代遅れの知識、不透明で追跡不能な推論プロセスといった課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - A Comprehensive Survey on Generative Diffusion Models for Structured
Data [0.0]
生成拡散モデルは 深層生成モデルにおいて 急激なパラダイムシフトを達成しました
構造化データは、ディープラーニング研究コミュニティから比較的限られた注目を集めている。
このレビューは、構造化データの生成拡散モデルの発展を促進する研究コミュニティの触媒となる。
論文 参考訳(メタデータ) (2023-06-07T04:26:41Z) - A Comprehensive Survey on Source-free Domain Adaptation [69.17622123344327]
ソースフリードメイン適応(SFDA)の研究は近年注目を集めている。
SFDAの最近の進歩を包括的に調査し、それらを統一的な分類体系に整理する。
一般的な3つの分類基準で30以上のSFDA法を比較検討した。
論文 参考訳(メタデータ) (2023-02-23T06:32:09Z) - Data Augmentation on Graphs: A Survey [9.707882923707414]
グラフ表現学習は、低品質のデータ問題に悩まされている間、目覚ましい成功を収めた。
コンピュータビジョンにおけるデータ品質向上のための成熟した技術として、データ拡張はグラフ領域においても注目を集めている。
本稿では,既存のグラフデータ拡張(GDAug)技術について概観し,要約する。
論文 参考訳(メタデータ) (2022-12-20T02:51:28Z) - A Pipeline for Analysing Grant Applications [0.0]
本稿では,提案手法が意図した革新的なプロジェクト提案を効果的に識別するかどうかを考察する。
グラント申請は、レビュアーが割り当てた「特定の革新と創造性」(IC)スコアを含むピアレビューされた研究提案である。
本稿では,特徴を符号化した文書上のランダムフォレスト(RF)分類器として,最高の性能を持つモデルを提案する。
論文 参考訳(メタデータ) (2022-10-30T13:43:53Z) - Domain Generalization: A Survey [146.68420112164577]
ドメイン一般化(DG)は、モデル学習にソースドメインデータを使用するだけでOOD一般化を実現することを目的としています。
初めて、DGの10年の開発をまとめるために包括的な文献レビューが提供されます。
論文 参考訳(メタデータ) (2021-03-03T16:12:22Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z) - CoDA: Contrast-enhanced and Diversity-promoting Data Augmentation for
Natural Language Understanding [67.61357003974153]
我々はCoDAと呼ばれる新しいデータ拡張フレームワークを提案する。
CoDAは、複数の変換を有機的に統合することで、多種多様な情報付加例を合成する。
すべてのデータサンプルのグローバルな関係を捉えるために、対照的な正則化の目的を導入する。
論文 参考訳(メタデータ) (2020-10-16T23:57:03Z) - Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。
G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。
分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文 参考訳(メタデータ) (2020-04-24T06:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。