論文の概要: A Unified Framework for Generative Data Augmentation: A Comprehensive
Survey
- arxiv url: http://arxiv.org/abs/2310.00277v1
- Date: Sat, 30 Sep 2023 07:01:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 05:34:19.618481
- Title: A Unified Framework for Generative Data Augmentation: A Comprehensive
Survey
- Title(参考訳): 生成データ拡張のための統一フレームワーク: 総合的な調査
- Authors: Yunhao Chen and Zihui Yan and Yunjie Zhu
- Abstract要約: GDA(Generative Data Augmentation)は、機械学習アプリケーションにおけるデータの不足を軽減するための有望なテクニックとして登場した。
この論文は、GDAランドスケープの総合的な調査と統合されたフレームワークを提示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative data augmentation (GDA) has emerged as a promising technique to
alleviate data scarcity in machine learning applications. This thesis presents
a comprehensive survey and unified framework of the GDA landscape. We first
provide an overview of GDA, discussing its motivation, taxonomy, and key
distinctions from synthetic data generation. We then systematically analyze the
critical aspects of GDA - selection of generative models, techniques to utilize
them, data selection methodologies, validation approaches, and diverse
applications. Our proposed unified framework categorizes the extensive GDA
literature, revealing gaps such as the lack of universal benchmarks. The thesis
summarises promising research directions, including , effective data selection,
theoretical development for large-scale models' application in GDA and
establishing a benchmark for GDA. By laying a structured foundation, this
thesis aims to nurture more cohesive development and accelerate progress in the
vital arena of generative data augmentation.
- Abstract(参考訳): ジェネレイティブデータ拡張(gda)は、機械学習アプリケーションにおけるデータの不足を緩和するための有望な技術として登場した。
本論文は,gda景観の包括的調査と統一的枠組みを提案する。
まず、GDAの概要を説明し、その動機、分類、および合成データ生成との大きな違いについて論じる。
次に,gdaの重要側面である生成モデルの選択,それらを利用する手法,データ選択手法,検証手法,多様な応用について体系的に分析する。
提案する統一フレームワークは,GDAの広範な文献を分類し,普遍ベンチマークの欠如などのギャップを明らかにする。
この論文は、有効なデータ選択、GDAにおける大規模モデルの応用の理論開発、GDAのベンチマークの確立など、有望な研究方向性を要約している。
この論文は、構造的基盤を築き、より密着的な発達を育み、生成的データ増強の重要な領域の進展を加速することを目的としている。
関連論文リスト
- A Survey on Data Synthesis and Augmentation for Large Language Models [35.59526251210408]
本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。
これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文 参考訳(メタデータ) (2024-10-16T16:12:39Z) - A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions [0.0]
RAGは、検索機構と生成言語モデルを組み合わせることで、出力の精度を高める。
近年の研究では, 検索効率向上のための新しい手法が注目されている。
RAGモデルの堅牢性向上に焦点をあてた今後の研究方向性が提案されている。
論文 参考訳(メタデータ) (2024-10-03T22:29:47Z) - Deep Graph Anomaly Detection: A Survey and New Perspectives [86.84201183954016]
グラフ異常検出(GAD)は、異常なグラフインスタンス(ノード、エッジ、サブグラフ、グラフ)を特定することを目的とする。
ディープラーニングアプローチ、特にグラフニューラルネットワーク(GNN)は、GADにとって有望なパラダイムとして現れています。
論文 参考訳(メタデータ) (2024-09-16T03:05:11Z) - Wiping out the limitations of Large Language Models -- A Taxonomy for Retrieval Augmented Generation [0.46498278084317696]
本研究の目的は,レトリーバル・拡張世代(RAG)の応用の包括的概要を概念化する分類学を作ることである。
我々の知る限りでは、これまでのRAGアプリケーションは開発されていない。
論文 参考訳(メタデータ) (2024-08-05T22:34:28Z) - A Survey on Retrieval-Augmented Text Generation for Large Language Models [1.4579344926652844]
Retrieval-Augmented Generation (RAG)は、検索手法とディープラーニングの進歩を融合する。
本稿では,RAGパラダイムを検索前,検索後,検索後,生成の4つのカテゴリに分類する。
RAGの進化を概説し、重要な研究の分析を通して分野の進歩について論じている。
論文 参考訳(メタデータ) (2024-04-17T01:27:42Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - A Comprehensive Survey on Source-free Domain Adaptation [69.17622123344327]
ソースフリードメイン適応(SFDA)の研究は近年注目を集めている。
SFDAの最近の進歩を包括的に調査し、それらを統一的な分類体系に整理する。
一般的な3つの分類基準で30以上のSFDA法を比較検討した。
論文 参考訳(メタデータ) (2023-02-23T06:32:09Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z) - Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。
G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。
分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文 参考訳(メタデータ) (2020-04-24T06:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。