Fugu-MT 論文翻訳(概要): A Unified Framework for Generative Data Augmentation: A Comprehensive Survey

論文の概要: A Unified Framework for Generative Data Augmentation: A Comprehensive Survey

arxiv url: http://arxiv.org/abs/2310.00277v2
Date: Sun, 21 Apr 2024 08:45:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-24 00:42:43.513163
Title: A Unified Framework for Generative Data Augmentation: A Comprehensive Survey
Title（参考訳）: 生成データ拡張のための統一フレームワーク: 総合的な調査
Authors: Yunhao Chen, Zihui Yan, Yunjie Zhu,
Abstract要約: GDA(Generative Data Augmentation)は、機械学習アプリケーションにおけるデータの不足を軽減するための有望なテクニックとして登場した。この論文は、GDAランドスケープの総合的な調査と統合されたフレームワークを提示している。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative data augmentation (GDA) has emerged as a promising technique to alleviate data scarcity in machine learning applications. This thesis presents a comprehensive survey and unified framework of the GDA landscape. We first provide an overview of GDA, discussing its motivation, taxonomy, and key distinctions from synthetic data generation. We then systematically analyze the critical aspects of GDA - selection of generative models, techniques to utilize them, data selection methodologies, validation approaches, and diverse applications. Our proposed unified framework categorizes the extensive GDA literature, revealing gaps such as the lack of universal benchmarks. The thesis summarises promising research directions, including , effective data selection, theoretical development for large-scale models' application in GDA and establishing a benchmark for GDA. By laying a structured foundation, this thesis aims to nurture more cohesive development and accelerate progress in the vital arena of generative data augmentation.
Abstract（参考訳）: GDA(Generative Data Augmentation)は、機械学習アプリケーションにおけるデータの不足を軽減するための有望なテクニックとして登場した。この論文は、GDAランドスケープの総合的な調査と統合されたフレームワークを提示している。まず、GDAの概要を説明し、そのモチベーション、分類、および合成データ生成との大きな違いについて論じる。そして、GDAの重要な側面である生成モデルの選択、それらを活用する技術、データ選択方法、検証アプローチ、多様なアプリケーションについて体系的に分析する。提案する統一フレームワークは,GDAの広範な文献を分類し,普遍的なベンチマークの欠如などのギャップを明らかにする。この論文は、有効なデータ選択、GDAにおける大規模モデルの応用の理論開発、GDAのベンチマークの確立など、有望な研究方向性を要約している。この論文は、構造的基盤を築き、より密着的な発達を育み、生成的データ増強の重要な領域の進展を加速することを目的としている。

関連論文リスト

Beyond Human Annotation: Recent Advances in Data Generation Methods for Document Intelligence [6.0051533428647375]
この調査は、ドキュメントインテリジェンスにおけるデータ生成のための最初の総合的な技術マップを確立する。データ生成は監視信号生成として再定義される。データとラベルの有効性」に基づく新しい分類法が導入された
論文参考訳（メタデータ） (2026-01-18T09:01:18Z)
A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems: Progress, Gaps, and Future Directions [1.4931265249949528]
Retrieval-Augmented Generation (RAG)は自然言語処理(NLP)における大きな進歩である RAGは、大規模言語モデル(LLM)と情報検索システムを組み合わせて、事実的根拠付け、正確性、文脈的関連性を高める。本稿ではRAGの体系的なレビューを行い、最近の最先端実装に対するオープンドメイン質問の早期展開から進化を辿る。
論文参考訳（メタデータ） (2025-07-25T03:05:46Z)
Learning Causal Graphs at Scale: A Foundation Model Approach [28.966180222166766]
複数線形構造方程式モデル(SEM)を学習するための新しい注意機構に基づくアーキテクチャであるAttention-DAG(ADAG)を提案する。 ADAGは、非線形アテンションベースのカーネルを介して、観測データからグラフ構造とパラメータの両方へのマッピングを学習する。提案手法をベンチマークデータセット上で評価し,DAG学習精度とゼロショット推論効率の両方において,ADAGが大幅に向上することを確認した。
論文参考訳（メタデータ） (2025-06-23T04:41:02Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
A Survey on Knowledge-Oriented Retrieval-Augmented Generation [45.65542434522205]
近年,RAG (Retrieval-Augmented Generation) が注目されている。 RAGは大規模検索システムと生成モデルを組み合わせる。動的外部知識を用いた生成モデルの強化など,RAGの重要な特徴について論じる。
論文参考訳（メタデータ） (2025-03-11T01:59:35Z)
Graph Foundation Models for Recommendation: A Comprehensive Survey [55.70529188101446]
大規模言語モデル(LLM)は自然言語を処理し、理解するために設計されており、どちらも非常に効果的で広く採用されている。最近の研究はグラフ基礎モデル(GFM)に焦点を当てている。 GFM は GNN と LLM の強みを統合し,複雑な RS 問題をより効率的にモデル化する。
論文参考訳（メタデータ） (2025-02-12T12:13:51Z)
A Survey on Data Synthesis and Augmentation for Large Language Models [35.59526251210408]
本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文参考訳（メタデータ） (2024-10-16T16:12:39Z)
A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions [0.0]
RAGは、検索機構と生成言語モデルを組み合わせることで、出力の精度を高める。近年の研究では, 検索効率向上のための新しい手法が注目されている。 RAGモデルの堅牢性向上に焦点をあてた今後の研究方向性が提案されている。
論文参考訳（メタデータ） (2024-10-03T22:29:47Z)
Deep Graph Anomaly Detection: A Survey and New Perspectives [86.84201183954016]
グラフ異常検出(GAD)は、異常なグラフインスタンス(ノード、エッジ、サブグラフ、グラフ)を特定することを目的とする。ディープラーニングアプローチ、特にグラフニューラルネットワーク(GNN)は、GADにとって有望なパラダイムとして現れています。
論文参考訳（メタデータ） (2024-09-16T03:05:11Z)
Wiping out the limitations of Large Language Models -- A Taxonomy for Retrieval Augmented Generation [0.46498278084317696]
本研究の目的は,レトリーバル・拡張世代(RAG)の応用の包括的概要を概念化する分類学を作ることである。我々の知る限りでは、これまでのRAGアプリケーションは開発されていない。
論文参考訳（メタデータ） (2024-08-05T22:34:28Z)
A Survey on Retrieval-Augmented Text Generation for Large Language Models [1.4579344926652844]
Retrieval-Augmented Generation (RAG)は、検索手法とディープラーニングの進歩を融合する。本稿では,RAGパラダイムを検索前,検索後,検索後,生成の4つのカテゴリに分類する。 RAGの進化を概説し、重要な研究の分析を通して分野の進歩について論じている。
論文参考訳（メタデータ） (2024-04-17T01:27:42Z)
Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文参考訳（メタデータ） (2023-11-03T06:34:37Z)
Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文参考訳（メタデータ） (2023-06-20T14:21:58Z)
A Comprehensive Survey on Source-free Domain Adaptation [69.17622123344327]
ソースフリードメイン適応(SFDA)の研究は近年注目を集めている。 SFDAの最近の進歩を包括的に調査し、それらを統一的な分類体系に整理する。一般的な3つの分類基準で30以上のSFDA法を比較検討した。
論文参考訳（メタデータ） (2023-02-23T06:32:09Z)
A Survey on Heterogeneous Graph Embedding: Methods, Techniques, Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。 HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文参考訳（メタデータ） (2020-11-30T15:03:47Z)
Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。 G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文参考訳（メタデータ） (2020-04-24T06:12:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。