論文の概要: Generative AI in Depth: A Survey of Recent Advances, Model Variants, and Real-World Applications
- arxiv url: http://arxiv.org/abs/2510.21887v1
- Date: Thu, 23 Oct 2025 21:11:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.637036
- Title: Generative AI in Depth: A Survey of Recent Advances, Model Variants, and Real-World Applications
- Title(参考訳): 深部における生成AI:最近の進歩、モデル変数、実世界の応用に関する調査
- Authors: Shamim Yazdani, Akansha Singh, Nripsuta Saxena, Zichong Wang, Avash Palikhe, Deng Pan, Umapada Pal, Jie Yang, Wenbin Zhang,
- Abstract要約: GAN(Generative Adversarial Networks)、VAE(VAE)、拡散モデル(Diffusion Models)は、様々な領域にまたがる多様な高品質なコンテンツを生成するのに役立っている。
本調査では, 文献を整理し, GAN, VAE, DMの発達を理解するための包括的枠組みを提供する包括的分類法を紹介する。
技術的進歩の要約に加えて, 誤用リスクや, 合成メディアの社会的影響など, 倫理的懸念の高まりについても検討した。
- 参考スコア(独自算出の注目度): 16.445049607873383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, deep learning based generative models, particularly Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), and Diffusion Models (DMs), have been instrumental in in generating diverse, high-quality content across various domains, such as image and video synthesis. This capability has led to widespread adoption of these models and has captured strong public interest. As they continue to advance at a rapid pace, the growing volume of research, expanding application areas, and unresolved technical challenges make it increasingly difficult to stay current. To address this need, this survey introduces a comprehensive taxonomy that organizes the literature and provides a cohesive framework for understanding the development of GANs, VAEs, and DMs, including their many variants and combined approaches. We highlight key innovations that have improved the quality, diversity, and controllability of generated outputs, reflecting the expanding potential of generative artificial intelligence. In addition to summarizing technical progress, we examine rising ethical concerns, including the risks of misuse and the broader societal impact of synthetic media. Finally, we outline persistent challenges and propose future research directions, offering a structured and forward looking perspective for researchers in this fast evolving field.
- Abstract(参考訳): 近年、ディープラーニングに基づく生成モデル、特にGAN(Generative Adversarial Networks)、VAE(VAE)、拡散モデル(Diffusion Models)は、画像やビデオ合成など、さまざまな領域にわたる多様な高品質なコンテンツの生成に役立っている。
この能力はこれらのモデルを広く採用し、大衆の関心を集めている。
急速なペースで前進を続けるにつれて、研究量の増大、アプリケーション領域の拡大、未解決の技術的課題によって、現在の状態を維持することがますます難しくなっています。
このニーズに対処するため、本調査では、文献を整理する包括的分類法を導入し、GAN、VAE、DMの開発を理解するための密集的な枠組みを提供する。
我々は、生成した出力の品質、多様性、制御性を改善した重要なイノベーションを強調し、生成する人工知能の可能性の拡大を反映している。
技術的進歩の要約に加えて, 誤用リスクや, 合成メディアの社会的影響など, 倫理的懸念の高まりについても検討した。
最後に、我々は永続的な課題を概説し、今後の研究方向性を提案し、この急速に発展する分野の研究者に対して、構造化された、先進的な視点を提供する。
関連論文リスト
- Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - Information Retrieval in the Age of Generative AI: The RGB Model [77.96475639967431]
本稿では,生成型AIツールの利用の増加に伴って生じる複雑な情報ダイナミクスについて,新たな定量的アプローチを提案する。
本稿では,新たなトピックに応答して情報の生成,索引付け,普及を特徴付けるモデルを提案する。
以上の結果から,AI導入の急激なペースとユーザ依存度の増加は,不正確な情報拡散のリスクを増大させる可能性が示唆された。
論文 参考訳(メタデータ) (2025-04-29T10:21:40Z) - The Evolution and Future Perspectives of Artificial Intelligence Generated Content [7.586328912947784]
レビューでは、AIGCの進化が4つの発展的なマイルストーンを辿っている。
本研究は,AIGCモデルの選択と最適化における研究者や実践者の指導を目的とする。
論文 参考訳(メタデータ) (2024-12-02T20:16:40Z) - A Survey of Neural Code Intelligence: Paradigms, Advances and Beyond [84.95530356322621]
この調査は、コードインテリジェンスの発展に関する体系的なレビューを示す。
50以上の代表モデルとその変種、20以上のタスクのカテゴリ、および680以上の関連する広範な研究をカバーしている。
発達軌道の考察に基づいて、コードインテリジェンスとより広範なマシンインテリジェンスとの間の新たな相乗効果について検討する。
論文 参考訳(メタデータ) (2024-03-21T08:54:56Z) - On the Challenges and Opportunities in Generative AI [155.030542942979]
私たちは、現在の大規模な生成AIモデルは、ドメイン間で広く採用されるのを妨げるいくつかの根本的な欠点を示しています。
我々は、研究者に実りある研究の方向性を探るための洞察を提供することを目標とし、より堅牢でアクセスしやすい生成AIソリューションの開発を促進する。
論文 参考訳(メタデータ) (2024-02-28T15:19:33Z) - Generative AI in Vision: A Survey on Models, Metrics and Applications [0.0]
生成AIモデルは、現実的で多様なデータサンプルの作成を可能にすることで、さまざまな分野に革命をもたらした。
これらのモデルの中で、拡散モデルは高品質な画像、テキスト、オーディオを生成するための強力なアプローチとして現れている。
本稿では,AI拡散モデルとレガシモデルについて概観し,その基礎となる技術,異なる領域にわたる応用,課題について概説する。
論文 参考訳(メタデータ) (2024-02-26T07:47:12Z) - Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文 参考訳(メタデータ) (2024-01-30T03:51:44Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。