論文の概要: If generative AI is the answer, what is the question?
- arxiv url: http://arxiv.org/abs/2509.06120v1
- Date: Sun, 07 Sep 2025 16:07:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.86679
- Title: If generative AI is the answer, what is the question?
- Title(参考訳): 生成的AIが答えであるなら、質問は何だろうか?
- Authors: Ambuj Tewari,
- Abstract要約: 予測、圧縮、意思決定に関連する機械学習タスクとして生成する。
本稿では, 自己回帰モデル, 変分自己エンコーダ, 正規化フロー, 生成対向ネットワーク, 拡散モデルの5つの主要な生成モデル群について検討する。
我々は、モデルの実装方法だけでなく、どの世代が機械学習問題であるかに焦点を当てた、タスクファーストな世代フレーミングを採用しています。
- 参考スコア(独自算出の注目度): 28.34285630606338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Beginning with text and images, generative AI has expanded to audio, video, computer code, and molecules. Yet, if generative AI is the answer, what is the question? We explore the foundations of generation as a distinct machine learning task with connections to prediction, compression, and decision-making. We survey five major generative model families: autoregressive models, variational autoencoders, normalizing flows, generative adversarial networks, and diffusion models. We then introduce a probabilistic framework that emphasizes the distinction between density estimation and generation. We review a game-theoretic framework with a two-player adversary-learner setup to study generation. We discuss post-training modifications that prepare generative models for deployment. We end by highlighting some important topics in socially responsible generation such as privacy, detection of AI-generated content, and copyright and IP. We adopt a task-first framing of generation, focusing on what generation is as a machine learning problem, rather than only on how models implement it.
- Abstract(参考訳): テキストや画像から始めて、生成AIはオーディオ、ビデオ、コンピュータコード、分子にまで拡張された。
しかし、生成的AIが答えであるなら、何が問題なのか?
我々は、予測、圧縮、意思決定に繋がる独立した機械学習タスクとして、生成の基礎を探求する。
我々は, 自己回帰モデル, 変分自己エンコーダ, 正規化フロー, 生成的対向ネットワーク, 拡散モデルという5つの主要な生成モデルファミリーを調査した。
次に,密度推定と生成の区別を強調する確率的枠組みを導入する。
本稿では,ゲーム理論の枠組みを2人プレイヤの対面学習者が生成を学習するための設定で検証する。
デプロイのための生成モデルを作成するための訓練後修正について論じる。
最終的には、プライバシー、AI生成コンテンツの検出、著作権とIPなど、社会的に責任を負う世代における重要なトピックを強調します。
我々は、モデルの実装方法だけでなく、どの世代が機械学習問題であるかに焦点を当てた、タスクファーストな世代フレーミングを採用しています。
関連論文リスト
- Scalable Framework for Classifying AI-Generated Content Across Modalities [0.0]
本稿では,知覚ハッシュ,類似度測定,擬似ラベル処理を統合したスケーラブルなフレームワークを提案する。
Defactify4データセットの総合評価は、テキストおよび画像分類タスクにおける競合性能を示す。
これらの結果は、生成AIが進化を続けるにつれて、現実世界のアプリケーションに対するフレームワークの可能性を強調している。
論文 参考訳(メタデータ) (2025-02-01T09:28:40Z) - Deep Generative Models in Robotics: A Survey on Learning from Multimodal Demonstrations [52.11801730860999]
近年、ロボット学習コミュニティは、大規模なデータセットの複雑さを捉えるために、深層生成モデルを使うことへの関心が高まっている。
本稿では,エネルギーベースモデル,拡散モデル,アクションバリューマップ,生成的敵ネットワークなど,コミュニティが探求してきたさまざまなモデルについて述べる。
また,情報生成から軌道生成,コスト学習に至るまで,深層生成モデルを用いた様々なアプリケーションについて述べる。
論文 参考訳(メタデータ) (2024-08-08T11:34:31Z) - On the Limitations and Prospects of Machine Unlearning for Generative AI [7.795648142175443]
Generative AI(GenAI)は、潜伏変数やその他のデータモダリティから現実的で多様なデータサンプルを合成することを目的としている。
GenAIは自然言語、画像、オーディオ、グラフなど、さまざまな領域で顕著な成果を上げている。
しかし、データプライバシ、セキュリティ、倫理に課題やリスクも生じている。
論文 参考訳(メタデータ) (2024-08-01T08:35:40Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - AI for the Generation and Testing of Ideas Towards an AI Supported
Knowledge Development Environment [2.0305676256390934]
生成AIが人間のバイアスを排除してアイデア生成を促進する方法について論じる。
また、検索が事実、論理、文脈をどう検証できるかについても記述する。
本稿では,知識労働者のためのシステムであるジェネレーション・アンド・サーチ・テスト(Generate and Search Test)を紹介し,個人が効率的にソリューションを作成できるようにする。
論文 参考訳(メタデータ) (2023-07-17T22:17:40Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z) - Video Generation from Text Employing Latent Path Construction for
Temporal Modeling [70.06508219998778]
ビデオ生成は、機械学習とコンピュータビジョンの分野における最も困難なタスクの1つである。
本稿では,映像生成の条件形式であるテキストから映像生成の問題に取り組む。
自然言語文からのビデオ生成が人工知能に重要な影響を与えると考えている。
論文 参考訳(メタデータ) (2021-07-29T06:28:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。