Fugu-MT 論文翻訳(概要): A Survey on Long Video Generation: Challenges, Methods, and Prospects

論文の概要: A Survey on Long Video Generation: Challenges, Methods, and Prospects

arxiv url: http://arxiv.org/abs/2403.16407v1
Date: Mon, 25 Mar 2024 03:47:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-26 16:07:18.766654
Title: A Survey on Long Video Generation: Challenges, Methods, and Prospects
Title（参考訳）: 長大映像生成に関する調査 : 課題, 方法, 展望
Authors: Chengxuan Li, Di Huang, Zeyu Lu, Yang Xiao, Qingqi Pei, Lei Bai,
Abstract要約: 本稿では,近年の長編ビデオ生成の進歩に関する最初の調査について述べる。それらを2つの重要なパラダイム、すなわち時間的自己回帰の分割と征服にまとめる。本稿では,長期ビデオ生成研究の進展に欠かせないデータセットと評価指標の包括的概要と分類について述べる。
参考スコア（独自算出の注目度）: 36.58662591921549
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video generation is a rapidly advancing research area, garnering significant attention due to its broad range of applications. One critical aspect of this field is the generation of long-duration videos, which presents unique challenges and opportunities. This paper presents the first survey of recent advancements in long video generation and summarises them into two key paradigms: divide and conquer temporal autoregressive. We delve into the common models employed in each paradigm, including aspects of network design and conditioning techniques. Furthermore, we offer a comprehensive overview and classification of the datasets and evaluation metrics which are crucial for advancing long video generation research. Concluding with a summary of existing studies, we also discuss the emerging challenges and future directions in this dynamic field. We hope that this survey will serve as an essential reference for researchers and practitioners in the realm of long video generation.
Abstract（参考訳）: ビデオ生成は急速に進歩する研究分野であり、幅広い応用のために大きな注目を集めている。この分野における重要な側面の1つは、ユニークな挑戦と機会を提供する長編ビデオの生成である。本稿では,時間的自己回帰の分割と克服という2つの重要なパラダイムにまとめる。ネットワーク設計やコンディショニングなど,各パラダイムで使用される共通モデルについて検討する。さらに,長期ビデオ生成研究の進展に欠かせないデータセットと評価指標の包括的概要と分類について述べる。既存の研究の概要をまとめて、このダイナミックな分野における新たな課題と今後の方向性についても論じる。この調査が、長いビデオ生成の領域における研究者や実践者にとって不可欠な参考になることを期待している。

関連論文リスト

Survey of Video Diffusion Models: Foundations, Implementations, and Applications [15.060158551865099]
拡散モデルの最近の進歩はビデオ生成に革命をもたらし、従来の生成的対向ネットワークに基づくアプローチと比較して時間的一貫性と視覚的品質を提供する。本調査は拡散に基づくビデオ生成の総合的なレビューを行い,その進化,技術基盤,実用的応用について検討する。本稿では,現在の手法を体系的に分類し,アーキテクチャの革新と最適化戦略を分析し,デノナイズやスーパーレゾリューションといった低レベルのビジョンタスクにまたがる応用について検討する。
論文参考訳（メタデータ） (2025-04-22T17:59:17Z)
Personalized Generation In Large Model Era: A Survey [90.7579254803302]
大規模モデルの時代には、コンテンツ生成は徐々にパーソナライズドジェネレーション(PGen)へとシフトしている。本報告では,PGen に関する総合的な調査を行い,この急速に成長する分野における既存研究について考察する。複数のモダリティにまたがるPGen研究をブリッジすることで、この調査は知識共有と学際的コラボレーションを促進する貴重な情報源となる。
論文参考訳（メタデータ） (2025-03-04T13:34:19Z)
ASurvey: Spatiotemporal Consistency in Video Generation [72.82267240482874]
動的視覚生成手法を利用した映像生成手法は人工知能生成コンテンツ(AIGC)の境界を押し下げる最近の研究は、映像生成における時間的一貫性の問題に対処することを目的としているが、この観点からの文献レビューはほとんど行われていない。基礎モデル,情報表現,生成スキーム,後処理技術,評価指標の5つの重要な側面を網羅して,映像生成の最近の進歩を体系的に検討した。
論文参考訳（メタデータ） (2025-02-25T05:20:51Z)
Video Summarization Techniques: A Comprehensive Review [1.6381055567716192]
本稿では,抽象的戦略と抽出的戦略の両方を強調し,映像要約のための様々なアプローチと手法について考察する。抽出要約のプロセスは、ソースビデオからキーフレームやセグメントを識別し、ショット境界認識やクラスタリングなどの手法を利用する。一方、抽象的な要約は、深層ニューラルネットワークや自然言語処理、強化学習、注意機構、生成的敵ネットワーク、マルチモーダル学習といった機械学習モデルを用いて、ビデオから不可欠なコンテンツを取得することによって、新たなコンテンツを生成する。
論文参考訳（メタデータ） (2024-10-06T11:17:54Z)
A Comprehensive Survey on Human Video Generation: Challenges, Methods, and Insights [8.192172339127657]
ヒューマンビデオ生成は、テキスト、オーディオ、ポーズなどの制御条件が与えられた生成モデルを用いて、2次元の人体ビデオシーケンスを合成することを目的としている。近年の世代モデルの発展は、この分野への関心の高まりに確かな基盤を築き上げている。著しい進歩にもかかわらず、キャラクターの整合性、人間の動きの複雑さ、環境との関わりの難しさなど、人間の映像生成の課題は依然として困難なままである。
論文参考訳（メタデータ） (2024-07-11T12:09:05Z)
Video Diffusion Models: A Survey [3.7985353171858045]
拡散生成モデルは近年、高品質でコヒーレントなビデオコンテンツを作成し、修正するための強力な技術となっている。本調査では,映像生成における拡散モデルの重要な構成要素について概説する。
論文参考訳（メタデータ） (2024-05-06T04:01:42Z)
Deepfake Generation and Detection: A Benchmark and Survey [134.19054491600832]
Deepfakeは、特定の条件下で非常にリアルな顔画像やビデオを作成するための技術だ。この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。本研究では, 顔交換, 顔再現, 話し顔生成, 顔属性編集の4つの代表的なディープフェイク分野の研究に焦点をあてる。
論文参考訳（メタデータ） (2024-03-26T17:12:34Z)
Federated Learning for Generalization, Robustness, Fairness: A Survey and Benchmark [55.898771405172155]
フェデレートラーニングは、異なる当事者間のプライバシー保護コラボレーションのための有望なパラダイムとして登場した。我々は,連合学習研究の重要かつ最近の展開を体系的に概観する。
論文参考訳（メタデータ） (2023-11-12T06:32:30Z)
A Survey on Video Diffusion Models [103.03565844371711]
AI生成コンテンツ(AIGC)の最近の波は、コンピュータビジョンでかなりの成功を収めている。その印象的な生成能力のため、拡散モデルは徐々にGANと自動回帰変換器に基づく手法に取って代わられている。本稿では,AIGC時代の映像拡散モデルについて概観する。
論文参考訳（メタデータ） (2023-10-16T17:59:28Z)
A Survey on Deep Learning Technique for Video Segmentation [147.0767454918527]
ビデオセグメンテーションは幅広い応用において重要な役割を果たしている。ディープラーニングベースのアプローチは、ビデオセグメンテーションに特化しており、魅力的なパフォーマンスを提供している。
論文参考訳（メタデータ） (2021-07-02T15:51:07Z)
Video Summarization Using Deep Neural Networks: A Survey [72.98424352264904]
ビデオ要約技術は、ビデオコンテンツの最も有益な部分を選択して、簡潔で完全なシノプシスを作成することを目指しています。本研究は,この領域における最近の進歩に着目し,既存の深層学習に基づく総括的映像要約手法の包括的調査を行う。
論文参考訳（メタデータ） (2021-01-15T11:41:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。