Fugu-MT 論文翻訳(概要): A Survey on Video Prediction: From Deterministic to Generative Approaches

論文の概要: A Survey on Video Prediction: From Deterministic to Generative Approaches

arxiv url: http://arxiv.org/abs/2401.14718v2
Date: Wed, 31 Jan 2024 05:09:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-01 16:51:53.959128
Title: A Survey on Video Prediction: From Deterministic to Generative Approaches
Title（参考訳）: ビデオ予測に関する調査 : 決定論的アプローチから生成的アプローチへ
Authors: Ruibo Ming, Zhewei Huang, Zhuoxuan Ju, Jianming Hu, Lihui Peng, Shuchang Zhou
Abstract要約: コンピュータビジョンの基本課題である映像予測は、モデルが既存の映像コンテンツに基づいて将来のフレームのシーケンスを生成することを可能にすることを目的としている。我々は、この分野で最も広く使われているデータセットとアルゴリズムを含む、歴史と現代の両方を包括的に調査する。本稿では,ビデオ予測アルゴリズムの性質に着目した新しい分類法を提案する。
参考スコア（独自算出の注目度）: 8.616555526936063
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video prediction, a fundamental task in computer vision, aims to enable models to generate sequences of future frames based on existing video content. This task has garnered widespread application across various domains. In this paper, we comprehensively survey both historical and contemporary works in this field, encompassing the most widely used datasets and algorithms. Our survey scrutinizes the challenges and evolving landscape of video prediction within the realm of computer vision. We propose a novel taxonomy centered on the stochastic nature of video prediction algorithms. This taxonomy accentuates the gradual transition from deterministic to generative prediction methodologies, underlining significant advancements and shifts in approach.
Abstract（参考訳）: コンピュータビジョンの基本課題である映像予測は、モデルが既存の映像コンテンツに基づいて将来のフレームのシーケンスを生成することを可能にすることを目的としている。このタスクは様々なドメインに広く適用されている。本稿では,この分野における歴史的・現代的作品を総合的に調査し,最も広く利用されているデータセットとアルゴリズムについて述べる。本調査は,コンピュータビジョンの領域における映像予測の課題と展望を考察する。本稿では,ビデオ予測アルゴリズムの確率的性質に着目した新しい分類法を提案する。この分類法は決定論的な予測方法論から生成的予測方法論への段階的な変化を強調し、アプローチの著しい進歩と変化を強調する。

関連論文リスト

StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文参考訳（メタデータ） (2026-03-02T11:35:05Z)
Opportunities in AI/ML for the Rubin LSST Dark Energy Science Collaboration [63.61423859450929]
この白書は、DESCの主要な宇宙探査と横断的分析を通して、AI/MLの現在の状況を調査している。本研究では,大規模ベイズ推定,物理インフォームド手法,検証フレームワーク,発見のための能動的学習など,主要な方法論研究の優先事項を明らかにする。
論文参考訳（メタデータ） (2026-01-20T18:46:42Z)
Forging Spatial Intelligence: A Roadmap of Multi-Modal Data Pre-Training for Autonomous Systems [75.78934957242403]
自動運転車とドローンは、マルチモーダル搭載センサーデータから真の空間情報を必要とする。本稿では,この目標に向かって進む中核的な技術群を同定し,マルチモーダル・プレトレーニングのためのフレームワークを提案する。
論文参考訳（メタデータ） (2025-12-30T17:58:01Z)
A Survey of Heterogeneous Graph Neural Networks for Cybersecurity Anomaly Detection [4.1427901594249255]
不均一グラフニューラルネットワーク(HGNN)は、異常検出のための有望なパラダイムとして登場した。この調査は、スケーラブルで解釈可能で実用的なデプロイ可能なソリューションに向けて、HGNNベースの異常検出を促進するための構造化された基盤を確立することを目的としている。
論文参考訳（メタデータ） (2025-10-30T09:49:59Z)
Spatiodynamic inference using vision-based generative modelling [0.5461938536945723]
我々は,視覚変換器駆動の変分表現を用いたシミュレーションに基づく推論フレームワークを開発した。中心となる考え方は、パラメータ空間の体系的な探索を通じて、潜在力学の微細で構造化されたメッシュを構築することである。生成的モデリングと機械的原理を統合することで、我々のアプローチは統合された推論フレームワークを提供する。
論文参考訳（メタデータ） (2025-07-29T22:10:50Z)
Topological Social Choice: Designing a Noise-Robust Polar Distance for Persistence Diagrams [0.0]
トポロジカルデータ分析(TDA)は、ノイズの多いデータから堅牢で解釈可能な特徴を抽出する強力なフレームワークとして登場した。この研究は、ノイズの多い嗜好データに適した永続化ダイアグラムのための新しいメートル法を提案することによって、これらの領域間の新しい概念ブリッジを導入する。我々は、位相的特徴の大きさと向きを滑らかで微分可能な方法で捉える極座標に基づく距離を定義する。
論文参考訳（メタデータ） (2025-07-18T19:41:19Z)
Motion Generation: A Survey of Generative Approaches and Benchmarks [1.4254358932994455]
我々は,その基盤となる生成戦略に基づいて,動作生成手法の詳細な分類を行う。我々の主な焦点は、2023年以降のトップレベルの会場で発行された論文であり、この分野の最新の進歩を反映している。アーキテクチャの原則、条件付け機構、生成設定を分析し、文献で使用される評価指標とデータセットの詳細な概要をコンパイルする。
論文参考訳（メタデータ） (2025-07-07T19:04:56Z)
Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文参考訳（メタデータ） (2025-06-11T03:29:18Z)
Offline Model-Based Optimization: Comprehensive Review [61.91350077539443]
オフライン最適化は、オフラインデータセットのみを使用してブラックボックス機能の最適化を目標とする、科学とエンジニアリングの基本的な課題である。モデルベース最適化の最近の進歩は、オフライン固有の代理モデルと生成モデルを開発するために、ディープニューラルネットワークの一般化能力を活用している。科学的な発見を加速させる効果が増大しているにもかかわらず、この分野は包括的なレビューを欠いている。
論文参考訳（メタデータ） (2025-03-21T16:35:02Z)
Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文参考訳（メタデータ） (2025-03-14T13:53:46Z)
Speculative Decoding and Beyond: An In-Depth Survey of Techniques [4.165029665035158]
シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文参考訳（メタデータ） (2025-02-27T03:53:45Z)
A Survey of World Models for Autonomous Driving [63.33363128964687]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文参考訳（メタデータ） (2025-01-20T04:00:02Z)
Predictive Pattern Recognition Techniques Towards Spatiotemporal Representation of Plant Growth in Simulated and Controlled Environments: A Comprehensive Review [0.0]
本稿では,最先端の予測パターン認識技術について概説する。植物形質の確率論的モデリングと動的環境相互作用の統合に着目した。主なトピックは、予測タスクのための回帰とニューラルネットワークベースの表現モデルだ。
論文参考訳（メタデータ） (2024-12-13T20:22:35Z)
AdaOcc: Adaptive Forward View Transformation and Flow Modeling for 3D Occupancy and Flow Prediction [56.72301849123049]
CVPR 2024 における nuScenes Open-Occ データセットチャレンジにおいて,視覚中心の3次元活動とフロー予測トラックのソリューションを提案する。我々の革新的なアプローチは、適応的なフォワード・ビュー・トランスフォーメーションとフロー・モデリングを取り入れることで、3次元の占有率とフロー予測を向上させる2段階のフレームワークである。提案手法は回帰と分類を組み合わせることで,様々な場面におけるスケールの変動に対処し,予測フローを利用して将来のフレームに現行のボクセル特徴をワープする。
論文参考訳（メタデータ） (2024-07-01T16:32:15Z)
A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing [8.171572460041823]
トーキングヘッド合成は、特定のコンテンツによって駆動される静止画像からポートレートビデオを生成する高度な方法である。本調査は,3つの重要な領域 – ポートレート生成,駆動機構,編集技術 – に分類し,その技術を体系的にレビューする。
論文参考訳（メタデータ） (2024-06-15T08:14:59Z)
Visual Representation Learning with Stochastic Frame Prediction [90.99577838303297]
本稿では,フレーム予測における不確実性を捉えることを学ぶ映像生成の考え方を再考する。フレーム間の時間情報を学習するためのフレーム予測モデルを訓練するフレームワークを設計する。このアーキテクチャは、両目的を相乗的かつ計算効率のよい方法で組み合わせることができる。
論文参考訳（メタデータ） (2024-06-11T16:05:15Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
Cumulative Distribution Function based General Temporal Point Processes [49.758080415846884]
CuFunモデルは、累積分布関数(CDF)を中心に回転するTPPに対する新しいアプローチを表す提案手法は従来のTPPモデリングに固有のいくつかの重要な問題に対処する。コントリビューションには、先駆的なCDFベースのTPPモデルの導入、過去の事象情報を将来の事象予測に組み込む方法論の開発が含まれている。
論文参考訳（メタデータ） (2024-02-01T07:21:30Z)
Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文参考訳（メタデータ） (2024-01-04T20:23:51Z)
Towards the Unification of Generative and Discriminative Visual Foundation Model: A Survey [30.528346074194925]
視覚基礎モデル(VFM)はコンピュータビジョンの基盤となる発展の触媒となっている。本稿では,VFMの重要軌道を概説し,その拡張性と生成タスクの熟練性を強調した。今後のイノベーションの重要な方向は、生成的および差別的パラダイムの融合である。
論文参考訳（メタデータ） (2023-12-15T19:17:15Z)
Graph Foundation Models: Concepts, Opportunities and Challenges [66.37994863159861]
ファンデーションモデルは、さまざまな人工知能アプリケーションにおいて重要なコンポーネントとして現れてきた。一般化と適応における基礎モデルの能力は、グラフ機械学習研究者を動機付け、新しいグラフ学習パラダイムを開発する可能性について議論する。本稿では,グラフ基礎モデル(GFM)の概念を紹介し,その重要な特徴と基礎技術について概説する。
論文参考訳（メタデータ） (2023-10-18T09:31:21Z)
A supervised generative optimization approach for tabular data [2.5311562666866494]
本研究は,新しい合成データ生成フレームワークを提案する。特定の下流タスクに適した教師ありコンポーネントを統合し、メタラーニングアプローチを用いて既存の合成分布の最適混合分布を学習する。
論文参考訳（メタデータ） (2023-09-10T16:56:46Z)
Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文参考訳（メタデータ） (2023-06-20T14:21:58Z)
LatentFormer: Multi-Agent Transformer-Based Interaction Modeling and Trajectory Prediction [12.84508682310717]
将来の車両軌道予測のためのトランスフォーマーモデルであるLatentFormerを提案する。提案手法をnuScenesベンチマークデータセット上で評価し,提案手法が最先端性能を実現し,トラジェクトリ指標を最大40%向上することを示す。
論文参考訳（メタデータ） (2022-03-03T17:44:58Z)
Wide and Narrow: Video Prediction from Context and Motion [54.21624227408727]
本稿では,これらの相補的属性を統合し,深層ネットワークを通した複雑なピクセルのダイナミックスを予測するフレームワークを提案する。本研究では,非局所的な近隣表現を集約し,過去のフレーム上の文脈情報を保存するグローバルなコンテキスト伝搬ネットワークを提案する。また,移動オブジェクトの動作をメモリに格納することで,適応的なフィルタカーネルを生成するローカルフィルタメモリネットワークを考案した。
論文参考訳（メタデータ） (2021-10-22T04:35:58Z)
Three Steps to Multimodal Trajectory Prediction: Modality Clustering, Classification and Synthesis [54.249502356251085]
我々は新しい予測フレームワークと共に新しい洞察を示す。提案手法は、社会情報や地図情報を導入することなく、最先端の作品を超える。
論文参考訳（メタデータ） (2021-03-14T06:21:03Z)
Future Urban Scenes Generation Through Vehicles Synthesis [90.1731992199415]
本研究では,都市景観の視覚的外観を予測するためのディープラーニングパイプラインを提案する。ループには解釈可能な情報が含まれ、各アクターは独立してモデル化される。従来のCityFlowのシーン生成手法に比べて,このアプローチが優れていることを示す。
論文参考訳（メタデータ） (2020-07-01T08:40:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。