論文の概要: A Review on Deep Learning Techniques for Video Prediction
- arxiv url: http://arxiv.org/abs/2004.05214v2
- Date: Wed, 15 Apr 2020 00:24:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 20:44:21.049309
- Title: A Review on Deep Learning Techniques for Video Prediction
- Title(参考訳): ビデオ予測のための深層学習手法のレビュー
- Authors: Sergiu Oprea, Pablo Martinez-Gonzalez, Alberto Garcia-Garcia, John
Alejandro Castro-Vargas, Sergio Orts-Escolano, Jose Garcia-Rodriguez and
Antonis Argyros
- Abstract要約: 将来の成果を予測し、予測し、推論する能力は、インテリジェントな意思決定システムの重要な構成要素である。
ディープラーニングに基づくビデオ予測は、有望な研究方向として登場した。
- 参考スコア(独自算出の注目度): 3.203688549673373
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to predict, anticipate and reason about future outcomes is a key
component of intelligent decision-making systems. In light of the success of
deep learning in computer vision, deep-learning-based video prediction emerged
as a promising research direction. Defined as a self-supervised learning task,
video prediction represents a suitable framework for representation learning,
as it demonstrated potential capabilities for extracting meaningful
representations of the underlying patterns in natural videos. Motivated by the
increasing interest in this task, we provide a review on the deep learning
methods for prediction in video sequences. We firstly define the video
prediction fundamentals, as well as mandatory background concepts and the most
used datasets. Next, we carefully analyze existing video prediction models
organized according to a proposed taxonomy, highlighting their contributions
and their significance in the field. The summary of the datasets and methods is
accompanied with experimental results that facilitate the assessment of the
state of the art on a quantitative basis. The paper is summarized by drawing
some general conclusions, identifying open research challenges and by pointing
out future research directions.
- Abstract(参考訳): 将来の成果を予測、予測、推論する能力は、インテリジェントな意思決定システムの重要なコンポーネントである。
コンピュータビジョンにおけるディープラーニングの成功を踏まえて、ディープラーニングに基づくビデオ予測が有望な研究方向として現れた。
自己教師付き学習タスクとして定義されるビデオ予測は、自然ビデオの基盤となるパターンの有意義な表現を抽出する可能性を示すため、表現学習に適したフレームワークである。
この課題への関心の高まりに動機づけられ,ビデオシーケンスにおける予測のための深層学習法についてレビューを行う。
まず、ビデオ予測の基礎と、必須の背景概念と最も使用されるデータセットを定義します。
次に,提案する分類に従って整理された既存の映像予測モデルを注意深く分析し,その分野における貢献とその意義を強調する。
データセットと手法の要約には,定量的な評価を容易にする実験結果が添付されている。
この論文は、いくつかの一般的な結論を描き、オープンリサーチの課題を特定し、今後の研究の方向性を指摘してまとめる。
関連論文リスト
- Predicting Long-horizon Futures by Conditioning on Geometry and Time [49.86180975196375]
我々は,過去を前提とした将来のセンサ観測の課題を探求する。
マルチモーダリティを扱える画像拡散モデルの大規模事前学習を活用する。
我々は、屋内と屋外のシーンにまたがる多様なビデオのセットについて、ビデオ予測のためのベンチマークを作成する。
論文 参考訳(メタデータ) (2024-04-17T16:56:31Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Convolutional Motif Kernel Networks [1.104960878651584]
我々のモデルは、小さなデータセットでしっかりと学習でき、関連する医療予測タスクで最先端のパフォーマンスを達成できることを示す。
提案手法はDNAおよびタンパク質配列に利用することができる。
論文 参考訳(メタデータ) (2021-11-03T15:06:09Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Self-Supervision by Prediction for Object Discovery in Videos [62.87145010885044]
本稿では,この予測タスクを自己監督として利用し,画像シーケンス表現のための新しいオブジェクト中心モデルを構築する。
私たちのフレームワークは、手動アノテーションや事前トレーニングされたネットワークを使わずにトレーニングできます。
最初の実験では、提案されたパイプラインがオブジェクト中心のビデオ予測への有望なステップであることを確認した。
論文 参考訳(メタデータ) (2021-03-09T19:14:33Z) - Video Summarization Using Deep Neural Networks: A Survey [72.98424352264904]
ビデオ要約技術は、ビデオコンテンツの最も有益な部分を選択して、簡潔で完全なシノプシスを作成することを目指しています。
本研究は,この領域における最近の進歩に着目し,既存の深層学習に基づく総括的映像要約手法の包括的調査を行う。
論文 参考訳(メタデータ) (2021-01-15T11:41:29Z) - Video Prediction via Example Guidance [156.08546987158616]
ビデオ予測タスクでは、将来のコンテンツとダイナミクスのマルチモーダルな性質を捉えることが大きな課題である。
本研究では,有効な将来状態の予測を効果的に行うための,シンプルで効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:57:24Z) - Deep Learning for Vision-based Prediction: A Survey [6.840474688871695]
ビジョンベースの予測アルゴリズムには、自律運転、監視、人間とロボットのインタラクション、天気予報など、幅広い応用がある。
本稿では,過去5年間の分野の概要を述べるとともに,深層学習のアプローチに焦点をあてる。
論文 参考訳(メタデータ) (2020-06-30T20:26:46Z) - Academic Performance Estimation with Attention-based Graph Convolutional
Networks [17.985752744098267]
学生の過去のデータから、学生のパフォーマンス予測の課題は、将来のコースにおける生徒の成績を予測することである。
学生のパフォーマンス予測の伝統的な方法は、通常、複数のコース間の基礎となる関係を無視する。
本稿では,学生のパフォーマンス予測のための新しい注目型グラフ畳み込みネットワークモデルを提案する。
論文 参考訳(メタデータ) (2019-12-26T23:11:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。