論文の概要: Predicting the Future from First Person (Egocentric) Vision: A Survey
- arxiv url: http://arxiv.org/abs/2107.13411v1
- Date: Wed, 28 Jul 2021 14:58:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-29 13:57:31.494504
- Title: Predicting the Future from First Person (Egocentric) Vision: A Survey
- Title(参考訳): ファーストパーソン(エゴセントリック)のビジョンから未来を予測する:サーベイ
- Authors: Ivan Rodin, Antonino Furnari, Dimitrios Mavroedis, Giovanni Maria
Farinella
- Abstract要約: この調査は、自我中心のビジョンから将来の予測の文脈における研究の進化を要約する。
アプリケーション、デバイス、既存の問題、一般的に使用されるデータセット、モデル、入力モダリティの概要を説明している。
我々の分析は、自我中心の視覚から将来の予測方法が、様々なアプリケーションに重大な影響を与えることを強調している。
- 参考スコア(独自算出の注目度): 18.07516837332113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Egocentric videos can bring a lot of information about how humans perceive
the world and interact with the environment, which can be beneficial for the
analysis of human behaviour. The research in egocentric video analysis is
developing rapidly thanks to the increasing availability of wearable devices
and the opportunities offered by new large-scale egocentric datasets. As
computer vision techniques continue to develop at an increasing pace, the tasks
related to the prediction of future are starting to evolve from the need of
understanding the present. Predicting future human activities, trajectories and
interactions with objects is crucial in applications such as human-robot
interaction, assistive wearable technologies for both industrial and daily
living scenarios, entertainment and virtual or augmented reality. This survey
summarises the evolution of studies in the context of future prediction from
egocentric vision making an overview of applications, devices, existing
problems, commonly used datasets, models and input modalities. Our analysis
highlights that methods for future prediction from egocentric vision can have a
significant impact in a range of applications and that further research efforts
should be devoted to the standardisation of tasks and the proposal of datasets
considering real-world scenarios such as the ones with an industrial vocation.
- Abstract(参考訳): エゴセントリックなビデオは、人間がどのように世界を知覚し、環境と相互作用するかに関する多くの情報をもたらすことができる。
egocentric video analysisの研究は、ウェアラブルデバイスの可用性の高まりと、新しい大規模egocentric datasetが提供する機会によって急速に進展している。
コンピュータビジョン技術が急速に発展を続ける中、未来予測に関連するタスクは、現在を理解する必要性から進化し始めている。
将来の人間の活動、軌道、物体との相互作用を予測することは、人間とロボットの相互作用、産業と日常の両方の生活シナリオのための補助ウェアラブル技術、エンターテイメント、バーチャルまたは拡張現実などの応用において重要である。
この調査は、アプリケーション、デバイス、既存の問題、一般的に使用されるデータセット、モデル、入力モダリティを概観する、エゴセントリックなビジョンから将来の予測の文脈における研究の進化をまとめたものだ。
分析の結果,エゴセントリックなビジョンからの将来の予測手法は,幅広いアプリケーションに多大な影響を与えうること,さらに課題の標準化や,産業的職業を持つような現実的なシナリオを考慮したデータセットの提案に,さらなる研究努力が注がれることが示唆された。
関連論文リスト
- Human Action Anticipation: A Survey [86.415721659234]
行動予測に関する文献は、行動予測、活動予測、意図予測、目標予測など、様々なタスクにまたがる。
我々の調査は、この断片化された文献を結びつけることを目的としており、最近の技術革新とモデルトレーニングと評価のための新しい大規模データセットの開発をカバーしています。
論文 参考訳(メタデータ) (2024-10-17T21:37:40Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - An Outlook into the Future of Egocentric Vision [35.98763217828443]
この調査は、特定のハードウェアに依存しない、エゴセントリックなビジョンのためのソフトウェアモデルに焦点を当てている。
この論文は、常にオンでパーソナライズされ、生活を支えていくエゴセントリックなビジョンへの道を開くために、即時探査の分野を推奨することで締めくくります。
論文 参考訳(メタデータ) (2023-08-14T13:10:48Z) - World Models and Predictive Coding for Cognitive and Developmental
Robotics: Frontiers and Challenges [51.92834011423463]
我々は世界モデルと予測符号化の2つの概念に焦点を当てる。
神経科学において、予測符号化は、脳がその入力を継続的に予測し、その環境における自身のダイナミクスと制御行動のモデル化に適応するように提案する。
論文 参考訳(メタデータ) (2023-01-14T06:38:14Z) - Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文 参考訳(メタデータ) (2022-06-25T09:55:39Z) - GIMO: Gaze-Informed Human Motion Prediction in Context [75.52839760700833]
本研究では、高品質なボディポーズシーケンス、シーンスキャン、目視によるエゴ中心のビューを提供する大規模な人体動作データセットを提案する。
私たちのデータ収集は特定のシーンに縛られません。
視線の全可能性を実現するために,視線と運動枝の双方向通信を可能にする新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-04-20T13:17:39Z) - A-ACT: Action Anticipation through Cycle Transformations [89.83027919085289]
未来を予測できる人間の能力が、機械学習アルゴリズムにどのように移行できるかを分析するために、一歩後退します。
人間の心理学に関する最近の研究は、発生を予測して、人間の脳が両方のシステムにカウントされていることを説明している。
本研究では,行動予測作業における各システムの影響について検討し,学習フレームワークに統合するためのパラダイムを導入する。
論文 参考訳(メタデータ) (2022-04-02T21:50:45Z) - 3D Human Motion Prediction: A Survey [23.605334184939164]
人間の3D動作予測は、与えられたシーケンスから将来のポーズを予測するもので、コンピュータビジョンとマシンインテリジェンスにおいて大きな重要性と課題である。
既存の公開文献からの関連作品のふりかえりと分析を目的として, 人間の3次元動作予測に関する総合的な調査を行った。
論文 参考訳(メタデータ) (2022-03-03T09:46:43Z) - Deep Learning for Human Mobility: a Survey on Data and Models [5.9623431392389]
人間の移動性の研究は、社会の様々な側面に影響を及ぼすため、非常に重要である。
電話記録、GPSトレース、ソーシャルメディア投稿などのデジタルモビリティデータの拡散は、深層学習を人間のモビリティに適用するきっかけとなった。
我々の調査は、次の位置予測、群集の流れ予測、軌道生成に対する先進的なディープラーニングソリューションのガイドである。
論文 参考訳(メタデータ) (2020-12-04T19:59:39Z) - From Recognition to Prediction: Analysis of Human Action and Trajectory
Prediction in Video [4.163207534602723]
将来の経路/軌道を予測するための人間の行動の解読が重要である。
人間の軌道予測は依然として困難な課題である。
システムは、シーンセマンティクスと同様に、人間の活動を検出し、分析しなければなりません。
論文 参考訳(メタデータ) (2020-11-20T22:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。