論文の概要: Learning to Abstract and Predict Human Actions
- arxiv url: http://arxiv.org/abs/2008.09234v1
- Date: Thu, 20 Aug 2020 23:57:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 03:49:43.262395
- Title: Learning to Abstract and Predict Human Actions
- Title(参考訳): ヒューマンアクションの抽象化と予測を学ぶ
- Authors: Romero Morais, Vuong Le, Truyen Tran, Svetha Venkatesh
- Abstract要約: ビデオにおける人間の活動の階層構造をモデル化し,行動予測におけるそのような構造の効果を実証する。
イベントの部分的階層を観察し、その構造を複数の抽象化レベルで将来の予測にロールアウトすることで、人間の活動の構造を学習できる階層型ニューラルネットワークであるHierarchical-Refresher-Anticipatorを提案する。
- 参考スコア(独自算出の注目度): 60.85905430007731
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human activities are naturally structured as hierarchies unrolled over time.
For action prediction, temporal relations in event sequences are widely
exploited by current methods while their semantic coherence across different
levels of abstraction has not been well explored. In this work we model the
hierarchical structure of human activities in videos and demonstrate the power
of such structure in action prediction. We propose Hierarchical
Encoder-Refresher-Anticipator, a multi-level neural machine that can learn the
structure of human activities by observing a partial hierarchy of events and
roll-out such structure into a future prediction in multiple levels of
abstraction. We also introduce a new coarse-to-fine action annotation on the
Breakfast Actions videos to create a comprehensive, consistent, and cleanly
structured video hierarchical activity dataset. Through our experiments, we
examine and rethink the settings and metrics of activity prediction tasks
toward unbiased evaluation of prediction systems, and demonstrate the role of
hierarchical modeling toward reliable and detailed long-term action
forecasting.
- Abstract(参考訳): 人間の活動は時間とともに階層化されていく。
行動予測では、イベントシーケンスにおける時間的関係は現在の手法で広く活用されているが、異なる抽象レベルにわたる意味的一貫性は十分に研究されていない。
本研究では,映像中の人間の活動の階層構造をモデル化し,行動予測におけるその構造のパワーを実証する。
本稿では,イベントの階層構造を観察し,その構造を複数の抽象レベルでの将来の予測にロールアウトすることにより,人間の活動構造を学習できる階層型エンコーダ・レフレッシャー予測器を提案する。
我々はまた、Breakfast Actionsビデオに新しい粗いアクションアノテーションを導入し、包括的で一貫性があり、クリーンに構造化されたビデオ階層的アクティビティデータセットを作成する。
実験を通じて,予測システムの非バイアス評価に向けた活動予測タスクの設定とメトリクスを再考し,信頼性と詳細な長期的行動予測に対する階層的モデリングの役割を実証した。
関連論文リスト
- A Multi-Branched Radial Basis Network Approach to Predicting Complex Chaotic Behaviours [0.0]
本稿では,複雑でカオス的な振る舞いを特徴とする物理誘引器の動的特性を予測するために,多分岐ネットワークアプローチを提案する。
その結果,実世界の36,700の時系列観測データから得られた100の予測値に対して,アトラクタの軌道の予測に成功した。
論文 参考訳(メタデータ) (2024-03-31T09:10:32Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Motion-Scenario Decoupling for Rat-Aware Video Position Prediction:
Strategy and Benchmark [49.58762201363483]
本研究では,個人や環境の影響要因を考慮し,生物ロボットの動き予測データセットであるRatPoseを紹介する。
本稿では,シナリオ指向とモーション指向を効果的に分離するDual-stream Motion-Scenario Decouplingフレームワークを提案する。
難易度が異なるタスクに対して,提案したtextitDMSD フレームワークの大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-05-17T14:14:31Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Hierarchically Self-Supervised Transformer for Human Skeleton
Representation Learning [45.13060970066485]
階層型トランスフォーマーベーススケルトンシーケンスエンコーダ(Hi-TRS)に組み込まれた自己教師型階層型事前学習方式を提案する。
教師付き評価プロトコルと半教師付き評価プロトコルの両方で,本手法は最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-07-20T04:21:05Z) - Developing hierarchical anticipations via neural network-based event
segmentation [14.059479351946386]
我々は、自律的に学習された潜在イベントコードによる階層的予測の開発をモデル化する。
本稿では,学習バイアスが緩やかに変化する潜在状態の発達を促進する階層的再帰型ニューラルネットワークアーキテクチャを提案する。
より高いレベルのネットワークは、潜伏状態が変化しがちな状況を予測することを学ぶ。
論文 参考訳(メタデータ) (2022-06-04T18:54:31Z) - Self-Supervision by Prediction for Object Discovery in Videos [62.87145010885044]
本稿では,この予測タスクを自己監督として利用し,画像シーケンス表現のための新しいオブジェクト中心モデルを構築する。
私たちのフレームワークは、手動アノテーションや事前トレーニングされたネットワークを使わずにトレーニングできます。
最初の実験では、提案されたパイプラインがオブジェクト中心のビデオ予測への有望なステップであることを確認した。
論文 参考訳(メタデータ) (2021-03-09T19:14:33Z) - Machine-Generated Hierarchical Structure of Human Activities to Reveal
How Machines Think [0.0]
人間の行動認識のための階層的ラベリングシステムの構築の重要性と実現可能性について議論する。
ブラックボックスharモデルの予測を用いて,異なる活動間の類似性を同定する。
このシステムでは、同じレベルのアクティビティラベルは、設計された精度の大きさを持ち、特定の量のアクティビティの詳細を反映します。
論文 参考訳(メタデータ) (2021-01-19T20:40:22Z) - Learning intuitive physics and one-shot imitation using
state-action-prediction self-organizing maps [0.0]
人間は探索と模倣によって学び、世界の因果モデルを構築し、両方を使って新しいタスクを柔軟に解決する。
このような特徴を生み出す単純だが効果的な教師なしモデルを提案する。
エージェントがアクティブな推論スタイルで柔軟に解決する、複数の関連するが異なる1ショットの模倣タスクに対して、その性能を示す。
論文 参考訳(メタデータ) (2020-07-03T12:29:11Z) - Inferring Temporal Compositions of Actions Using Probabilistic Automata [61.09176771931052]
本稿では,動作の時間的構成を意味正規表現として表現し,確率的オートマトンを用いた推論フレームワークを提案する。
我々のアプローチは、長い範囲の複雑なアクティビティを、順序のないアトミックアクションのセットとして予測するか、自然言語文を使ってビデオを取得するという既存の研究とは異なる。
論文 参考訳(メタデータ) (2020-04-28T00:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。