論文の概要: Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions
- arxiv url: http://arxiv.org/abs/2206.12612v1
- Date: Sat, 25 Jun 2022 09:55:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-28 16:26:50.579251
- Title: Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions
- Title(参考訳): 対話型モーションから大規模物体の操作方法を予測するための学習
- Authors: Weilin Wan, Lei Yang, Lingjie Liu, Zhuoying Zhang, Ruixing Jia,
Yi-King Choi, Jia Pan, Christian Theobalt, Taku Komura and Wenping Wang
- Abstract要約: 本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
- 参考スコア(独自算出の注目度): 82.90906153293585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding human intentions during interactions has been a long-lasting
theme, that has applications in human-robot interaction, virtual reality and
surveillance. In this study, we focus on full-body human interactions with
large-sized daily objects and aim to predict the future states of objects and
humans given a sequential observation of human-object interaction. As there is
no such dataset dedicated to full-body human interactions with large-sized
daily objects, we collected a large-scale dataset containing thousands of
interactions for training and evaluation purposes. We also observe that an
object's intrinsic physical properties are useful for the object motion
prediction, and thus design a set of object dynamic descriptors to encode such
intrinsic properties. We treat the object dynamic descriptors as a new modality
and propose a graph neural network, HO-GCN, to fuse motion data and dynamic
descriptors for the prediction task. We show the proposed network that consumes
dynamic descriptors can achieve state-of-the-art prediction results and help
the network better generalize to unseen objects. We also demonstrate the
predicted results are useful for human-robot collaborations.
- Abstract(参考訳): 対話中の人間の意図を理解することは、長く続くテーマであり、人間とロボットの相互作用、バーチャルリアリティ、監視に応用されている。
本研究では,人間と物体の相互作用を連続的に観察することで,物体と人間の将来の状態を予測することを目的とした。
大規模な日常オブジェクトとフルボディのヒューマンインタラクション専用のデータセットは存在しないため、トレーニングや評価目的で数千のインタラクションを含む大規模なデータセットを収集しました。
また,物体の固有物理的性質が物体運動予測に有用であることを観察し,そのような固有特性を符号化する対象動的ディスクリプタの集合を設計する。
本稿では,オブジェクト動的ディスクリプタを新たなモダリティとして扱い,予測タスクに動きデータと動的ディスクリプタを融合するグラフニューラルネットワークho-gcnを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
また,予測結果が人間とロボットのコラボレーションに有用であることを示す。
関連論文リスト
- Object-centric Video Representation for Long-term Action Anticipation [33.115854386196126]
主な動機は、オブジェクトが人間とオブジェクトの相互作用を認識し予測するための重要な手がかりを提供することである。
我々は、視覚言語事前学習モデルを利用して、オブジェクト中心のビデオ表現を構築することを提案する。
人間と物体の相互作用を認識し予測するために、Transformerベースのニューラルアーキテクチャを用いる。
論文 参考訳(メタデータ) (2023-10-31T22:54:31Z) - InterDiff: Generating 3D Human-Object Interactions with Physics-Informed
Diffusion [29.25063155767897]
本稿では,3次元物体相互作用(HOI)の予測に向けた新しい課題について述べる。
我々のタスクは、様々な形状の動的物体をモデリングし、全身の動きを捉え、物理的に有効な相互作用を確実にする必要があるため、はるかに困難である。
複数の人-物間相互作用データセットを用いた実験は,本手法の有効性を実証し,現実的で,鮮明で,かつ,極めて長期にわたる3D HOI予測を生成できることを示した。
論文 参考訳(メタデータ) (2023-08-31T17:59:08Z) - HODN: Disentangling Human-Object Feature for HOI Detection [51.48164941412871]
本稿では,Human and Object Disentangling Network (HODN) を提案し,Human-Object Interaction (HOI) の関係を明示的にモデル化する。
インタラクションに人間的特徴がより寄与していることを考慮し,インタラクションデコーダが人間中心の領域に焦点を当てていることを確認するためのヒューマンガイドリンク手法を提案する。
提案手法は,V-COCOとHICO-Det Linkingデータセットの競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-20T04:12:50Z) - Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。
CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。
HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文 参考訳(メタデータ) (2022-12-20T19:50:54Z) - A Skeleton-aware Graph Convolutional Network for Human-Object
Interaction Detection [14.900704382194013]
そこで我々は,SGCN4HOIという人-物間相互作用検出のためのスケルトン対応グラフ畳み込みネットワークを提案する。
我々のネットワークは、人間のキーポイントとオブジェクトキーポイントの間の空間的接続を利用して、グラフの畳み込みによるきめ細かい構造的相互作用を捉えます。
このような幾何学的特徴と視覚的特徴と、人間と物体のペアから得られる空間的構成特徴を融合させる。
論文 参考訳(メタデータ) (2022-07-11T15:20:18Z) - GIMO: Gaze-Informed Human Motion Prediction in Context [75.52839760700833]
本研究では、高品質なボディポーズシーケンス、シーンスキャン、目視によるエゴ中心のビューを提供する大規模な人体動作データセットを提案する。
私たちのデータ収集は特定のシーンに縛られません。
視線の全可能性を実現するために,視線と運動枝の双方向通信を可能にする新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-04-20T13:17:39Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Hindsight for Foresight: Unsupervised Structured Dynamics Models from
Physical Interaction [24.72947291987545]
エージェントが世界と対話することを学ぶための鍵となる課題は、オブジェクトの物理的性質を推論することである。
本研究では,ラベルのない3次元点群と画像から直接,ロボットのインタラクションのダイナミクスをモデル化するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-08-02T11:04:49Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。