Fugu-MT 論文翻訳(概要): Robots That Can See: Leveraging Human Pose for Trajectory Prediction

論文の概要: Robots That Can See: Leveraging Human Pose for Trajectory Prediction

arxiv url: http://arxiv.org/abs/2309.17209v1
Date: Fri, 29 Sep 2023 13:02:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-02 13:56:20.061002
Title: Robots That Can See: Leveraging Human Pose for Trajectory Prediction
Title（参考訳）: 見えるロボット:人間のポーズを軌道予測に活用
Authors: Tim Salzmann, Lewis Chiang, Markus Ryll, Dorsa Sadigh, Carolina Parada and Alex Bewley
Abstract要約: 本研究では,人間中心環境における未来の軌道を予測するためのトランスフォーマーアーキテクチャを提案する。結果として得られたモデルは、将来の人間の軌道予測に固有の不確実性を捉えている。我々は,限られた履歴データを持つ新しいエージェントを誤りの主な要因として同定し,予測誤差を低減するために3次元骨格ポーズの相補的な性質を実証する。
参考スコア（独自算出の注目度）: 30.919756497223343
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Anticipating the motion of all humans in dynamic environments such as homes and offices is critical to enable safe and effective robot navigation. Such spaces remain challenging as humans do not follow strict rules of motion and there are often multiple occluded entry points such as corners and doors that create opportunities for sudden encounters. In this work, we present a Transformer based architecture to predict human future trajectories in human-centric environments from input features including human positions, head orientations, and 3D skeletal keypoints from onboard in-the-wild sensory information. The resulting model captures the inherent uncertainty for future human trajectory prediction and achieves state-of-the-art performance on common prediction benchmarks and a human tracking dataset captured from a mobile robot adapted for the prediction task. Furthermore, we identify new agents with limited historical data as a major contributor to error and demonstrate the complementary nature of 3D skeletal poses in reducing prediction error in such challenging scenarios.
Abstract（参考訳）: 安全で効果的なロボットナビゲーションを実現するためには、家やオフィスなどの動的環境におけるすべての人間の動きを予想することが重要である。このような空間は、人間が厳格な運動規則に従わず、突然の遭遇の機会を生み出すコーナーやドアなど、複数の閉塞されたエントリーポイントが存在するため、依然として困難である。本研究では,人間の位置,頭部方向,3次元骨格キーポイントなどの入力特徴から人中心環境における人間の将来の軌跡を予測するためのトランスフォーマーベースのアーキテクチャを提案する。得られたモデルは、将来の人間の軌道予測に固有の不確かさを捉え、予測タスクに適応した移動ロボットから取得した共通予測ベンチマークおよび人間追跡データセットにおいて、最先端のパフォーマンスを達成する。さらに, 限られた履歴データを持つ新しいエージェントを誤りの主な要因として同定し, 予測誤差の低減に寄与する3次元骨格の相補性を示す。

関連論文リスト

CoNav: A Benchmark for Human-Centered Collaborative Navigation [66.6268966718022]
協調ナビゲーション(CoNav)ベンチマークを提案する。われわれのCoNavは、現実的で多様な人間の活動を伴う3Dナビゲーション環境を構築するという重要な課題に取り組む。本研究では,長期的意図と短期的意図の両方を推論する意図認識エージェントを提案する。
論文参考訳（メタデータ） (2024-06-04T15:44:25Z)
Multimodal Sense-Informed Prediction of 3D Human Motions [16.71099574742631]
本研究は,2つのモーダル情報に対して高忠実度を生成するマルチモーダル・インフォームド・モーション・予測手法を提案する。視線情報は人間の意図と見なされ、動きとシーンの特徴が組み合わさって、世代を監督するために第3の意図に注意を向ける。実世界の2つのベンチマークにおいて,提案手法は3次元人間のポーズと軌道予測の両方において最先端の性能を達成する。
論文参考訳（メタデータ） (2024-05-05T12:38:10Z)
Exploring 3D Human Pose Estimation and Forecasting from the Robot's Perspective: The HARPER Dataset [52.22758311559]
本研究では,ユーザとスポット間のダイアドインタラクションにおける3次元ポーズ推定と予測のための新しいデータセットであるHARPERを紹介する。キーノーベルティは、ロボットの視点、すなわちロボットのセンサーが捉えたデータに焦点を当てることである。 HARPERの基盤となるシナリオには15のアクションが含まれており、そのうち10つはロボットとユーザの間の物理的接触を含んでいる。
論文参考訳（メタデータ） (2024-03-21T14:53:50Z)
Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文参考訳（メタデータ） (2023-12-26T18:56:49Z)
DMMGAN: Diverse Multi Motion Prediction of 3D Human Joints using Attention-Based Generative Adverserial Network [9.247294820004143]
本稿では,多種多様な人間の動きを予測するためのトランスフォーマーに基づく生成モデルを提案する。本モデルでは、まず、股関節に対する身体の姿勢を予測し、次に、textitHip予測モジュールが、予測された各ポーズフレームに対する股関節運動の軌跡を予測する。本研究では,ヒトの動作予測において,股関節運動を伴う多動将来の軌跡を予測しながら,最先端の動作予測に優れることを示す。
論文参考訳（メタデータ） (2022-09-13T23:22:33Z)
GIMO: Gaze-Informed Human Motion Prediction in Context [75.52839760700833]
本研究では、高品質なボディポーズシーケンス、シーンスキャン、目視によるエゴ中心のビューを提供する大規模な人体動作データセットを提案する。私たちのデータ収集は特定のシーンに縛られません。視線の全可能性を実現するために,視線と運動枝の双方向通信を可能にする新しいネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-04-20T13:17:39Z)
Egocentric Human Trajectory Forecasting with a Wearable Camera and Multi-Modal Fusion [24.149925005674145]
混雑した空間における自我中心型カメラ装着者(自我者)の軌道予測の問題に対処する。異なるカメラ装着者のデータから得られた軌道予測能力は、視覚障害者のナビゲーションを支援するために転送することができる。トランスフォーマーをベースとしたエンコーダ・デコーダニューラルネットワークモデルが,カメラ装着者の将来の軌道を予測するために,新しいカスケード型クロスアテンション機構と統合されている。
論文参考訳（メタデータ） (2021-11-01T14:58:05Z)
Probabilistic Human Motion Prediction via A Bayesian Neural Network [71.16277790708529]
本稿では,人間の動作予測のための確率モデルを提案する。我々のモデルは、観測された動きシーケンスが与えられたときに、いくつかの将来の動きを生成することができる。我々は、大規模ベンチマークデータセットHuman3.6mに対して、我々のアプローチを広範囲に検証した。
論文参考訳（メタデータ） (2021-07-14T09:05:33Z)
TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文参考訳（メタデータ） (2021-04-08T20:01:00Z)
From Recognition to Prediction: Analysis of Human Action and Trajectory Prediction in Video [4.163207534602723]
将来の経路/軌道を予測するための人間の行動の解読が重要である。人間の軌道予測は依然として困難な課題である。システムは、シーンセマンティクスと同様に、人間の活動を検出し、分析しなければなりません。
論文参考訳（メタデータ） (2020-11-20T22:23:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。