論文の概要: InCrowdFormer: On-Ground Pedestrian World Model From Egocentric Views
- arxiv url: http://arxiv.org/abs/2303.09534v1
- Date: Thu, 16 Mar 2023 17:51:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 14:19:04.843098
- Title: InCrowdFormer: On-Ground Pedestrian World Model From Egocentric Views
- Title(参考訳): incrowdformer:エゴセントリックな視点による歩行者世界モデル
- Authors: Mai Nishimura, Shohei Nobuhara, Ko Nishino
- Abstract要約: 我々は,地上の歩行者が地上の観衆のまわりを移動する様子を予測できる,地上の歩行者世界モデルを紹介した。
InCrowdFormerは、歩行者のインタラクションをモデル化してTransformerアーキテクチャを完全に活用し、注目を集めてトップダウンのビュー変換に重点を置いている。
我々は、歩行者の位置の後方分布を予測するために、未知の歩行者の高さから生じる不確実性を潜時符号で符号化する。
- 参考スコア(独自算出の注目度): 28.54213112712818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce an on-ground Pedestrian World Model, a computational model that
can predict how pedestrians move around an observer in the crowd on the ground
plane, but from just the egocentric-views of the observer. Our model,
InCrowdFormer, fully leverages the Transformer architecture by modeling
pedestrian interaction and egocentric to top-down view transformation with
attention, and autoregressively predicts on-ground positions of a variable
number of people with an encoder-decoder architecture. We encode the
uncertainties arising from unknown pedestrian heights with latent codes to
predict the posterior distributions of pedestrian positions. We validate the
effectiveness of InCrowdFormer on a novel prediction benchmark of real
movements. The results show that InCrowdFormer accurately predicts the future
coordination of pedestrians. To the best of our knowledge, InCrowdFormer is the
first-of-its-kind pedestrian world model which we believe will benefit a wide
range of egocentric-view applications including crowd navigation, tracking, and
synthesis.
- Abstract(参考訳): 我々は,地上の歩行者が地上の観衆の周囲を移動する様子を予測できる計算モデルとして,地上の歩行者世界モデルを紹介した。
我々のモデルであるInCrowdFormerは、歩行者インタラクションをモデル化してトランスフォーマーアーキテクチャを完全に活用し、アテンションを伴うトップダウンビュー変換をエゴセントリックにし、エンコーダ・デコーダアーキテクチャを持つ多人数の人の地上位置を自動回帰的に予測する。
未知の歩行者高から生じる不確かさを潜在コードで符号化し,歩行者位置の後方分布を予測する。
InCrowdFormerの有効性を,実動の新たな予測ベンチマークで検証する。
その結果,incrowdformerは歩行者の将来のコーディネーションを正確に予測できることがわかった。
私たちの知る限りでは、InCrowdFormerは初めての歩行者世界モデルであり、群衆のナビゲーション、追跡、合成など、幅広いエゴセントリックな視点のアプリケーションに恩恵をもたらすと信じています。
関連論文リスト
- PedFormer: Pedestrian Behavior Prediction via Cross-Modal Attention
Modulation and Gated Multitask Learning [10.812772606528172]
本研究では,エゴ中心の視点から,歩行者の将来の軌跡や横断行動を予測するために,異なるデータモダリティに依存する新しい枠組みを提案する。
本モデルでは, トラジェクトリとアクション予測の精度を, それぞれ22%, 13%向上した。
論文 参考訳(メタデータ) (2022-10-14T15:12:00Z) - T2FPV: Constructing High-Fidelity First-Person View Datasets From
Real-World Pedestrian Trajectories [9.44806128120871]
実世界のトップダウントラジェクトリ・データセットから高忠実度1人称ビュー・データセットを構築する方法T2FPVを提案する。
ETH/UCY歩行者データセットを用いて、対話する歩行者の自我中心の視覚データを生成する。
論文 参考訳(メタデータ) (2022-09-22T20:14:43Z) - WatchPed: Pedestrian Crossing Intention Prediction Using Embedded
Sensors of Smartwatch [11.83842808044211]
我々は、モーションセンサデータの統合に基づいて、最初の歩行者意図予測モデルを設計、実装、評価する。
モーションセンサデータを効果的に活用するために,新しい機械学習アーキテクチャを提案する。
本稿では,時間同期型モーションセンサデータと統合した最初の歩行者意図予測データセットを提案する。
論文 参考訳(メタデータ) (2022-08-15T21:27:21Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Pedestrian 3D Bounding Box Prediction [83.7135926821794]
我々は、自動運転車の複雑な動きの詳細をモデル化せずに、人間の合理的な推定値である3Dバウンディングボックスに焦点を当てる。
本稿では, 歩行者の3次元境界ボックス予測のための, 単純かつ効果的なモデルを提案する。
この方法は、繰り返しニューラルネットワークに基づくエンコーダ・デコーダアーキテクチャに従う。
論文 参考訳(メタデータ) (2022-06-28T17:59:45Z) - Pedestrian Stop and Go Forecasting with Hybrid Feature Fusion [87.77727495366702]
歩行者の立ち止まりと予測の新たな課題を紹介します。
都市交通における歩行者の立ち寄り行動を明示的に研究するためのベンチマークであるTransをリリースする。
歩行者の歩行動作に注釈を付けたいくつかの既存のデータセットから構築し、さまざまなシナリオや行動を実現する。
論文 参考訳(メタデータ) (2022-03-04T18:39:31Z) - Learning Sparse Interaction Graphs of Partially Observed Pedestrians for
Trajectory Prediction [0.3025231207150811]
マルチペデストリアン軌道予測は、非構造環境における群衆と相互作用する自律システムの必然的な安全要素である。
Gumbel Social Transformerを提案し、Edge Gumbel Selectorは、各ステップで部分的に観察された歩行者のスパースグラフをサンプリングする。
提案手法は,仮定によって生じる潜在的な問題を克服し,ベンチマーク評価における関連研究よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-15T00:45:11Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Pedestrian Intention Prediction: A Multi-task Perspective [83.7135926821794]
グローバルに展開するためには、自動運転車は歩行者の安全を保証する必要がある。
本研究は歩行者の意図と視覚状態を共同で予測することでこの問題を解決しようとするものである。
この方法はマルチタスク学習アプローチにおけるリカレントニューラルネットワークである。
論文 参考訳(メタデータ) (2020-10-20T13:42:31Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。