論文の概要: Sparse Pedestrian Character Learning for Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2311.15512v1
- Date: Mon, 27 Nov 2023 03:15:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 17:16:38.130278
- Title: Sparse Pedestrian Character Learning for Trajectory Prediction
- Title(参考訳): 軌跡予測のためのスパース歩行者文字学習
- Authors: Yonghao Dong, Le Wang, Sanpin Zhou, Gang Hua, and Changyin Sun
- Abstract要約: 歩行者軌跡予測のための2ストリームスパースキャラクタネットワーク(TSNet)を提案する。
TSNetはスパース文字表現ストリーム内の負除去文字を学習し、軌道埋め込みを改善する。
我々の手法は既存の最先端手法よりも優れています。
- 参考スコア(独自算出の注目度): 28.307184858876585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian trajectory prediction in a first-person view has recently
attracted much attention due to its importance in autonomous driving. Recent
work utilizes pedestrian character information, \textit{i.e.}, action and
appearance, to improve the learned trajectory embedding and achieves
state-of-the-art performance. However, it neglects the invalid and negative
pedestrian character information, which is harmful to trajectory representation
and thus leads to performance degradation. To address this issue, we present a
two-stream sparse-character-based network~(TSNet) for pedestrian trajectory
prediction. Specifically, TSNet learns the negative-removed characters in the
sparse character representation stream to improve the trajectory embedding
obtained in the trajectory representation stream. Moreover, to model the
negative-removed characters, we propose a novel sparse character graph,
including the sparse category and sparse temporal character graphs, to learn
the different effects of various characters in category and temporal
dimensions, respectively. Extensive experiments on two first-person view
datasets, PIE and JAAD, show that our method outperforms existing
state-of-the-art methods. In addition, ablation studies demonstrate different
effects of various characters and prove that TSNet outperforms approaches
without eliminating negative characters.
- Abstract(参考訳): 近年,自律運転の重要性から,歩行者の軌道予測が注目されている。
最近の研究では、歩行者の文字情報 \textit{i.e.}、行動と外観を用いて、学習された軌道埋め込みを改善し、最先端のパフォーマンスを達成している。
しかし、軌道表現に悪影響を及ぼす無効な歩行者文字情報や負の歩行者文字情報を無視し、性能低下を招く。
この問題に対処するために,歩行者軌跡予測のための2ストリームスパースキャラクタネットワーク~(TSNet)を提案する。
具体的には、tsnetはスパース文字表現ストリーム内の負の削除文字を学習し、軌道表現ストリームで得られる軌道埋め込みを改善する。
さらに,否定削除された文字をモデル化するために,スパースカテゴリとスパース時間文字グラフを含む新しいスパース文字グラフを提案し,それぞれカテゴリと時間次元の様々な文字の異なる効果を学習する。
PIEとJAADの2つの個人ビューデータセットに対する大規模な実験により、我々の手法は既存の最先端手法よりも優れていることが示された。
加えて、アブレーション研究は様々な文字の異なる効果を示し、tsnetが負の文字を排除することなくアプローチを上回っていることを証明している。
関連論文リスト
- A Survey of Deep Graph Learning under Distribution Shifts: from Graph Out-of-Distribution Generalization to Adaptation [59.14165404728197]
我々は,分散シフト下での深層グラフ学習について,最新かつ先見的なレビューを行う。
具体的には,グラフ OOD 一般化,トレーニング時グラフ OOD 適応,テスト時グラフ OOD 適応の3つのシナリオについて述べる。
文献の理解を深めるために,提案した分類に基づく既存モデルを体系的に分類した。
論文 参考訳(メタデータ) (2024-10-25T02:39:56Z) - Exploring the Performance of Continuous-Time Dynamic Link Prediction Algorithms [14.82820088479196]
ダイナミックリンク予測(DLP)は、進化するネットワークにおける将来のリンクの予測に対処する。
本研究では,このような総合的な評価を行うためのツールをコントリビュートする。
評価時に使用可能な陰性サンプリング手法の網羅的な分類法について述べる。
論文 参考訳(メタデータ) (2024-05-27T14:03:28Z) - Comparison of Pedestrian Prediction Models from Trajectory and
Appearance Data for Autonomous Driving [13.126949982768505]
歩行者の動きを予測できる能力は、自動運転車にとって重要な能力である。
都市環境では、歩行者は道路エリアに入り、運転のリスクが高い。
本研究は,歩行者予測のための軌跡のみと外観に基づく手法の比較評価を行う。
論文 参考訳(メタデータ) (2023-05-25T11:24:38Z) - Learning Transferable Pedestrian Representation from Multimodal
Information Supervision [174.5150760804929]
VAL-PATは、移動可能な表現を学習し、様々な歩行者分析タスクをマルチモーダル情報で強化する新しいフレームワークである。
まず、LUPerson-TAデータセットで事前トレーニングを行い、各画像にはテキストと属性アノテーションが含まれている。
次に、学習した表現を、人物のreID、人物属性認識、テキストベースの人物検索など、さまざまな下流タスクに転送する。
論文 参考訳(メタデータ) (2023-04-12T01:20:58Z) - Learning the Legibility of Visual Text Perturbations [18.975457219666556]
NLPの摂動入力における多くの敵対的攻撃は、視覚的に類似した文字列を生成する。
LEGITデータセットからの正当摂動は、最もよく知られた攻撃戦略よりもNLPモデルの性能低下に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-09T07:22:07Z) - Forecasting Human Trajectory from Scene History [51.72069374835107]
我々は,暗黙の場面の規則性から学習することで,将来の軌跡を予測することを提案する。
本研究では,シーン履歴情報を歴史的グループ軌跡と個々人のインタラクションの2つのタイプに分類する。
本稿では,シーン履歴をシンプルかつ効果的なアプローチで活用する,SHENet(Scene History Excavating Network)を提案する。
論文 参考訳(メタデータ) (2022-10-17T03:56:02Z) - Semantics-STGCNN: A Semantics-guided Spatial-Temporal Graph
Convolutional Network for Multi-class Trajectory Prediction [9.238700679836855]
グラフ畳み込みニューラルネットワークにクラス情報を導入し、個人の軌道をより正確に予測する。
AADE(Average2 Displacement Error)とaFDE(Average Final Deplacement Error)と呼ばれる新しいメトリクスを提案する。
既存のメトリクスや新しく提案されたメトリクスの最先端よりも、一貫して優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2021-08-10T15:02:50Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z) - Motion Prediction using Trajectory Sets and Self-Driving Domain
Knowledge [3.0938904602244355]
我々は,オフロード予測をペナルティ化する補助的損失を加えることによって,動作予測に対する分類に基づくアプローチを構築した。
この補助損失は、地図情報のみを使用して容易に事前訓練でき、小さなデータセットの性能を大幅に向上させる。
最後のコントリビューションは、2つの公用自動運転データセットの分類と順序回帰の詳細な比較である。
論文 参考訳(メタデータ) (2020-06-08T17:37:15Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。