論文の概要: VIT-Ped: Visionary Intention Transformer for Pedestrian Behavior Analysis
- arxiv url: http://arxiv.org/abs/2601.01989v1
- Date: Mon, 05 Jan 2026 10:48:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.022203
- Title: VIT-Ped: Visionary Intention Transformer for Pedestrian Behavior Analysis
- Title(参考訳): VIT-Ped:歩行者行動解析のための視覚意図変換器
- Authors: Aly R. Elkammar, Karim M. Gamaleldin, Catherine M. Elias,
- Abstract要約: 本稿では,異なるデータモダリティを用いて異なる大きさのトランス/ビデオビジョン変換器に基づくアルゴリズムを提案する。
我々は,一般的な歩行者行動データセットであるJAADを用いてアルゴリズムを評価し,SOTA性能に到達し,精度,AUC,F1スコアなどの指標でSOTAをパスした。
- 参考スコア(独自算出の注目度): 0.8602553195689513
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pedestrian Intention prediction is one of the key technologies in the transition from level 3 to level 4 autonomous driving. To understand pedestrian crossing behaviour, several elements and features should be taken into consideration to make the roads of tomorrow safer for everybody. We introduce a transformer / video vision transformer based algorithm of different sizes which uses different data modalities .We evaluated our algorithms on popular pedestrian behaviour dataset, JAAD, and have reached SOTA performance and passed the SOTA in metrics like Accuracy, AUC and F1-score. The advantages brought by different model design choices are investigated via extensive ablation studies.
- Abstract(参考訳): 歩行者の意図予測は、レベル3からレベル4への自動運転への移行における重要な技術の1つである。
歩行者の横断行動を理解するためには、明日の道路をより安全にするため、いくつかの要素や特徴を考慮する必要がある。
本稿では,異なるデータモダリティを用いたトランス/ビデオ・ビジョン・トランスフォーマーに基づくアルゴリズムを提案する。
我々は,一般的な歩行者行動データセットであるJAADを用いてアルゴリズムを評価し,SOTA性能に到達し,精度,AUC,F1スコアなどの指標でSOTAをパスした。
異なるモデル設計選択によってもたらされる利点は、広範囲にわたるアブレーション研究によって研究されている。
関連論文リスト
- Overtake Detection in Trucks Using CAN Bus Signals: A Comparative Study of Machine Learning Methods [51.28632782308621]
ボルボグループが提供する5台の車載トラックから収集した制御エリアネットワーク(CAN)バスデータを用いたオーバーテイク検出に焦点を当てた。
車両操作検出、ニューラルネットワーク(ANN)、ランダムフォレスト(RF)、サポートベクトルマシン(SVM)の3つの共通分類器の評価を行った。
当社のパートラック分析では、特にオーバーテイクにおいて、車両毎のトレーニングデータの量に依存する分類精度も明らかにしています。
論文 参考訳(メタデータ) (2025-07-01T09:20:41Z) - Enhancing Pedestrian Trajectory Prediction with Crowd Trip Information [17.09138102827048]
正確な歩行者軌道予測には、個々の行動、社会的相互作用、道路環境の深い理解が必要である。
本稿では,歩行者軌道モデルに旅行情報を新たなモダリティとして取り入れた新しいアプローチを提案する。
道路網内の群集行動を調べることで,正確な軌道予測による歩行者の安全向上が期待できる。
論文 参考訳(メタデータ) (2024-09-23T17:11:31Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - PedFormer: Pedestrian Behavior Prediction via Cross-Modal Attention
Modulation and Gated Multitask Learning [10.812772606528172]
本研究では,エゴ中心の視点から,歩行者の将来の軌跡や横断行動を予測するために,異なるデータモダリティに依存する新しい枠組みを提案する。
本モデルでは, トラジェクトリとアクション予測の精度を, それぞれ22%, 13%向上した。
論文 参考訳(メタデータ) (2022-10-14T15:12:00Z) - Pedestrian Trajectory Prediction via Spatial Interaction Transformer
Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。
このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。
本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文 参考訳(メタデータ) (2021-12-13T13:08:04Z) - View Vertically: A Hierarchical Network for Trajectory Prediction via
Fourier Spectrums [8.065451321690011]
人間やロボットのようなエージェントの将来の動きや行動を理解し予測することを学ぶことは、さまざまな自律プラットフォームにとって極めて重要だ。
本稿では,キーポイントと相互作用レベルのスペクトルを持つエージェントの軌道をそれぞれ予測するTransformer-based Vモデルを提案する。
実験の結果,ETH-UCYおよびSDDトラジェクトリデータセットにおいて,Vは現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-14T11:48:31Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。