論文の概要: ViTE: Virtual Graph Trajectory Expert Router for Pedestrian Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2511.12214v1
- Date: Sat, 15 Nov 2025 13:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.680047
- Title: ViTE: Virtual Graph Trajectory Expert Router for Pedestrian Trajectory Prediction
- Title(参考訳): ViTE: 歩行者軌道予測のための仮想グラフ軌道エキスパートルータ
- Authors: Ruochen Li, Zhanxing Zhu, Tanqiu Qiao, Hubert P. H. Shum,
- Abstract要約: ViTE (Virtual graph Trajectory Expert router) は歩行者軌道予測のための新しいフレームワークである。
ViTEは2つの重要なモジュールで構成されている。ダイナミックな仮想ノードを導入し、GNNスタックを含まない長距離および高次のインタラクションをモデル化する仮想グラフと、ソーシャルコンテキストに基づいてインタラクションエキスパートを適応的に選択するエキスパートルータだ。
- 参考スコア(独自算出の注目度): 32.272860432923466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian trajectory prediction is critical for ensuring safety in autonomous driving, surveillance systems, and urban planning applications. While early approaches primarily focus on one-hop pairwise relationships, recent studies attempt to capture high-order interactions by stacking multiple Graph Neural Network (GNN) layers. However, these approaches face a fundamental trade-off: insufficient layers may lead to under-reaching problems that limit the model's receptive field, while excessive depth can result in prohibitive computational costs. We argue that an effective model should be capable of adaptively modeling both explicit one-hop interactions and implicit high-order dependencies, rather than relying solely on architectural depth. To this end, we propose ViTE (Virtual graph Trajectory Expert router), a novel framework for pedestrian trajectory prediction. ViTE consists of two key modules: a Virtual Graph that introduces dynamic virtual nodes to model long-range and high-order interactions without deep GNN stacks, and an Expert Router that adaptively selects interaction experts based on social context using a Mixture-of-Experts design. This combination enables flexible and scalable reasoning across varying interaction patterns. Experiments on three benchmarks (ETH/UCY, NBA, and SDD) demonstrate that our method consistently achieves state-of-the-art performance, validating both its effectiveness and practical efficiency.
- Abstract(参考訳): 歩行者の軌道予測は、自動運転、監視システム、都市計画の安全性を確保するために重要である。
初期のアプローチは主にワンホップ対関係に重点を置いているが、最近の研究では複数のグラフニューラルネットワーク(GNN)層を積み重ねることで高次相互作用を捉えようとしている。
しかしながら、これらのアプローチは基本的なトレードオフに直面している: 不十分な層は、モデルの受容領域を制限する過小評価の問題を招きかねないが、過度な深さは、計算コストの禁止をもたらす。
アーキテクチャの深さにのみ依存するのではなく、明示的なワンホップインタラクションと暗黙的な高次依存関係の両方を適応的にモデル化できる効果的なモデルが必要である、と我々は主張する。
そこで我々は,歩行者軌道予測のための新しいフレームワークであるViTE(Virtual graph Trajectory Expert router)を提案する。
ViTEは2つの重要なモジュールで構成されている: 動的仮想ノードを導入し、GNNスタックを使わずに長距離および高次のインタラクションをモデル化する仮想グラフと、Mixture-of-Experts設計を使用して、社会的コンテキストに基づいてインタラクションエキスパートを適応的に選択するExpert Routerである。
この組み合わせにより、さまざまなインタラクションパターンをまたいだフレキシブルでスケーラブルな推論が可能になる。
ETH/UCY, NBA, SDDの3つのベンチマーク実験により, 本手法が常に最先端性能を実現し, 有効性と有効性の両方を検証した。
関連論文リスト
- Unified Spatial-Temporal Edge-Enhanced Graph Networks for Pedestrian Trajectory Prediction [25.529613790994876]
UniEdgeは、歴史的パスに基づいて将来の動きを予測することを目的としている。
本稿では,高次クロスタイム相互作用を1次関係に単純化する統合STグラフデータ構造を提案する。
従来のGNNは、エッジ機能に符号化された暗黙の相互作用パターンの伝播を無視して、歩行者ノードの機能を集約することに重点を置いている。
E2E-N2N-GCN(Edge-to-Edge-Node-to-Node Graph Convolution)を提案する。
論文 参考訳(メタデータ) (2025-02-04T17:18:54Z) - StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.29257945966914]
我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。
ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。
また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文 参考訳(メタデータ) (2024-06-28T11:35:35Z) - Cross-modal Orthogonal High-rank Augmentation for RGB-Event
Transformer-trackers [58.802352477207094]
本研究では,2つのモード間の分布ギャップを埋めるために,事前学習された視覚変換器(ViT)の潜在可能性を探る。
本研究では,いくつかのトークンの特定のモダリティをランダムにマスキングし,異なるモダリティのトークン間の相互作用を積極的に行うマスクモデリング戦略を提案する。
実験により,我々のプラグアンドプレイトレーニング強化技術は,追跡精度と成功率の両方の観点から,最先端のワンストリームと2つのトラッカーストリームを大幅に向上させることができることが示された。
論文 参考訳(メタデータ) (2023-07-09T08:58:47Z) - Neural Temporal Point Processes for Forecasting Directional Relations in Evolving Hypergraphs [10.803714426078642]
汎用環境での方向性関係の予測問題に対する包括的解を提供する。
可能なハイパーエッジの数は、イベント時間毎のノード数で指数関数的である。
予測過程を複数の段階に分割する逐次生成手法を提案する。
論文 参考訳(メタデータ) (2023-01-28T14:32:14Z) - VIRT: Improving Representation-based Models for Text Matching through
Virtual Interaction [50.986371459817256]
本稿では,VIRT と呼ばれる新しいtextitVirtual InteRacTion 機構を提案する。
VIRTは、表現ベースのエンコーダに、対話ベースのモデルのように振舞いを模倣する仮想インタラクションを実行するよう要求する。
論文 参考訳(メタデータ) (2021-12-08T09:49:28Z) - DCAP: Deep Cross Attentional Product Network for User Response
Prediction [20.17934000984361]
我々はDCAP(Deep Cross Attentional Product Network)という新しいアーキテクチャを提案する。
DCAPは、高階機能相互作用をベクトルレベルで明示的にモデリングするクロスネットワークの利点を維持します。
提案モデルは容易に実装でき,並行して訓練できる。
論文 参考訳(メタデータ) (2021-05-18T16:27:20Z) - TCL: Transformer-based Dynamic Graph Modelling via Contrastive Learning [87.38675639186405]
我々は,動的に進化するグラフを連続的に扱う,TCLと呼ばれる新しいグラフニューラルネットワークアプローチを提案する。
我々の知る限りでは、これは動的グラフ上の表現学習にコントラスト学習を適用する最初の試みである。
論文 参考訳(メタデータ) (2021-05-17T15:33:25Z) - Graph Backdoor [53.70971502299977]
GTAはグラフニューラルネットワーク(GNN)に対する最初のバックドア攻撃である。
GTAは、トポロジカル構造と記述的特徴の両方を含む特定の部分グラフとしてトリガーを定義する。
トランスダクティブ(ノード分類など)とインダクティブ(グラフ分類など)の両方のタスクに対してインスタンス化することができる。
論文 参考訳(メタデータ) (2020-06-21T19:45:30Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。