Fugu-MT 論文翻訳(概要): Another Vertical View: A Hierarchical Network for Heterogeneous Trajectory Prediction via Spectrums

論文の概要: Another Vertical View: A Hierarchical Network for Heterogeneous Trajectory Prediction via Spectrums

arxiv url: http://arxiv.org/abs/2304.05106v2
Date: Tue, 03 Dec 2024 01:19:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:19.928031
Title: Another Vertical View: A Hierarchical Network for Heterogeneous Trajectory Prediction via Spectrums
Title（参考訳）: もう一つの垂直的視点:スペクトルによる不均一軌道予測のための階層的ネットワーク
Authors: Beihao Xia, Conghao Wong, Duanquan Xu, Qinmu Peng, Xinge You,
Abstract要約: トラジェクティブ次元の$M$を導入し、アプリケーションシナリオをヘテロジニアスなトラジェクトリに拡張する。我々は、時間-周波数応答と次元-相互作用を含む2つの因子をモデル化し、同時に融合するために、双線形構造を採用する。実験により、提案モデルはETH-UCY、SDD、nuScenes、Human3.6Mにおいて、不均一な軌跡を持つ最先端の手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 14.009392073139441
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the fast development of AI-related techniques, the applications of trajectory prediction are no longer limited to easier scenes and trajectories. More and more trajectories with different forms, such as coordinates, bounding boxes, and even high-dimensional human skeletons, need to be analyzed and forecasted. Among these heterogeneous trajectories, interactions between different elements within a frame of trajectory, which we call ``Dimension-wise Interactions'', would be more complex and challenging. However, most previous approaches focus mainly on a specific form of trajectories, and potential dimension-wise interactions are less concerned. In this work, we expand the trajectory prediction task by introducing the trajectory dimensionality $M$, thus extending its application scenarios to heterogeneous trajectories. We first introduce the Haar transform as an alternative to Fourier transform to better capture the time-frequency properties of each trajectory-dimension. Then, we adopt the bilinear structure to model and fuse two factors simultaneously, including the time-frequency response and the dimension-wise interaction, to forecast heterogeneous trajectories via trajectory spectrums hierarchically in a generic way. Experiments show that the proposed model outperforms most state-of-the-art methods on ETH-UCY, SDD, nuScenes, and Human3.6M with heterogeneous trajectories, including 2D coordinates, 2D/3D bounding boxes, and 3D human skeletons.
Abstract（参考訳）: AI関連の技術の急速な発展により、軌跡予測の応用は、より簡単なシーンや軌跡に限らない。座標、バウンディングボックス、さらには高次元の人間の骨格など、様々な形の軌道を解析し予測する必要がある。これらの異種軌道の中で、軌道のフレーム内の異なる要素間の相互作用はより複雑で困難である。しかし、これまでのほとんどのアプローチは、主に特定の形の軌道に焦点をあてており、ポテンシャル次元の相互作用は、あまり関係がない。本研究では, トラジェクティブ次元を$M$にすることで, トラジェクティブ予測タスクを拡張し, 応用シナリオをヘテロジニアスなトラジェクトリに拡張する。まず、各軌跡次元の時間周波数特性をよりよく捉えるために、フーリエ変換の代替としてハール変換を導入する。そこで,両線形構造を用いて時間-周波数応答と次元-次元相互作用を含む2つの因子を同時にモデル化し,軌道スペクトルによる異種軌道を階層的に予測する。実験により、提案モデルは、ETH-UCY、SDD、nuScenes、Human3.6Mにおいて、2D座標、2D/3Dバウンディングボックス、および3D人間の骨格を含む異種軌道において、最先端の手法よりも優れていることが示された。

関連論文リスト

Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文参考訳（メタデータ） (2026-03-04T11:38:12Z)
PatchTraj: Unified Time-Frequency Representation Learning via Dynamic Patches for Trajectory Prediction [14.48846131633279]
軌道予測のための時間周波数ジョイントモデリングを統合した動的パッチベースのフレームワークを提案する。具体的には、軌道を生の時間列と周波数成分に分解し、動的パッチ分割を用いてマルチスケールセグメンテーションを行う。その結果、拡張された埋め込みは強力な表現力を示し、バニラアーキテクチャを使用した場合でも正確な予測を可能にする。
論文参考訳（メタデータ） (2025-07-25T09:55:33Z)
EMoTive: Event-guided Trajectory Modeling for 3D Motion Estimation [59.33052312107478]
イベントカメラは、シーン変化に対する連続的適応ピクセルレベル応答による3次元モーション推定の可能性を提供する。本稿では,イベント誘導パラメトリック曲線を用いた一様軌道をモデル化するイベントベースフレームワークであるEMoveについて述べる。動作表現には,事象誘導下での空間的特徴と時間的特徴を融合する密度認識適応機構を導入する。最終3次元運動推定は、パラメトリック軌道、流れ、深度運動場の多時間サンプリングによって達成される。
論文参考訳（メタデータ） (2025-03-14T13:15:54Z)
Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.93661496405653]
我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文参考訳（メタデータ） (2024-07-03T10:42:09Z)
StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.29257945966914]
我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文参考訳（メタデータ） (2024-06-28T11:35:35Z)
S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠であるこれまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-22T11:40:49Z)
STGlow: A Flow-based Generative Framework with Dual Graphormer for Pedestrian Trajectory Prediction [22.553356096143734]
歩行者軌跡予測(STGlow)のための二重グラフマーを用いた新しい生成フローベースフレームワークを提案する。本手法は,動作の正確なログライクな振る舞いを最適化することにより,基礎となるデータ分布をより正確にモデル化することができる。いくつかのベンチマークによる実験結果から,本手法は従来の最先端手法に比べて性能が向上することが示された。
論文参考訳（メタデータ） (2022-11-21T07:29:24Z)
Self-supervised Trajectory Representation Learning with Temporal Regularities and Travel Semantics [30.9735101687326]
Trajectory Representation Learning (TRL) は空間時間データ分析と管理のための強力なツールである。既存のTRLの作業は通常、トラジェクトリを通常のシーケンスデータとして扱うが、時間的規則性や旅行意味論といった重要な時空間特性は、完全には利用されない。本稿では,TemporAl規則と旅行意味論,すなわちSTARTを用いた自己教師付き軌道表現学習フレームワークを提案する。
論文参考訳（メタデータ） (2022-11-17T13:14:47Z)
D2-TPred: Discontinuous Dependency for Trajectory Prediction under Traffic Lights [68.76631399516823]
本稿では,空間的動的相互作用グラフ(SDG)と行動依存グラフ(BDG)を用いて,交通信号に対する軌道予測手法D2-TPredを提案する。実験の結果,VTP-TLではADEとFDEでそれぞれ20.45%,20.78%以上を達成できた。
論文参考訳（メタデータ） (2022-07-21T10:19:07Z)
Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文参考訳（メタデータ） (2022-03-25T16:59:08Z)
Trajectory Prediction with Graph-based Dual-scale Context Fusion [43.51107329748957]
本稿では,Dual Scale Predictorというグラフベースの軌道予測ネットワークを提案する。静的および動的駆動コンテキストを階層的にエンコードする。提案したデュアルスケールコンテキスト融合ネットワークにより、DSPは正確で人間らしいマルチモーダル軌道を生成することができる。
論文参考訳（メタデータ） (2021-11-02T13:42:16Z)
SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文参考訳（メタデータ） (2021-04-04T03:17:42Z)
Haar Wavelet based Block Autoregressive Flows for Trajectories [129.37479472754083]
歩行者等の軌道予測は,自律型エージェントの性能向上に不可欠である。本稿では分割結合を利用した新しいハールウェーブレットに基づくブロック自己回帰モデルを提案する。実世界の2つのデータセット上で、多種多様な正確な軌跡を生成するアプローチの利点について説明する。
論文参考訳（メタデータ） (2020-09-21T13:57:10Z)
BiTraP: Bi-directional Pedestrian Trajectory Prediction with Multi-modal Goal Estimation [28.10445924083422]
BiTraPはCVAEに基づく目標条件付き双方向マルチモーダル軌道予測手法である。 BiTraPは、FPV(First-person view)とBEV(Bird's-eye view)の両方のシナリオに一般化し、最先端の結果を10～50%上回る。
論文参考訳（メタデータ） (2020-07-29T02:40:17Z)
Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition [79.33539539956186]
本稿では,マルチスケールグラフ畳み込みと,G3Dという空間時間グラフ畳み込み演算子を結合する簡単な方法を提案する。これらの提案を結合することにより,MS-G3Dという強力な特徴抽出器を開発し,そのモデルが3つの大規模データセット上で従来の最先端手法より優れていることを示す。
論文参考訳（メタデータ） (2020-03-31T11:28:25Z)
A Spatial-Temporal Attentive Network with Spatial Continuity for Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文参考訳（メタデータ） (2020-03-13T04:35:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。