論文の概要: Cross Scene Prediction via Modeling Dynamic Correlation using Latent
Space Shared Auto-Encoders
- arxiv url: http://arxiv.org/abs/2003.13930v1
- Date: Tue, 31 Mar 2020 03:08:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 00:37:56.588562
- Title: Cross Scene Prediction via Modeling Dynamic Correlation using Latent
Space Shared Auto-Encoders
- Title(参考訳): 潜在空間共有オートエンコーダを用いた動的相関モデリングによるクロスシーン予測
- Authors: Shaochi Hu, Donghao Xu, Huijing Zhao
- Abstract要約: 2つのシーンの非同期な履歴観測のセットを考えると、その目的はクロスシーンの予測器を学習することである。
遅延空間共有オートエンコーダを用いた動的相関のモデル化により,この問題の解法を提案する。
- 参考スコア(独自算出の注目度): 6.530318792830862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work addresses on the following problem: given a set of unsynchronized
history observations of two scenes that are correlative on their dynamic
changes, the purpose is to learn a cross-scene predictor, so that with the
observation of one scene, a robot can onlinely predict the dynamic state of
another. A method is proposed to solve the problem via modeling dynamic
correlation using latent space shared auto-encoders. Assuming that the inherent
correlation of scene dynamics can be represented by shared latent space, where
a common latent state is reached if the observations of both scenes are at an
approximate time, a learning model is developed by connecting two auto-encoders
through the latent space, and a prediction model is built by concatenating the
encoder of the input scene with the decoder of the target one. Simulation
datasets are generated imitating the dynamic flows at two adjacent gates of a
campus, where the dynamic changes are triggered by a common working and
teaching schedule. Similar scenarios can also be found at successive
intersections on a single road, gates of a subway station, etc. Accuracy of
cross-scene prediction is examined at various conditions of scene correlation
and pairwise observations. Potentials of the proposed method are demonstrated
by comparing with conventional end-to-end methods and linear predictions.
- Abstract(参考訳): この研究は以下の問題に対処する: 動的変化に相関する2つのシーンの無同期履歴観測のセットを与えられた場合、あるシーンの観察により、ロボットが別のシーンの動的状態をオンラインで予測できるように、クロスシーン予測器を学習することである。
遅延空間共有オートエンコーダを用いた動的相関のモデル化により,この問題の解法を提案する。
両シーンの観測が近似時間であれば共通潜時状態に達するような共有潜時空間でシーンダイナミクス固有の相関を表現できると仮定すると、潜時空間を介して2つのオートエンコーダを接続して学習モデルを構築し、入力シーンのエンコーダと対象シーンのデコーダとを連結して予測モデルを構築する。
シミュレーションデータセットは、キャンパスの隣接する2つのゲートのダイナミックフローを模倣して生成され、そこでは、共通の作業と教育スケジュールによって動的変化が引き起こされる。
同様のシナリオは、1つの道路上の連続した交差点や地下鉄駅のゲートなどでも見られる。
シーン相関と相互観測の様々な条件において,クロスシーン予測の精度を検討した。
提案手法のポテンシャルは,従来のエンドツーエンド法と線形予測との比較により示される。
関連論文リスト
- AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - JointMotion: Joint Self-Supervision for Joint Motion Prediction [10.44846560021422]
JointMotionは、自動運転車における関節運動予測のための自己教師付き事前訓練手法である。
提案手法は,Wayformer,HPTR,Scene Transformerの各モデルにおける最終変位誤差を,それぞれ3%,8%,12%削減する。
論文 参考訳(メタデータ) (2024-03-08T17:54:38Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition [50.064502884594376]
本研究では、モーションキャプチャー(MoCap)シーケンスを用いた人間の行動認識の問題点について検討する。
メッシュシーケンスを直接モデル化する新しい時空間メッシュ変換器(STMT)を提案する。
提案手法は,スケルトンベースモデルやポイントクラウドベースモデルと比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-31T16:19:27Z) - Spatio-Temporal Relation Learning for Video Anomaly Detection [35.59510027883497]
異常識別は、オブジェクトとシーンの関係に大きく依存する。
本稿では,ビデオ異常検出タスクに対処するための空間時間関係学習フレームワークを提案する。
3つの公開データセットで実験を行い、最先端手法よりも優れた性能を示し、本手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-09-27T02:19:31Z) - Modelling Neighbor Relation in Joint Space-Time Graph for Video
Correspondence Learning [53.74240452117145]
本稿では、ラベルなしビデオから信頼できる視覚対応を学習するための自己教師付き手法を提案する。
接続時空間グラフでは,ノードがフレームからサンプリングされたグリッドパッチであり,2種類のエッジによってリンクされる。
学習した表現は、様々な視覚的タスクにおいて最先端の自己監督手法よりも優れています。
論文 参考訳(メタデータ) (2021-09-28T05:40:01Z) - End-to-end Contextual Perception and Prediction with Interaction
Transformer [79.14001602890417]
我々は3次元物体の検出と将来の動きを自動運転の文脈で予測する問題に取り組む。
空間的・時間的依存関係を捉えるために,新しいトランスフォーマーアーキテクチャを用いたリカレントニューラルネットワークを提案する。
私たちのモデルはエンドツーエンドでトレーニングでき、リアルタイムで実行されます。
論文 参考訳(メタデータ) (2020-08-13T14:30:12Z) - Dynamic and Static Context-aware LSTM for Multi-agent Motion Prediction [40.20696709103593]
本稿では,動的および静的な文脈認識型動作予測器(DSCMP)の新たな機構であるtextiti.e.を設計する。
豊富な情報をLong-Short-term-Memory (LSTM)に統合する。
エージェント間の動的相互作用を、空間的位置と時間的コヒーレンスの両方を学ぶことによってモデル化する。
潜在変数を推論することでシーンのコンテキストをキャプチャし、意味のあるセマンティックなシーンレイアウトを持つマルチモーダルな予測を可能にする。
論文 参考訳(メタデータ) (2020-08-03T11:03:57Z) - Implicit Latent Variable Model for Scene-Consistent Motion Forecasting [78.74510891099395]
本稿では,センサデータから直接複雑な都市交通のシーン一貫性のある動き予測を学習することを目的とする。
我々は、シーンを相互作用グラフとしてモデル化し、強力なグラフニューラルネットワークを用いてシーンの分散潜在表現を学習する。
論文 参考訳(メタデータ) (2020-07-23T14:31:25Z) - Deep Representation Learning and Clustering of Traffic Scenarios [0.0]
トラフィックシーンの遅延表現を学習する2つのデータ駆動自動符号化モデルを導入する。
本稿では,遅延シナリオの埋め込みがトラフィックシナリオのクラスタリングや類似性検索にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-07-15T15:12:23Z) - Forecast Network-Wide Traffic States for Multiple Steps Ahead: A Deep
Learning Approach Considering Dynamic Non-Local Spatial Correlation and
Non-Stationary Temporal Dependency [6.019104024723682]
本研究では,交通予測における2つの問題について検討する。(1)交通リンク間の動的・非局所的な空間的相関を捉え,(2)正確な複数ステップの予測を行うための時間依存性のダイナミクスをモデル化する。
本稿では,これらの問題に対処するため,時空間列列モデル(STSeq2Seq)というディープラーニングフレームワークを提案する。
このモデルは、時間的特徴を捉えるためにシーケンスからシーケンス(seq2seq)アーキテクチャに基づいて構築され、空間情報を集約するためのグラフ畳み込みに依存している。
論文 参考訳(メタデータ) (2020-04-06T03:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。