論文の概要: CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting
- arxiv url: http://arxiv.org/abs/2506.06128v1
- Date: Fri, 06 Jun 2025 14:38:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.519387
- Title: CCLSTM: Coupled Convolutional Long-Short Term Memory Network for Occupancy Flow Forecasting
- Title(参考訳): CCLSTM:Occupupancy Flow Forecastingのための結合型畳み込み長短メモリネットワーク
- Authors: Peter Lengyel,
- Abstract要約: textbfCoupled Convolutional LSTM (CTM) を提案する。
CTMは、占有フローのメトリクスに関する最先端のパフォーマンスを達成し、この提出の時点で、2024年のOccupancy and Flow Prediction Challengeのリーダーボード上のすべてのメトリクス(テキスト)にランク付けされている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Predicting future states of dynamic agents is a fundamental task in autonomous driving. An expressive representation for this purpose is Occupancy Flow Fields, which provide a scalable and unified format for modeling motion, spatial extent, and multi-modal future distributions. While recent methods have achieved strong results using this representation, they often depend on high-quality vectorized inputs, which are unavailable or difficult to generate in practice, and the use of transformer-based architectures, which are computationally intensive and costly to deploy. To address these issues, we propose \textbf{Coupled Convolutional LSTM (CCLSTM)}, a lightweight, end-to-end trainable architecture based solely on convolutional operations. Without relying on vectorized inputs or self-attention mechanisms, CCLSTM effectively captures temporal dynamics and spatial occupancy-flow correlations using a compact recurrent convolutional structure. Despite its simplicity, CCLSTM achieves state-of-the-art performance on occupancy flow metrics and, as of this submission, ranks \(1^{\text{st}}\) in all metrics on the 2024 Waymo Occupancy and Flow Prediction Challenge leaderboard.
- Abstract(参考訳): 動的エージェントの将来の状態を予測することは、自動運転の基本的な課題である。
この目的のための表現的表現はOccupancy Flow Fields(英語版)であり、動き、空間範囲、マルチモーダルな将来の分布をモデル化するためのスケーラブルで統一されたフォーマットを提供する。
近年の手法では、この表現を用いた強力な結果が得られているが、実際には利用できない、あるいは生成が難しい高品質なベクトル化入力と、計算集約的でデプロイにコストがかかるトランスフォーマーベースのアーキテクチャに頼っていることが多い。
これらの問題に対処するために,畳み込み操作のみに基づく軽量でエンドツーエンドのトレーニング可能なアーキテクチャである \textbf{Coupled Convolutional LSTM (CCLSTM) を提案する。
ベクトル化された入力や自己アテンション機構を頼らずに、CCLSTMは、コンパクトな再帰的畳み込み構造を用いて、時間的ダイナミクスと空間的占有-フロー相関を効果的に捉える。
その単純さにもかかわらず、CCLSTMは占有フローのメトリクスに関する最先端のパフォーマンスを達成し、この投稿の時点で、2024年のWaymo Occupancy and Flow Prediction Challengeのリーダーボード上のすべてのメトリクスで(1^{\text{st}}\)にランクインしている。
関連論文リスト
- Accurate and Efficient Multivariate Time Series Forecasting via Offline Clustering [22.545533166145706]
セグメンツ(FOCUS)を用いたオフラインクラスタリングによるフォアキャスタの導入
FOCUSは、長距離依存性モデリングを単純化するMTS予測の新しいアプローチである。
最先端の精度を実現し、計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-05-09T02:34:06Z) - Rethinking Traffic Flow Forecasting: From Transition to Generatation [0.0]
本稿では,交通流予測のための多分岐類似性変換器,すなわちEMBSFormerを提案する。
トラフィックフローに影響を与える要因はノードレベルのトラフィック生成とグラフレベルのトラフィック遷移であり、ノードの多周期性と相互作用パターンをそれぞれ記述している。
交通遷移において,グローバルノードの相互作用を維持するために時間的・空間的自己認識機構を用い,それぞれGNNと時間的共振器を用いて局所ノードの相互作用をモデル化する。
論文 参考訳(メタデータ) (2025-04-19T09:52:39Z) - LIFT: Latent Implicit Functions for Task- and Data-Agnostic Encoding [4.759109475818876]
Implicit Neural Representations (INR)は、多様なデータドメインをまたいだタスクモデリングを統合するための強力なパラダイムであることが証明されている。
本稿では,メタラーニングによるマルチスケール情報をキャプチャする新しい高性能フレームワークLIFTを紹介する。
また、残差接続と表現頻度符号化を組み込んだLIFTの強化版であるReLIFTについても紹介する。
論文 参考訳(メタデータ) (2025-03-19T17:00:58Z) - ContextFormer: Redefining Efficiency in Semantic Segmentation [48.81126061219231]
畳み込み法は、局所的な依存関係をうまく捉えるが、長距離関係に苦慮する。
ビジョントランスフォーマー(ViT)は、グローバルなコンテキストキャプチャでは優れるが、高い計算要求によって妨げられる。
我々は,リアルタイムセマンティックセグメンテーションの効率,精度,堅牢性のバランスをとるために,CNN と ViT の強みを活用したハイブリッドフレームワーク ContextFormer を提案する。
論文 参考訳(メタデータ) (2025-01-31T16:11:04Z) - UmambaTSF: A U-shaped Multi-Scale Long-Term Time Series Forecasting Method Using Mamba [7.594115034632109]
本稿では,新しい時系列予測フレームワークであるUmambaTSFを提案する。
U字型エンコーダ・デコーダ多層パーセプトロン(MLP)のマルチスケール特徴抽出機能とMambaのロングシーケンス表現を統合する。
UmambaTSFは、広く使用されているベンチマークデータセットで最先端のパフォーマンスと優れた汎用性を達成する。
論文 参考訳(メタデータ) (2024-10-15T04:56:43Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for
Autonomous Driving [27.776472262857045]
本稿では,自動運転車のための簡易かつ効率的な運動予測ベースライン(SIMPL)を提案する。
メッセージ転送を対称的に行う,コンパクトで効率的なグローバル機能融合モジュールを提案する。
強力なベースラインとして、SIMPLはArgoverse 1と2のモーション予測ベンチマークで高い競争性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:07:49Z) - Convolutional State Space Models for Long-Range Spatiotemporal Modeling [65.0993000439043]
ConvS5は、長距離時間モデリングのための効率的な変種である。
トランスフォーマーとConvNISTTMは、長い水平移動実験において、ConvLSTMより3倍速く、トランスフォーマーより400倍速くサンプルを生成する一方で、大幅に性能が向上した。
論文 参考訳(メタデータ) (2023-10-30T16:11:06Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - FormerTime: Hierarchical Multi-Scale Representations for Multivariate
Time Series Classification [53.55504611255664]
formerTimeは、多変量時系列分類タスクの分類能力を改善する階層的表現モデルである。
1)時系列データから階層的なマルチスケール表現を学習し、(2)トランスフォーマーと畳み込みネットワークの強さを継承し、(3)自己維持メカニズムによって引き起こされる効率の課題に取り組む。
論文 参考訳(メタデータ) (2023-02-20T07:46:14Z) - TMS: A Temporal Multi-scale Backbone Design for Speaker Embedding [60.292702363839716]
話者埋め込みのための現在のSOTAバックボーンネットワークは、話者表現のためのマルチブランチネットワークアーキテクチャを用いた発話からマルチスケール特徴を集約するように設計されている。
本稿では, 話者埋め込みネットワークにおいて, 計算コストの増大を伴わずに, マルチスケール分岐を効率的に設計できる効果的な時間的マルチスケール(TMS)モデルを提案する。
論文 参考訳(メタデータ) (2022-03-17T05:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。