Fugu-MT 論文翻訳(概要): SimVPv2: Towards Simple yet Powerful Spatiotemporal Predictive Learning

論文の概要: SimVPv2: Towards Simple yet Powerful Spatiotemporal Predictive Learning

arxiv url: http://arxiv.org/abs/2211.12509v4
Date: Thu, 12 Dec 2024 08:54:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-13 15:57:55.590958
Title: SimVPv2: Towards Simple yet Powerful Spatiotemporal Predictive Learning
Title（参考訳）: SimVPv2: シンプルかつパワフルな時空間予測学習を目指して
Authors: Cheng Tan, Zhangyang Gao, Siyuan Li, Stan Z. Li,
Abstract要約: 空間的・時間的モデリングにおけるUnetアーキテクチャの必要性を解消する合理化モデルであるSimVPv2を提案する。 SimVPv2はモデルアーキテクチャを単純化するだけでなく、性能と計算効率も改善する。標準のMoving MNISTベンチマークでは、SimVPv2は、FLOPが少なく、トレーニング時間の半分、推論効率が60%速く、SimVPよりも優れたパフォーマンスを実現している。
参考スコア（独自算出の注目度）: 61.419914155985886
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent years have witnessed remarkable advances in spatiotemporal predictive learning, with methods incorporating auxiliary inputs, complex neural architectures, and sophisticated training strategies. While SimVP has introduced a simpler, CNN-based baseline for this task, it still relies on heavy Unet-like architectures for spatial and temporal modeling, which still suffers from high complexity and computational overhead. In this paper, we propose SimVPv2, a streamlined model that eliminates the need for Unet architectures and demonstrates that plain stacks of convolutional layers, enhanced with an efficient Gated Spatiotemporal Attention mechanism, can deliver state-of-the-art performance. SimVPv2 not only simplifies the model architecture but also improves both performance and computational efficiency. On the standard Moving MNIST benchmark, SimVPv2 achieves superior performance compared to SimVP, with fewer FLOPs, about half the training time, and 60% faster inference efficiency. Extensive experiments across eight diverse datasets, including real-world tasks such as traffic forecasting and climate prediction, further demonstrate that SimVPv2 offers a powerful yet straightforward solution, achieving robust generalization across various spatiotemporal learning scenarios. We believe the proposed SimVPv2 can serve as a solid baseline to benefit the spatiotemporal predictive learning community.
Abstract（参考訳）: 近年では、補助的な入力、複雑な神経アーキテクチャ、洗練された訓練戦略を組み込んだ時空間予測学習が目覚ましい進歩を遂げている。 SimVPは、このタスクのためによりシンプルなCNNベースのベースラインを導入したが、それでも空間的および時間的モデリングのために重いUnetのようなアーキテクチャに依存しており、それでも高い複雑さと計算オーバーヘッドに悩まされている。本稿では,Unetアーキテクチャの必要性を排除し,効率的なGated Spatiotemporal Attention機構によって拡張された畳み込みレイヤのプレーンスタックが,最先端のパフォーマンスを実現することができることを示す。 SimVPv2はモデルアーキテクチャを単純化するだけでなく、性能と計算効率も改善する。標準のMoving MNISTベンチマークでは、SimVPv2は、FLOPが少なく、トレーニング時間が約半分、推論効率が60%速く、SimVPよりも優れたパフォーマンスを実現している。交通予測や気候予測などの現実的なタスクを含む8つの多様なデータセットにわたる大規模な実験は、SimVPv2が強力だが簡単なソリューションを提供し、様々な時空間学習シナリオで堅牢な一般化を実現することを証明している。提案したSimVPv2は、時空間予測学習コミュニティの恩恵を受けるための確かなベースラインとして機能すると考えている。

関連論文リスト

Learning from Complexity: Exploring Dynamic Sample Pruning of Spatio-Temporal Training [36.98769959300113]
大規模な、しばしば冗長なデータセットでディープラーニングモデルをトレーニングすることは、重大な計算ボトルネックを示す。本稿では,動的試料刈り込みによる複雑性から学習する新しい訓練手法について検討する。また,ST-Pruneは,モデル性能の維持や改善を図りながら,トレーニング速度を著しく向上させることを示した。
論文参考訳（メタデータ） (2026-02-22T10:11:04Z)
FASTer: Toward Efficient Autoregressive Vision Language Action Modeling via Neural Action Tokenization [61.10456021136654]
本稿では,効率的で汎用的なロボット学習のための統合フレームワークであるFASTerを紹介する。 FASTerVQは、アクションチャンクをシングルチャネルイメージとしてエンコードし、高い圧縮比を維持しながら、グローバルな時間的依存関係をキャプチャする。 FASTerVLAはブロックワイドの自動回帰デコーディングと軽量アクションエキスパートを備えたトークンライザ上に構築されており、推論の高速化とタスクパフォーマンスの向上を実現している。
論文参考訳（メタデータ） (2025-12-04T16:21:38Z)
Simulation Priors for Data-Efficient Deep Learning [56.525770511247934]
SimPELは、第一原理モデルとデータ駆動学習を効率的に組み合わせる手法である。我々は,生物,農業,ロボットなど多様なシステムでSimPELを評価した。意思決定において,SimPELはモデルに基づく強化学習において,シミュレーションと現実のギャップを埋めることを示した。
論文参考訳（メタデータ） (2025-09-06T14:36:41Z)
Minimal Convolutional RNNs Accelerate Spatiotemporal Learning [4.918567856499736]
畳み込みリカレントネットワークの空間バイアスと最小並列RNNのトレーニング効率を組み合わせた2つの時間モデルであるMinConvLSTMとMinConvGRUを紹介する。我々のモデルは、構造的に最小限の計算と計算効率であり、パラメータ数を削減し、スケーラビリティを改善している。
論文参考訳（メタデータ） (2025-08-05T16:28:43Z)
Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文参考訳（メタデータ） (2025-03-06T03:06:22Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
EasyST: A Simple Framework for Spatio-Temporal Prediction [18.291117879544945]
本稿では,時空間予測のための簡単なフレームワークであるEasySTパラダイムを提案する。複雑な時間的GNNからの知識を蒸留することにより、軽量で堅牢なマルチ層パーセプトロン(MLP)の一般化を学習する。 EasySTは、効率と精度の点で最先端のアプローチを超越している。
論文参考訳（メタデータ） (2024-09-10T11:40:01Z)
Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文参考訳（メタデータ） (2024-06-21T13:48:37Z)
Tao: Re-Thinking DL-based Microarchitecture Simulation [8.501776613988484]
既存のマイクロアーキテクチャシミュレータは、異なる側面で優れ、不足している。ディープラーニング(DL)ベースのシミュレーションは驚くほど高速で、精度は極めて高いが、適切な低レベルのマイクロアーキテクチャのパフォーマンス指標を提供することができない。本稿では,3つの主要な貢献により,DLに基づくシミュレーションを再設計するTAOを紹介する。
論文参考訳（メタデータ） (2024-04-16T21:45:10Z)
Augmenting Offline Reinforcement Learning with State-only Interactions [12.100856289121863]
バッチオフラインデータは強化学習に非常に有用であることが示されている。本稿では,環境との相互作用が可能であるが,観測に限られる新たな機会について考察する。その結果、学習者はオフラインデータをよく理解し、状態遷移をクエリする効率的なスキームを合成する必要がある。
論文参考訳（メタデータ） (2024-02-01T17:44:11Z)
Predicting Traffic Flow with Federated Learning and Graph Neural with Asynchronous Computations Network [0.0]
我々はFLAGCN(Federated Learning and Asynchronous Graph Convolutional Networks)と呼ばれる新しいディープラーニング手法を提案する。本フレームワークでは,リアルタイムトラフィックフロー予測の精度と効率を高めるために,非同期グラフ畳み込みネットワークとフェデレーション学習の原理を取り入れている。
論文参考訳（メタデータ） (2024-01-05T09:36:42Z)
The Trifecta: Three simple techniques for training deeper Forward-Forward networks [0.0]
本稿では,より深いネットワーク上でのフォワード・フォワードアルゴリズムを大幅に改善する3つの手法のコレクションを提案する。我々の実験は、我々のモデルが、単純なデータセットのトレーニング速度とテスト精度の両方において、同様に構造化されたバックプロパゲーションベースのモデルと同等であることを示した。
論文参考訳（メタデータ） (2023-11-29T22:44:32Z)
Representation Learning with Multi-Step Inverse Kinematics: An Efficient and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文参考訳（メタデータ） (2023-04-12T14:51:47Z)
Hindsight States: Blending Sim and Real Task Elements for Efficient Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文参考訳（メタデータ） (2023-03-03T21:55:04Z)
On Fast Simulation of Dynamical System with Neural Vector Enhanced Numerical Solver [59.13397937903832]
ニューラルベクトル(NeurVec)と呼ばれる深層学習に基づく補正手法を提案する。 NeurVecは、統合エラーを補償し、シミュレーションでより大きなタイムステップサイズを可能にする。様々な複雑な力学系ベンチマークの実験により、NeurVecは顕著な一般化能力を示すことが示された。
論文参考訳（メタデータ） (2022-08-07T09:02:18Z)
SimVP: Simpler yet Better Video Prediction [38.42917984016527]
本稿では,CNNで完全に構築された単純なビデオ予測モデルであるSimVPを提案する。 5つのベンチマークデータセットで最先端のパフォーマンスを実現する。我々は、SimVPがビデオ予測のさらなる発展を刺激するために、安定したベースラインとして機能できると考えている。
論文参考訳（メタデータ） (2022-06-09T02:03:21Z)
Improving Sample Efficiency of Value Based Models Using Attention and Vision Transformers [52.30336730712544]
性能を犠牲にすることなくサンプル効率を向上させることを目的とした深層強化学習アーキテクチャを提案する。状態表現の特徴マップ上の自己注意機構を変換器を用いて学習する視覚的注意モデルを提案する。我々は,このアーキテクチャがいくつかのAtari環境におけるサンプルの複雑さを向上すると同時に,いくつかのゲームにおいて優れたパフォーマンスを実現することを実証的に実証した。
論文参考訳（メタデータ） (2022-02-01T19:03:03Z)
Training Efficiency and Robustness in Deep Learning [2.6451769337566406]
ディープラーニングモデルのトレーニング効率と堅牢性を改善するためのアプローチについて検討する。より情報的なトレーニングデータに基づく学習の優先順位付けは収束速度を高め、テストデータに対する一般化性能を向上させる。トレーニングデータのサンプリングに対する冗長性を考慮した修正により、トレーニング速度が向上し、トレーニング信号の多様性を検出する効率的な方法が開発されていることを示す。
論文参考訳（メタデータ） (2021-12-02T17:11:33Z)
TRAIL: Near-Optimal Imitation Learning with Suboptimal Data [100.83688818427915]
オフラインデータセットを使用してファクタードトランジションモデルを学習するトレーニング目標を提案する。我々の理論的分析は、学習された潜在行動空間が下流模倣学習のサンプル効率を高めることを示唆している。実際に潜伏行動空間を学習するために、エネルギーベースの遷移モデルを学ぶアルゴリズムTRAIL(Transition-Reparametrized Actions for Imitation Learning)を提案する。
論文参考訳（メタデータ） (2021-10-27T21:05:00Z)
Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文参考訳（メタデータ） (2021-06-05T01:31:51Z)
On the Theory of Reinforcement Learning with Once-per-Episode Feedback [120.5537226120512]
本稿では,エピソード終盤に一度だけフィードバックを受ける強化学習の理論を紹介する。これは、学習者が毎回フィードバックを受け取るという従来の要件よりも、現実世界のアプリケーションの代表的です。
論文参考訳（メタデータ） (2021-05-29T19:48:51Z)
Multi-objective Neural Architecture Search with Almost No Training [9.93048700248444]
本稿ではRWE(Random-Weight Evaluation)という,ネットワークアーキテクチャの性能を迅速に評価する手法を提案する。 RWEは、アーキテクチャを評価するための計算コストを数時間から秒に短縮する。進化的多目的アルゴリズムに統合されると、RWEはCIFAR-10上で2時間以内で1枚のGPUカードを検索し、最先端の性能を持つ効率的なアーキテクチャの集合を得る。
論文参考訳（メタデータ） (2020-11-27T07:39:17Z)
Federated Transfer Learning with Dynamic Gradient Aggregation [27.42998421786922]
本稿では,音響モデル学習のためのフェデレートラーニング(FL)シミュレーションプラットフォームを提案する。提案するFLプラットフォームは,モジュール設計を取り入れたさまざまなタスクをサポートすることができる。これは、収束速度と全体的なモデル性能の両方において、分散トレーニングの黄金標準よりも優れていることを示す。
論文参考訳（メタデータ） (2020-08-06T04:29:01Z)
STONNE: A Detailed Architectural Simulator for Flexible Neural Network Accelerators [5.326345912766044]
STONNEはサイクル精度が高く、高度にモジュール化され、高度に拡張可能なシミュレーションフレームワークである。一般に公開されているBSV符号化MAERIの実装の性能結果にどのように近づくかを示す。
論文参考訳（メタデータ） (2020-06-10T19:20:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。