論文の概要: CNN-based Multi-In-Multi-Out Model for Efficient Spatiotemporal Prediction
- arxiv url: http://arxiv.org/abs/2605.01277v1
- Date: Sat, 02 May 2026 06:22:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.678577
- Title: CNN-based Multi-In-Multi-Out Model for Efficient Spatiotemporal Prediction
- Title(参考訳): CNNを用いた高効率時空間予測のためのマルチインマルチアウトモデル
- Authors: Hyeonseok Jin,
- Abstract要約: CNNベースのモデルは、カーネルのローカルな特性のため、グローバルな情報を考えるのが困難である。
Transformerアーキテクチャに基づくモデルは、自己注意計算のために複雑になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, Convolutional Neural Network (CNN) or Transformer architecture based models have been proposed to overcome the limitations of Recurrent Neural Network (RNN) based models in spatiotemporal prediction. These models prevent the inefficiency of parallelization limitation due to the sequential properties and stacked error due to the recursive method, and show high performance. Novertheless, there are still some challengies. First, CNN based models have difficulty considering global information due to the local properties of the kernel, and their performance is limited. In addition, information is mixed because the time axis is combined with the channel axis of the image for processing. Models based on Transformer architecture have high complexity due to the self-attention calcuation and take a long training time. In this paper, we propose a new structure model called CNN-based Multi-In-Multi-Out model for Efficient Spatiotemporal Prediction (MIMO-ESP) to overcome these limitations. MIMO-ESP considers global information and significantly improves complexity by configuring a Transformer architecture based on CNN. In addition, it treats the time axis as an independent axis without combining it, and effectively considers spatiotemporal information together by applying dilation. This structure makes MIMO-ESP efficient and high performance. Extensive experiment results on three promising benchmark datasets which including video, traffic, and precipitation prediction tasks demonstrate that the usefulness of MIMO-ESP due to the achieved competitive efficiency while outperforming existing models. Furthermore, the ablation study results demonstrate the usefulness of the components of MIMO-ESP, emphasizing the potential of the proposed approaches.
- Abstract(参考訳): 近年、時空間予測において、リカレントニューラルネットワーク(RNN)に基づくモデルの限界を克服するために、畳み込みニューラルネットワーク(CNN)またはトランスフォーマーアーキテクチャベースのモデルが提案されている。
これらのモデルは、逐次特性と再帰的手法による積み重ね誤差による並列化制限の非効率を防止し、高い性能を示す。
にもかかわらず、まだいくつかのチャレニーがある。
まず、CNNベースのモデルでは、カーネルのローカルな特性からグローバルな情報を考えるのが困難であり、その性能は限られている。
また、時間軸と画像のチャネル軸とを結合して処理するため、情報を混合する。
Transformerアーキテクチャに基づくモデルは、自己注意計算による複雑さが高く、長いトレーニング時間を要する。
本稿では,これらの制約を克服するために,CNNに基づく高効率時空間予測(MIMO-ESP)のためのMulti-In-Multi-Outモデルを提案する。
MIMO-ESPは、グローバルな情報を考慮し、CNNに基づいてTransformerアーキテクチャを設定することにより、複雑さを大幅に改善する。
さらに、時間軸を結合することなく独立軸として扱い、拡張を加えて時空間情報を効果的に考察する。
この構造はMIMO-ESPを効率的かつ高性能にする。
ビデオ,トラフィック,降水予測タスクを含む有望な3つのベンチマークデータセットに対する大規模な実験結果から,MIMO-ESPが既存のモデルより優れており,競争効率が優れていたことが示唆された。
さらに,MIMO-ESPの成分の有用性について検討し,提案手法の有効性を強調した。
関連論文リスト
- SpikeSTAG: Spatial-Temporal Forecasting via GNN-SNN Collaboration [16.754715227269525]
スパイキングニューラルネットワーク(SNN)は、時間データの複雑さを捉えるためのユニークなアプローチを提供する。
本稿では,グラフ構造学習とスパイクに基づく時間的処理をシームレスに統合する,新しいSNNアーキテクチャを提案する。
実験の結果、我々のモデルはすべてのデータセットで最先端のSNNベースのiSpikformerを上回ることがわかった。
論文 参考訳(メタデータ) (2025-08-04T05:17:52Z) - A Multi-Layer CNN-GRUSKIP model based on transformer for spatial TEMPORAL traffic flow prediction [0.06597195879147556]
交通流予測は、インテリジェント交通システムITSの基盤のままである。
CNN-GRUSKIPモデルは先駆的なアプローチとして現れる。
このモデルは、ARIMA、Graph Wave Net、HA、LSTM、STGCN、APTといった確立したモデルよりも一貫して優れていた。
強力な予測能力と適応アーキテクチャにより、CNN-GRUSKIPモデルはITSアプリケーションを再定義する。
論文 参考訳(メタデータ) (2025-01-09T21:30:02Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - VMRNN: Integrating Vision Mamba and LSTM for Efficient and Accurate Spatiotemporal Forecasting [11.058879849373572]
時間的予測のためのRNNを持つVTやCNNは、時間的・空間的ダイナミクスを予測するのに相容れない結果をもたらす。
最近のMambaベースのアーキテクチャは、非常に長いシーケンスモデリング能力に熱中している。
本稿では,ビジョンマンバブロックの強度をLSTMと統合した再帰ユニットであるVMRNNセルを提案する。
論文 参考訳(メタデータ) (2024-03-25T08:26:42Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - A predictive physics-aware hybrid reduced order model for reacting flows [65.73506571113623]
反応流問題の解法として,新しいハイブリッド型予測次数モデル (ROM) を提案する。
自由度は、数千の時間的点から、対応する時間的係数を持ついくつかのPODモードへと減少する。
時間係数を予測するために、2つの異なるディープラーニングアーキテクチャがテストされている。
論文 参考訳(メタデータ) (2023-01-24T08:39:20Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。