論文の概要: Incorporating Long-term Data in Training Short-term Traffic Prediction Model
- arxiv url: http://arxiv.org/abs/2410.14726v1
- Date: Wed, 16 Oct 2024 01:22:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:17:45.173669
- Title: Incorporating Long-term Data in Training Short-term Traffic Prediction Model
- Title(参考訳): 短期交通予測モデルの訓練における長期データの導入
- Authors: Xiannan Huang, Shuhan Qiu, Yan Cheng, Quan Yuan, Chao Yang,
- Abstract要約: タクシーと自転車の使用率を含む2つのデータセットは、ニューヨークで8年以上にわたって使われてきた。
最新の12,24,48,96ヶ月でトレーニングされたモデルの精度を評価する実験を行った。
その結果,96ヶ月のトレーニングセットは,過去の交通パターンと現在との相違により,精度が低下することが判明した。
- 参考スコア(独自算出の注目度): 6.392992843318724
- License:
- Abstract: Short-term traffic volume prediction is crucial for intelligent transportation system and there are many researches focusing on this field. However, most of these existing researches concentrated on refining model architecture and ignored amount of training data. Therefore, there remains a noticeable gap in thoroughly exploring the effect of augmented dataset, especially extensive historical data in training. In this research, two datasets containing taxi and bike usage spanning over eight years in New York were used to test such effects. Experiments were conducted to assess the precision of models trained with data in the most recent 12, 24, 48, and 96 months. It was found that the training set encompassing 96 months, at times, resulted in diminished accuracy, which might be owing to disparities between historical traffic patterns and present ones. An analysis was subsequently undertaken to discern potential sources of inconsistent patterns, which may include both covariate shift and concept shift. To address these shifts, we proposed an innovative approach that aligns covariate distributions using a weighting scheme to manage covariate shift, coupled with an environment aware learning method to tackle the concept shift. Experiments based on real word datasets demonstrate the effectiveness of our method which can significantly decrease testing errors and ensure an improvement in accuracy when training with large-scale historical data. As far as we know, this work is the first attempt to assess the impact of contiguously expanding training dataset on the accuracy of traffic prediction models. Besides, our training method is able to be incorporated into most existing short-term traffic prediction models and make them more suitable for long term historical training dataset.
- Abstract(参考訳): 知的交通システムにおいては,短期交通量予測が不可欠であり,この分野に着目した研究が数多く行われている。
しかし、これらの既存の研究のほとんどはモデルアーキテクチャの精錬に集中し、トレーニングデータの量を無視した。
したがって、強化データセットの効果、特にトレーニングにおける広範な履歴データについて徹底的に探究する上で、明らかなギャップが残っている。
本研究では、ニューヨークで8年以上にわたるタクシーと自転車の使用状況を含む2つのデータセットを用いて、そのような効果を検証した。
最新の12,24,48,96ヶ月でトレーニングされたモデルの精度を評価する実験を行った。
その結果,96ヶ月のトレーニングセットは,過去の交通パターンと現在との相違により,精度が低下することが判明した。
その後、共変量シフトと概念シフトの両方を含む不整合パターンの潜在的な源を明らかにするために分析が行われた。
これらの変化に対処するために,重み付け方式を用いて共変量分布を整合させて共変量シフトを管理する手法と,概念シフトに対処する環境意識学習手法を提案する。
実単語データセットを用いた実験では,テスト誤差を著しく低減し,大規模履歴データを用いたトレーニングにおける精度の向上を確実にする手法の有効性が示された。
私たちが知る限り、この研究は、トラフィック予測モデルの正確性に対する、連続的に拡張されたトレーニングデータセットの影響を評価する最初の試みである。
さらに,本手法は,既存の短期交通予測モデルに組み込んで,長期的履歴学習データセットに適合させることが可能である。
関連論文リスト
- What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Data-driven Probabilistic Trajectory Learning with High Temporal Resolution in Terminal Airspace [9.688760969026305]
混合モデルとSeq2seqに基づくニューラルネットワークの予測および特徴抽出機能を活用するデータ駆動学習フレームワークを提案する。
このフレームワークでトレーニングした後、学習したモデルは長期予測精度を大幅に向上させることができる。
提案手法の精度と有効性は,予測された軌道と基礎的真実とを比較して評価する。
論文 参考訳(メタデータ) (2024-09-25T21:08:25Z) - The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes [30.30769701138665]
我々は、訓練データとテストデータの間の相互影響を浮き彫りにして、ミラーレッド影響仮説を導入し、探求する。
具体的には、テスト予測に対するトレーニングデータの影響を評価することは、等価だが逆問題として再定義することができることを示唆している。
トレーニングポイント毎に前方パスとペアを組むことで,特定のテストサンプルの勾配を計算し,トレーニングデータの影響を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-14T03:43:05Z) - Distil the informative essence of loop detector data set: Is
network-level traffic forecasting hungry for more data? [0.8002196839441036]
本稿では,予測モデルのトレーニングに実際に有効なループデータのサンプル数を検討するために,不確実性を考慮したトラフィック予測フレームワークを提案する。
提案手法は,大規模トラフィックデータセットの真の情報内容を評価する上で有用である。
論文 参考訳(メタデータ) (2023-10-31T11:23:10Z) - Orthogonal Uncertainty Representation of Data Manifold for Robust
Long-Tailed Learning [52.021899899683675]
長い尾の分布を持つシナリオでは、尾のサンプルが不足しているため、モデルが尾のクラスを識別する能力は制限される。
モデルロバストネスの長期的現象を改善するために,特徴埋め込みの直交不確実性表現(OUR)とエンドツーエンドのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-10-16T05:50:34Z) - Alleviating the Effect of Data Imbalance on Adversarial Training [26.36714114672729]
長い尾の分布に従うデータセットの逆トレーニングについて検討する。
我々は、新しい対人訓練フレームワーク、Re-balancing Adversarial Training (REAT)を提案する。
論文 参考訳(メタデータ) (2023-07-14T07:01:48Z) - Adapting to Continuous Covariate Shift via Online Density Ratio Estimation [64.8027122329609]
分散シフトへの対処は、現代の機械学習における中心的な課題の1つだ。
歴史的情報を適切に再利用するオンライン手法を提案する。
我々の密度比推定法は, ダイナミックなリセットバウンドを楽しむことにより, 良好に動作できることが証明された。
論文 参考訳(メタデータ) (2023-02-06T04:03:33Z) - Managing dataset shift by adversarial validation for credit scoring [5.560471251954645]
トレーニングデータの分布と実際に予測する必要があるデータとの矛盾は、モデルパフォーマンスの低下を引き起こす可能性がある。
本稿では,クレジットスコアリングシナリオにおけるデータセットシフト問題を軽減するための,逆検証に基づく手法を提案する。
論文 参考訳(メタデータ) (2021-12-19T07:07:15Z) - Improved Fine-tuning by Leveraging Pre-training Data: Theory and
Practice [52.11183787786718]
対象データに事前学習されたモデルを微調整することは、多くのディープラーニングアプリケーションで広く利用されている。
近年の研究では、スクラッチからのトレーニングが、この事前トレーニング戦略に比較して、最終的なパフォーマンスを示すことが実証されている。
本稿では,対象タスクの一般化を改善するために,事前学習データからサブセットを選択する新しい選択戦略を提案する。
論文 参考訳(メタデータ) (2021-11-24T06:18:32Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - Precise Tradeoffs in Adversarial Training for Linear Regression [55.764306209771405]
本稿では,ガウス的特徴を伴う線形回帰の文脈における対人訓練の役割を,正確かつ包括的に理解する。
我々は,同時代のミニマックス対逆訓練手法によって達成された標準/ロバスト精度とそれに対応するトレードオフを正確に特徴づける。
逆行訓練アルゴリズムの理論は、様々な要因(トレーニングデータのサイズや品質、モデルの過度化など)がこれらの2つの競合するアキュラシー間のトレードオフにどのように影響するかを厳密に研究する上で役立ちます。
論文 参考訳(メタデータ) (2020-02-24T19:01:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。