Fugu-MT 論文翻訳(概要): Incorporating Long-term Data in Training Short-term Traffic Prediction Model

論文の概要: Incorporating Long-term Data in Training Short-term Traffic Prediction Model

arxiv url: http://arxiv.org/abs/2410.14726v1
Date: Wed, 16 Oct 2024 01:22:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.654319
Title: Incorporating Long-term Data in Training Short-term Traffic Prediction Model
Title（参考訳）: 短期交通予測モデルの訓練における長期データの導入
Authors: Xiannan Huang, Shuhan Qiu, Yan Cheng, Quan Yuan, Chao Yang,
Abstract要約: タクシーと自転車の使用率を含む2つのデータセットは、ニューヨークで8年以上にわたって使われてきた。最新の12,24,48,96ヶ月でトレーニングされたモデルの精度を評価する実験を行った。その結果,96ヶ月のトレーニングセットは,過去の交通パターンと現在との相違により,精度が低下することが判明した。
参考スコア（独自算出の注目度）: 6.392992843318724
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Short-term traffic volume prediction is crucial for intelligent transportation system and there are many researches focusing on this field. However, most of these existing researches concentrated on refining model architecture and ignored amount of training data. Therefore, there remains a noticeable gap in thoroughly exploring the effect of augmented dataset, especially extensive historical data in training. In this research, two datasets containing taxi and bike usage spanning over eight years in New York were used to test such effects. Experiments were conducted to assess the precision of models trained with data in the most recent 12, 24, 48, and 96 months. It was found that the training set encompassing 96 months, at times, resulted in diminished accuracy, which might be owing to disparities between historical traffic patterns and present ones. An analysis was subsequently undertaken to discern potential sources of inconsistent patterns, which may include both covariate shift and concept shift. To address these shifts, we proposed an innovative approach that aligns covariate distributions using a weighting scheme to manage covariate shift, coupled with an environment aware learning method to tackle the concept shift. Experiments based on real word datasets demonstrate the effectiveness of our method which can significantly decrease testing errors and ensure an improvement in accuracy when training with large-scale historical data. As far as we know, this work is the first attempt to assess the impact of contiguously expanding training dataset on the accuracy of traffic prediction models. Besides, our training method is able to be incorporated into most existing short-term traffic prediction models and make them more suitable for long term historical training dataset.
Abstract（参考訳）: 知的交通システムにおいては,短期交通量予測が不可欠であり,この分野に着目した研究が数多く行われている。しかし、これらの既存の研究のほとんどはモデルアーキテクチャの精錬に集中し、トレーニングデータの量を無視した。したがって、強化データセットの効果、特にトレーニングにおける広範な履歴データについて徹底的に探究する上で、明らかなギャップが残っている。本研究では、ニューヨークで8年以上にわたるタクシーと自転車の使用状況を含む2つのデータセットを用いて、そのような効果を検証した。最新の12,24,48,96ヶ月でトレーニングされたモデルの精度を評価する実験を行った。その結果,96ヶ月のトレーニングセットは,過去の交通パターンと現在との相違により,精度が低下することが判明した。その後、共変量シフトと概念シフトの両方を含む不整合パターンの潜在的な源を明らかにするために分析が行われた。これらの変化に対処するために,重み付け方式を用いて共変量分布を整合させて共変量シフトを管理する手法と,概念シフトに対処する環境意識学習手法を提案する。実単語データセットを用いた実験では,テスト誤差を著しく低減し,大規模履歴データを用いたトレーニングにおける精度の向上を確実にする手法の有効性が示された。私たちが知る限り、この研究は、トラフィック予測モデルの正確性に対する、連続的に拡張されたトレーニングデータセットの影響を評価する最初の試みである。さらに,本手法は,既存の短期交通予測モデルに組み込んで,長期的履歴学習データセットに適合させることが可能である。

関連論文リスト

An Active Learning-Based Streaming Pipeline for Reduced Data Training of Structure Finding Models in Neutron Diffractometry [1.3083205962260995]
本研究では,不確実性サンプリングを用いて確率分布から抽出した学習データをシミュレートする新しいバッチモードアクティブラーニング(AL)ポリシーを提案する。精度を向上しながら、トレーニングデータの約75%の削減で、同じモデルのトレーニングにおける有効性を確認した。次に、このALポリシを用いた効率的なストリームベースのトレーニングワークフローの設計について論じ、2つの異種プラットフォームの性能調査を示す。
論文参考訳（メタデータ） (2025-06-06T15:48:22Z)
Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (2024-12-12T18:28:55Z)
What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文参考訳（メタデータ） (2024-11-12T09:52:40Z)
Data-driven Probabilistic Trajectory Learning with High Temporal Resolution in Terminal Airspace [9.688760969026305]
混合モデルとSeq2seqに基づくニューラルネットワークの予測および特徴抽出機能を活用するデータ駆動学習フレームワークを提案する。このフレームワークでトレーニングした後、学習したモデルは長期予測精度を大幅に向上させることができる。提案手法の精度と有効性は,予測された軌道と基礎的真実とを比較して評価する。
論文参考訳（メタデータ） (2024-09-25T21:08:25Z)
The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes [30.30769701138665]
我々は、訓練データとテストデータの間の相互影響を浮き彫りにして、ミラーレッド影響仮説を導入し、探求する。具体的には、テスト予測に対するトレーニングデータの影響を評価することは、等価だが逆問題として再定義することができることを示唆している。トレーニングポイント毎に前方パスとペアを組むことで,特定のテストサンプルの勾配を計算し,トレーニングデータの影響を推定する新しい手法を提案する。
論文参考訳（メタデータ） (2024-02-14T03:43:05Z)
Distil the informative essence of loop detector data set: Is network-level traffic forecasting hungry for more data? [0.8002196839441036]
本稿では,予測モデルのトレーニングに実際に有効なループデータのサンプル数を検討するために,不確実性を考慮したトラフィック予測フレームワークを提案する。提案手法は,大規模トラフィックデータセットの真の情報内容を評価する上で有用である。
論文参考訳（メタデータ） (2023-10-31T11:23:10Z)
Orthogonal Uncertainty Representation of Data Manifold for Robust Long-Tailed Learning [52.021899899683675]
長い尾の分布を持つシナリオでは、尾のサンプルが不足しているため、モデルが尾のクラスを識別する能力は制限される。モデルロバストネスの長期的現象を改善するために,特徴埋め込みの直交不確実性表現(OUR)とエンドツーエンドのトレーニング戦略を提案する。
論文参考訳（メタデータ） (2023-10-16T05:50:34Z)
Alleviating the Effect of Data Imbalance on Adversarial Training [26.36714114672729]
長い尾の分布に従うデータセットの逆トレーニングについて検討する。我々は、新しい対人訓練フレームワーク、Re-balancing Adversarial Training (REAT)を提案する。
論文参考訳（メタデータ） (2023-07-14T07:01:48Z)
Adapting to Continuous Covariate Shift via Online Density Ratio Estimation [64.8027122329609]
分散シフトへの対処は、現代の機械学習における中心的な課題の1つだ。歴史的情報を適切に再利用するオンライン手法を提案する。我々の密度比推定法は, ダイナミックなリセットバウンドを楽しむことにより, 良好に動作できることが証明された。
論文参考訳（メタデータ） (2023-02-06T04:03:33Z)
Managing dataset shift by adversarial validation for credit scoring [5.560471251954645]
トレーニングデータの分布と実際に予測する必要があるデータとの矛盾は、モデルパフォーマンスの低下を引き起こす可能性がある。本稿では,クレジットスコアリングシナリオにおけるデータセットシフト問題を軽減するための,逆検証に基づく手法を提案する。
論文参考訳（メタデータ） (2021-12-19T07:07:15Z)
Improved Fine-tuning by Leveraging Pre-training Data: Theory and Practice [52.11183787786718]
対象データに事前学習されたモデルを微調整することは、多くのディープラーニングアプリケーションで広く利用されている。近年の研究では、スクラッチからのトレーニングが、この事前トレーニング戦略に比較して、最終的なパフォーマンスを示すことが実証されている。本稿では,対象タスクの一般化を改善するために,事前学習データからサブセットを選択する新しい選択戦略を提案する。
論文参考訳（メタデータ） (2021-11-24T06:18:32Z)
Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文参考訳（メタデータ） (2021-03-08T16:03:09Z)
Evaluating Prediction-Time Batch Normalization for Robustness under Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文参考訳（メタデータ） (2020-06-19T05:08:43Z)
Precise Tradeoffs in Adversarial Training for Linear Regression [55.764306209771405]
本稿では,ガウス的特徴を伴う線形回帰の文脈における対人訓練の役割を,正確かつ包括的に理解する。我々は,同時代のミニマックス対逆訓練手法によって達成された標準/ロバスト精度とそれに対応するトレードオフを正確に特徴づける。逆行訓練アルゴリズムの理論は、様々な要因(トレーニングデータのサイズや品質、モデルの過度化など)がこれらの2つの競合するアキュラシー間のトレードオフにどのように影響するかを厳密に研究する上で役立ちます。
論文参考訳（メタデータ） (2020-02-24T19:01:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。