論文の概要: LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting
- arxiv url: http://arxiv.org/abs/2306.08259v2
- Date: Sat, 28 Oct 2023 08:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 21:29:30.476995
- Title: LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting
- Title(参考訳): LargeST: 大規模トラフィック予測のためのベンチマークデータセット
- Authors: Xu Liu, Yutong Xia, Yuxuan Liang, Junfeng Hu, Yiwei Wang, Lei Bai,
Chao Huang, Zhenguang Liu, Bryan Hooi, Roger Zimmermann
- Abstract要約: 道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
- 参考スコア(独自算出の注目度): 65.71129509623587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Road traffic forecasting plays a critical role in smart city initiatives and
has experienced significant advancements thanks to the power of deep learning
in capturing non-linear patterns of traffic data. However, the promising
results achieved on current public datasets may not be applicable to practical
scenarios due to limitations within these datasets. First, the limited sizes of
them may not reflect the real-world scale of traffic networks. Second, the
temporal coverage of these datasets is typically short, posing hurdles in
studying long-term patterns and acquiring sufficient samples for training deep
models. Third, these datasets often lack adequate metadata for sensors, which
compromises the reliability and interpretability of the data. To mitigate these
limitations, we introduce the LargeST benchmark dataset. It encompasses a total
number of 8,600 sensors in California with a 5-year time coverage and includes
comprehensive metadata. Using LargeST, we perform in-depth data analysis to
extract data insights, benchmark well-known baselines in terms of their
performance and efficiency, and identify challenges as well as opportunities
for future research. We release the datasets and baseline implementations at:
https://github.com/liuxu77/LargeST.
- Abstract(参考訳): 道路交通予測は、スマートシティのイニシアチブにおいて重要な役割を担い、トラフィックデータの非線形パターンを捉えた深層学習の力により、大きな進歩を遂げている。
しかし、現在の公開データセットで達成された有望な結果は、これらのデータセット内の制限のため、実用的なシナリオには適用できない可能性がある。
まず、制限されたサイズは、実際の交通ネットワークの規模を反映していない可能性がある。
第二に、これらのデータセットの時間的カバレッジは通常短く、長期的なパターンを研究し、深層モデルのトレーニングに十分なサンプルを取得する上でハードルとなる。
第三に、これらのデータセットはセンサーに十分なメタデータを欠いており、データの信頼性と解釈性を損なう。
これらの制限を軽減するため、LargeSTベンチマークデータセットを導入します。
カリフォルニアには合計8,600個のセンサーがあり、5年間にわたってカバーされ、包括的なメタデータを含んでいる。
最大で詳細なデータ分析を行い、データインサイトを抽出し、パフォーマンスと効率の観点からよく知られたベースラインをベンチマークし、課題と将来の研究の機会を特定します。
データセットとベースラインの実装は、https://github.com/liuxu77/ largestでリリースします。
関連論文リスト
- TrafficGPT: Breaking the Token Barrier for Efficient Long Traffic
Analysis and Generation [6.5215620509469705]
我々は、長いフローの分類と生成タスクに関連する複雑な課題に対処できるディープラーニングモデルであるTrafficGPTを紹介する。
TrafficGPTは、分類タスクにおいて優れたパフォーマンスを示し、最先端レベルに達する。
これらの進歩は、トラフィックフローの分類と生成タスクの両方における将来の応用を約束する。
論文 参考訳(メタデータ) (2024-03-09T07:19:37Z) - Distil the informative essence of loop detector data set: Is
network-level traffic forecasting hungry for more data? [0.8002196839441036]
本稿では,予測モデルのトレーニングに実際に有効なループデータのサンプル数を検討するために,不確実性を考慮したトラフィック予測フレームワークを提案する。
提案手法は,大規模トラフィックデータセットの真の情報内容を評価する上で有用である。
論文 参考訳(メタデータ) (2023-10-31T11:23:10Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Large Scale Real-World Multi-Person Tracking [68.27438015329807]
本稿では,新しい大規模多人数追跡データセットであるtexttPersonPath22を提案する。
MOT17、HiEve、MOT20などの高品質なマルチオブジェクト追跡データセットよりも桁違いに大きい。
論文 参考訳(メタデータ) (2022-11-03T23:03:13Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - The Stanford Drone Dataset is More Complex than We Think: An Analysis of
Key Characteristics [2.064612766965483]
スタンフォード・ドローン・データセット(SDD)の特徴について論じる。
この不便さがユーザに提供する情報を減らし,パフォーマンスに与える影響を実証する。
私たちの意図は、今後このデータセットに適用されるパフォーマンスとメソッドを向上させると同時に、新しいユーザのためのデータセットの明らかでない特徴を明確化することにあります。
論文 参考訳(メタデータ) (2022-03-22T13:58:14Z) - On The State of Data In Computer Vision: Human Annotations Remain
Indispensable for Developing Deep Learning Models [0.0]
高品質ラベル付きデータセットは機械学習(ML)の発展に重要な役割を果たす
2012年にImageNetデータセットとAlexNetモデルが登場して以来、新しいオープンソースのラベル付きビジョンデータセットのサイズはほぼ一定である。
コンピュータビジョンコミュニティの少数の出版物は、Imagenetよりも桁違いの大きさのデータセットの教師付き学習に取り組む。
論文 参考訳(メタデータ) (2021-07-31T00:08:21Z) - Towards Semantic Segmentation of Urban-Scale 3D Point Clouds: A Dataset,
Benchmarks and Challenges [52.624157840253204]
我々は、30億点近い注釈付きポイントを持つ都市規模の測光点クラウドデータセットを提示する。
私たちのデータセットは、イギリスの3つの都市からなり、都市の景観の約7.6km2をカバーしています。
我々は,データセット上での最先端アルゴリズムの性能を評価し,その結果を包括的に分析する。
論文 参考訳(メタデータ) (2020-09-07T14:47:07Z) - Short-Term Traffic Forecasting Using High-Resolution Traffic Data [2.0625936401496237]
本稿では,高分解能(イベントベース)トラフィックデータを用いた交通予測のためのデータ駆動ツールキットを開発した。
提案手法は,アラブ首長国連邦アブダビの現実世界の交通ネットワークから得られた高分解能データを用いて検証した。
論文 参考訳(メタデータ) (2020-06-22T14:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。