論文の概要: Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks
- arxiv url: http://arxiv.org/abs/2411.16421v1
- Date: Mon, 25 Nov 2024 14:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 17:07:50.828097
- Title: Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks
- Title(参考訳): デジタル台風データセットのための機械学習:複数の盆地への拡張と表現とタスクの新しい展開
- Authors: Asanobu Kitamoto, Erwan Dzik, Gaspar Faure,
- Abstract要約: 本稿では,長期的データを対象とした機械学習モデルを対象として,40年以上にわたって最長の台風衛星画像データセットの新バージョンを提案する。
データセットV2に新たに追加されたのは、南半球の熱帯サイクロンデータである。
2つの半球からのデータを持つことで、盆地と半球間の地域差について、新たな研究をすることができる。
- 参考スコア(独自算出の注目度): 0.30723404270319693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents the Digital Typhoon Dataset V2, a new version of the longest typhoon satellite image dataset for 40+ years aimed at benchmarking machine learning models for long-term spatio-temporal data. The new addition in Dataset V2 is tropical cyclone data from the southern hemisphere, in addition to the northern hemisphere data in Dataset V1. Having data from two hemispheres allows us to ask new research questions about regional differences across basins and hemispheres. We also discuss new developments in representations and tasks of the dataset. We first introduce a self-supervised learning framework for representation learning. Combined with the LSTM model, we discuss performance on intensity forecasting and extra-tropical transition forecasting tasks. We then propose new tasks, such as the typhoon center estimation task. We show that an object detection-based model performs better for stronger typhoons. Finally, we study how machine learning models can generalize across basins and hemispheres, by training the model on the northern hemisphere data and testing it on the southern hemisphere data. The dataset is publicly available at \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} and \url{https://github.com/kitamoto-lab/digital-typhoon/}.
- Abstract(参考訳): 本稿では,長期時空間データを対象とした機械学習モデルのベンチマークを目的とした,40年以上にわたり最長の台風衛星画像データセットの新バージョンであるDigital Typhoon Dataset V2を提案する。
Dataset V2の新たな追加は、Dataset V1の北半球データに加えて、南半球の熱帯サイクロンデータである。
2つの半球からのデータを持つことで、盆地と半球間の地域差について、新たな研究をすることができる。
また,データセットの表現やタスクの新たな展開についても論じる。
まず,表現学習のための自己教師型学習フレームワークを紹介する。
LSTMモデルと組み合わせて,強度予測と熱帯外遷移予測タスクの性能について検討する。
次に,台風センター推定タスクのような新しいタスクを提案する。
オブジェクト検出に基づくモデルは,強い台風に対してより優れた性能を示すことを示す。
最後に、北半球のデータに基づいてモデルをトレーニングし、南半球のデータでそれをテストすることにより、機械学習モデルが盆地や半球をまたいで一般化する方法について検討する。
データセットは \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} と \url{https://github.com/kitamoto-lab/digital-typhoon/} で公開されている。
関連論文リスト
- Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - CirT: Global Subseasonal-to-Seasonal Forecasting with Geometry-inspired Transformer [47.65152457550307]
重力の循環特性をモデル化する幾何インスパイアされた循環変換器(CirT)を提案する。
地球再分析5(ERA5)再解析データセットの実験は、我々のモデルが先進的なデータ駆動モデルよりも大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-02-27T04:26:23Z) - WxC-Bench: A Novel Dataset for Weather and Climate Downstream Tasks [1.0369983700531806]
高品質な機械学習(ML)対応データセットは、新しい人工知能(AI)モデルの開発において基礎的な役割を果たす。
本稿では、一般化可能なAIモデルの開発を支援するために設計されたマルチモーダルデータセットであるWxC-Benchを紹介する。
本稿では,データセットの包括的記述と,ベースライン解析の技術的検証について述べる。
論文 参考訳(メタデータ) (2024-12-03T19:20:27Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - Digital Typhoon: Long-term Satellite Image Dataset for the
Spatio-Temporal Modeling of Tropical Cyclones [0.907599024697789]
本稿では,40年以上にわたる台風衛星画像データセットの公開について述べる。
長期的データに対する機械学習モデルのベンチマークを目的としている。
データセットはhttp://agora.nii.ac.jp/digital-typhoon/で公開されている。
論文 参考訳(メタデータ) (2023-11-05T14:22:13Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Simulation of Atlantic Hurricane Tracks and Features: A Deep Learning
Approach [0.0]
本稿では機械学習(ML)とディープラーニング(DL)技術を用いて,HURDAT2データベースモデルで利用可能な入力データ(ストーム特徴)から取得する。
この目的を追求するために、嵐中心を経度と緯度で表す軌道モデルと、中央の圧力と最大風速1-min$の風速を10$mの高度で表す強度モデルが作成された。
嵐シミュレーションモデルの有効性はニューオーリンズ、マイアミ、ハッテラス岬の3つの例で実証されている。
論文 参考訳(メタデータ) (2022-08-12T13:14:25Z) - Physics Informed Shallow Machine Learning for Wind Speed Prediction [66.05661813632568]
イタリアの32カ所の標高10mの風速計から観測された大量の風のデータセットを分析した。
我々は、過去の風の履歴を用いて教師あり学習アルゴリズムを訓練し、その価値を将来予測する。
最適設計と性能は場所によって異なることがわかった。
論文 参考訳(メタデータ) (2022-04-01T14:55:10Z) - SubseasonalClimateUSA: A Dataset for Subseasonal Forecasting and
Benchmarking [20.442879707675115]
SubseasonalClimateUSAは、米国におけるサブシーズン予測モデルのトレーニングとベンチマークのための、キュレートされたデータセットである。
このデータセットを使用して、操作力学モデル、古典的気象ベースライン、最先端の機械学習10、文献からのディープラーニングベースのメソッドなど、さまざまなモデルのスイートをベンチマークします。
論文 参考訳(メタデータ) (2021-09-21T18:42:10Z) - Hurricane Forecasting: A Novel Multimodal Machine Learning Framework [2.829284162137884]
我々のフレームワークはHurricastと呼ばれ、時空間データと統計データを効率的に組み合わせている。
Hurricastの運用予測コンセンサスモデルへの導入は、National Hurricane Centerの公式予測よりも改善される可能性がある。
論文 参考訳(メタデータ) (2020-11-11T23:55:33Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - WeatherBench: A benchmark dataset for data-driven weather forecasting [17.76377510880905]
データ駆動型中距離天気予報のためのベンチマークデータセットを提案する。
機械学習モデルでの使用を容易にするために処理されたERA5アーカイブから得られたデータを提供する。
単純な線形回帰手法、ディープラーニングモデル、および純粋に物理的な予測モデルからベースラインスコアを提供する。
論文 参考訳(メタデータ) (2020-02-02T19:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。