論文の概要: Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks
- arxiv url: http://arxiv.org/abs/2411.16421v1
- Date: Mon, 25 Nov 2024 14:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:22:55.741621
- Title: Machine Learning for the Digital Typhoon Dataset: Extensions to Multiple Basins and New Developments in Representations and Tasks
- Title(参考訳): デジタル台風データセットのための機械学習:複数の盆地への拡張と表現とタスクの新しい展開
- Authors: Asanobu Kitamoto, Erwan Dzik, Gaspar Faure,
- Abstract要約: 本稿では,長期的データを対象とした機械学習モデルを対象として,40年以上にわたって最長の台風衛星画像データセットの新バージョンを提案する。
データセットV2に新たに追加されたのは、南半球の熱帯サイクロンデータである。
2つの半球からのデータを持つことで、盆地と半球間の地域差について、新たな研究をすることができる。
- 参考スコア(独自算出の注目度): 0.30723404270319693
- License:
- Abstract: This paper presents the Digital Typhoon Dataset V2, a new version of the longest typhoon satellite image dataset for 40+ years aimed at benchmarking machine learning models for long-term spatio-temporal data. The new addition in Dataset V2 is tropical cyclone data from the southern hemisphere, in addition to the northern hemisphere data in Dataset V1. Having data from two hemispheres allows us to ask new research questions about regional differences across basins and hemispheres. We also discuss new developments in representations and tasks of the dataset. We first introduce a self-supervised learning framework for representation learning. Combined with the LSTM model, we discuss performance on intensity forecasting and extra-tropical transition forecasting tasks. We then propose new tasks, such as the typhoon center estimation task. We show that an object detection-based model performs better for stronger typhoons. Finally, we study how machine learning models can generalize across basins and hemispheres, by training the model on the northern hemisphere data and testing it on the southern hemisphere data. The dataset is publicly available at \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} and \url{https://github.com/kitamoto-lab/digital-typhoon/}.
- Abstract(参考訳): 本稿では,長期時空間データを対象とした機械学習モデルのベンチマークを目的とした,40年以上にわたり最長の台風衛星画像データセットの新バージョンであるDigital Typhoon Dataset V2を提案する。
Dataset V2の新たな追加は、Dataset V1の北半球データに加えて、南半球の熱帯サイクロンデータである。
2つの半球からのデータを持つことで、盆地と半球間の地域差について、新たな研究をすることができる。
また,データセットの表現やタスクの新たな展開についても論じる。
まず,表現学習のための自己教師型学習フレームワークを紹介する。
LSTMモデルと組み合わせて,強度予測と熱帯外遷移予測タスクの性能について検討する。
次に,台風センター推定タスクのような新しいタスクを提案する。
オブジェクト検出に基づくモデルは,強い台風に対してより優れた性能を示すことを示す。
最後に、北半球のデータに基づいてモデルをトレーニングし、南半球のデータでそれをテストすることにより、機械学習モデルが盆地や半球をまたいで一般化する方法について検討する。
データセットは \url{http://agora.ex.nii.ac.jp/digital-typhoon/dataset/} と \url{https://github.com/kitamoto-lab/digital-typhoon/} で公開されている。
関連論文リスト
- EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - WxC-Bench: A Novel Dataset for Weather and Climate Downstream Tasks [1.0369983700531806]
高品質な機械学習(ML)対応データセットは、新しい人工知能(AI)モデルの開発において基礎的な役割を果たす。
本稿では、一般化可能なAIモデルの開発を支援するために設計されたマルチモーダルデータセットであるWxC-Benchを紹介する。
本稿では,データセットの包括的記述と,ベースライン解析の技術的検証について述べる。
論文 参考訳(メタデータ) (2024-12-03T19:20:27Z) - SCTc-TE: A Comprehensive Formulation and Benchmark for Temporal Event Forecasting [63.01035584154509]
私たちは完全に自動化されたパイプラインを開発し、約0.6百万のニュース記事からMidEast-TEという大規模なデータセットを構築しました。
このデータセットは、2015年から2022年まで、主に中東地域での協力と紛争イベントに焦点を当てている。
そこで本稿では,SCTc-TE予測にローカルコンテキストとグローバルコンテキストの両方を活用可能なLoGoを提案する。
論文 参考訳(メタデータ) (2023-12-02T07:40:21Z) - Digital Typhoon: Long-term Satellite Image Dataset for the
Spatio-Temporal Modeling of Tropical Cyclones [0.907599024697789]
本稿では,40年以上にわたる台風衛星画像データセットの公開について述べる。
長期的データに対する機械学習モデルのベンチマークを目的としている。
データセットはhttp://agora.nii.ac.jp/digital-typhoon/で公開されている。
論文 参考訳(メタデータ) (2023-11-05T14:22:13Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Simulation of Atlantic Hurricane Tracks and Features: A Deep Learning
Approach [0.0]
本稿では機械学習(ML)とディープラーニング(DL)技術を用いて,HURDAT2データベースモデルで利用可能な入力データ(ストーム特徴)から取得する。
この目的を追求するために、嵐中心を経度と緯度で表す軌道モデルと、中央の圧力と最大風速1-min$の風速を10$mの高度で表す強度モデルが作成された。
嵐シミュレーションモデルの有効性はニューオーリンズ、マイアミ、ハッテラス岬の3つの例で実証されている。
論文 参考訳(メタデータ) (2022-08-12T13:14:25Z) - Physics Informed Shallow Machine Learning for Wind Speed Prediction [66.05661813632568]
イタリアの32カ所の標高10mの風速計から観測された大量の風のデータセットを分析した。
我々は、過去の風の履歴を用いて教師あり学習アルゴリズムを訓練し、その価値を将来予測する。
最適設計と性能は場所によって異なることがわかった。
論文 参考訳(メタデータ) (2022-04-01T14:55:10Z) - SubseasonalClimateUSA: A Dataset for Subseasonal Forecasting and
Benchmarking [20.442879707675115]
SubseasonalClimateUSAは、米国におけるサブシーズン予測モデルのトレーニングとベンチマークのための、キュレートされたデータセットである。
このデータセットを使用して、操作力学モデル、古典的気象ベースライン、最先端の機械学習10、文献からのディープラーニングベースのメソッドなど、さまざまなモデルのスイートをベンチマークします。
論文 参考訳(メタデータ) (2021-09-21T18:42:10Z) - Hurricane Forecasting: A Novel Multimodal Machine Learning Framework [2.829284162137884]
我々のフレームワークはHurricastと呼ばれ、時空間データと統計データを効率的に組み合わせている。
Hurricastの運用予測コンセンサスモデルへの導入は、National Hurricane Centerの公式予測よりも改善される可能性がある。
論文 参考訳(メタデータ) (2020-11-11T23:55:33Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。