論文の概要: Hydra-LSTM: A semi-shared Machine Learning architecture for prediction across Watersheds
- arxiv url: http://arxiv.org/abs/2410.16343v1
- Date: Mon, 21 Oct 2024 11:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:28:18.244174
- Title: Hydra-LSTM: A semi-shared Machine Learning architecture for prediction across Watersheds
- Title(参考訳): Hydra-LSTM: 流域を横断する予測のための半共有機械学習アーキテクチャ
- Authors: Karan Ruparell, Robert J. Marks, Andy Wood, Kieran M. R. Hunt, Hannah L. Cloke, Christel Prudhomme, Florian Pappenberger, Matthew Chantry,
- Abstract要約: Hydra-LSTMプロセス変数は、いくつかのキャッチメントでのみ使用されるすべてのキャッチメントと変数で使用され、一般的なトレーニングとキャッチメント固有のデータの使用を可能にする。
我々は、マルチキャッシュやシングルキャッシュのLSTMよりも精度の高い中央値および量子予測を生成する。
我々は,ヒドラ・LSTMの河川流出をキャッチメント固有入力として導入することにより,キャッチメント固有データを組み込む能力をテストする。
- 参考スコア(独自算出の注目度): 0.2710246456535607
- License:
- Abstract: Long Short Term Memory networks (LSTMs) are used to build single models that predict river discharge across many catchments. These models offer greater accuracy than models trained on each catchment independently if using the same data. However, the same data is rarely available for all catchments. This prevents the use of variables available only in some catchments, such as historic river discharge or upstream discharge. The only existing method that allows for optional variables requires all variables to be considered in the initial training of the model, limiting its transferability to new catchments. To address this limitation, we develop the Hydra-LSTM. The Hydra-LSTM processes variables used across all catchments and variables used in only some catchments separately to allow general training and use of catchment-specific data in individual catchments. The bulk of the model can be shared across catchments, maintaining the benefits of multi-catchment models to generalise, while also benefitting from the advantages of using bespoke data. We apply this methodology to 1 day-ahead river discharge prediction in the Western US, as next-day river discharge prediction is the first step towards prediction across longer time scales. We obtain state-of-the-art performance, generating more accurate median and quantile predictions than Multi-Catchment and Single-Catchment LSTMs while allowing local forecasters to easily introduce and remove variables from their prediction set. We test the ability of the Hydra-LSTM to incorporate catchment-specific data by introducing historical river discharge as a catchment-specific input, outperforming state-of-the-art models without needing to train an entirely new model.
- Abstract(参考訳): 長期記憶ネットワーク(Long Short Term Memory Network、LSTM)は、多くの漁獲量にわたって河川の流出を予測する単一のモデルを構築するために用いられる。
これらのモデルは、同じデータを使用する場合、それぞれのキャッチメントで個別に訓練されたモデルよりも高い精度を提供する。
しかし、すべてのキャッチメントで同じデータが利用できることはめったにない。
これにより、歴史的河川の放流や上流の放流など、一部の漁獲物でしか利用できない変数の使用が防止される。
オプション変数を可能にする唯一の既存のメソッドは、モデルの初期トレーニングで考慮すべきすべての変数を必要とし、新しいキャッチメントへの転送可能性を制限する。
この制限に対処するため,Hydra-LSTMを開発した。
Hydra-LSTMプロセスは、いくつかのキャッチメントでのみ使用されるすべてのキャッチメントと変数を処理し、個々のキャッチメントで一般的なトレーニングとキャッチメント固有のデータの使用を可能にする。
モデルの大部分をキャッチメント間で共有することができ、マルチキャッシュモデルの利点を一般化すると同時に、bespokeデータを使用することのメリットも享受できる。
この手法を西アメリカでは1日ごとの河川流出予測に適用し、翌日の河川流出予測はより長い時間スケールでの予測に向けた第一歩である。
我々は、局所予測器が予測セットから変数を導入・削除しやすくしながら、マルチキャッシュやシングルキャッシュのLSTMよりも精度の高い中央値および量子予測を生成する、最先端のパフォーマンスを得る。
我々は,Hydra-LSTMを用いて,歴史的河川流出をキャッチメント固有入力として導入し,全く新しいモデルを訓練する必要がなく,最先端のモデルより優れていることを示す。
関連論文リスト
- Hierarchically Disentangled Recurrent Network for Factorizing System Dynamics of Multi-scale Systems [4.634606500665259]
マルチスケールプロセスのモデリングのための知識誘導機械学習(KGML)フレームワークを提案する。
本研究では,水文学における流れ予測の文脈におけるその性能について検討する。
論文 参考訳(メタデータ) (2024-07-29T16:25:43Z) - Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Differentiable, learnable, regionalized process-based models with
physical outputs can approach state-of-the-art hydrologic prediction accuracy [1.181206257787103]
地域化パラメータ化を伴う集中観測変数(ストリームフロー)に対するLSTMの性能レベルに、微分可能で学習可能なプロセスベースモデル(デルタモデルと呼ばれる)がアプローチ可能であることを示す。
我々は、単純な水理モデルHBVをバックボーンとして使用し、組み込みニューラルネットワークを使用します。
論文 参考訳(メタデータ) (2022-03-28T15:06:53Z) - On Anytime Learning at Macroscale [33.674452784463774]
多くの実用的なアプリケーションでは、データが一度に到着するのではなく、時間の経過とともにバッチになる。
欲求予測器は、これらが利用可能になったらすぐにバッチでトレーニングすることで、非自明な予測を生成することができるが、将来のデータの準最適利用も可能かもしれない。
荒々しい予測器は、複数のバッチをより大きなデータセットに集約するのに長い時間を要するが、最終的にははるかに優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2021-06-17T14:45:22Z) - Transfer learning suppresses simulation bias in predictive models built
from sparse, multi-modal data [15.587831925516957]
科学、工学、ビジネスにおける多くの問題は、ごくわずかな観察に基づく予測を必要とする。
堅牢な予測モデルを構築するには、特に設計空間が多次元である場合、これらのスパースデータをシミュレーションデータで拡張する必要がある。
ディープラーニングの最近の開発を組み合わせて、マルチモーダルデータからより堅牢な予測モデルを構築します。
論文 参考訳(メタデータ) (2021-04-19T23:28:32Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Rainfall-Runoff Prediction at Multiple Timescales with a Single Long
Short-Term Memory Network [41.33870234564485]
長期記憶ネットワーク(Long Short-Term Memory Networks, LSTMs)は, 日常の放電予測に顕著な成功を収めている。
しかし、多くの現実的なシナリオはより粒度の細かい時間スケールで予測を必要とする。
本研究では,一つのモデル内で複数の時間スケールを共同で予測する2つのMulti-Timescale LSTMアーキテクチャを提案する。
これらのモデルを米国大陸の516の流域でテストし、米国水モデルに対するベンチマークを行った。
論文 参考訳(メタデータ) (2020-10-15T17:52:16Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Fast, Accurate, and Simple Models for Tabular Data via Augmented
Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。
我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文 参考訳(メタデータ) (2020-06-25T09:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。