論文の概要: DDG-DA: Data Distribution Generation for Predictable Concept Drift
Adaptation
- arxiv url: http://arxiv.org/abs/2201.04038v1
- Date: Tue, 11 Jan 2022 16:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 14:24:53.761091
- Title: DDG-DA: Data Distribution Generation for Predictable Concept Drift
Adaptation
- Title(参考訳): DDG-DA:予測可能なコンセプトドリフト適応のためのデータ分散生成
- Authors: Wendi Li, Xiao Yang, Weiqing Liu, Yingce Xia, Jiang Bian
- Abstract要約: 本稿では,データ分散の進化を効果的に予測できるDDG-DAを提案する。
具体的には、まず予測器を訓練して将来のデータ分布を推定し、次にそれを利用してトレーニングサンプルを生成し、最後に生成されたデータ上でモデルをトレーニングする。
- 参考スコア(独自算出の注目度): 34.03849669133438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many real-world scenarios, we often deal with streaming data that is
sequentially collected over time. Due to the non-stationary nature of the
environment, the streaming data distribution may change in unpredictable ways,
which is known as concept drift. To handle concept drift, previous methods
first detect when/where the concept drift happens and then adapt models to fit
the distribution of the latest data. However, there are still many cases that
some underlying factors of environment evolution are predictable, making it
possible to model the future concept drift trend of the streaming data, while
such cases are not fully explored in previous work.
In this paper, we propose a novel method DDG-DA, that can effectively
forecast the evolution of data distribution and improve the performance of
models. Specifically, we first train a predictor to estimate the future data
distribution, then leverage it to generate training samples, and finally train
models on the generated data. We conduct experiments on three real-world tasks
(forecasting on stock price trend, electricity load and solar irradiance) and
obtain significant improvement on multiple widely-used models.
- Abstract(参考訳): 多くの現実世界のシナリオでは、時間とともに順次収集されるストリーミングデータを扱うことが多い。
環境の非定常的な性質のため、ストリーミングデータ分布は予測不可能な方法で変化する可能性がある。
概念ドリフトを処理するために、従来の手法はまず、概念ドリフトの発生時期を検知し、次に最新のデータの分布に合わせてモデルを適用する。
しかしながら、環境進化の基盤となる要因が予測可能であり、ストリーミングデータの将来の概念ドリフト傾向をモデル化できるケースは多いが、以前の作業では十分に検討されていない。
本稿では,データ分散の進化を効果的に予測し,モデルの性能を向上させる手法DDG-DAを提案する。
具体的には、まず予測器をトレーニングして将来のデータ分布を推定し、次にトレーニングサンプルを生成し、最終的に生成されたデータでモデルをトレーニングします。
我々は,3つの実世界の課題(株価動向,電力負荷,日射量の予測)について実験を行い,多種多様なモデルにおいて有意な改善を得る。
関連論文リスト
- Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文 参考訳(メタデータ) (2024-11-04T23:15:21Z) - Addressing Concept Shift in Online Time Series Forecasting: Detect-then-Adapt [37.98336090671441]
概念 textbfDrift textbfDetection antextbfD textbfAdaptation (D3A)
まずドリフトの概念を検知し、次に急激な適応の検出の後、現在のモデルをドリフトされた概念に積極的に適応する。
これは、トレイン-テストのパフォーマンスの不整合に寄与する重要な要因であるデータ分散ギャップを軽減するのに役立ちます。
論文 参考訳(メタデータ) (2024-03-22T04:44:43Z) - Ask Your Distribution Shift if Pre-Training is Right for You [74.18516460467019]
実際に、事前訓練されたモデルの微調整は、いくつかのケースではロバスト性を大幅に改善するが、他のケースではまったく改善しない。
分散シフト中のモデルの2つの障害モード – トレーニングデータの補間不足とバイアス – に注目する。
我々の研究は、親指の規則として、事前学習は、粗悪な外挿を緩和するがデータセットのバイアスを緩和する助けとなることを示唆している。
論文 参考訳(メタデータ) (2024-02-29T23:46:28Z) - Humanoid Locomotion as Next Token Prediction [84.21335675130021]
我々のモデルは感覚運動軌道の自己回帰予測によって訓練された因果変換器である。
われわれのモデルでは、フルサイズのヒューマノイドがサンフランシスコでゼロショットで歩けることが示されている。
われわれのモデルは、わずか27時間の歩行データで訓練された場合でも現実世界に移行でき、後方歩行のような訓練中に見えないコマンドを一般化することができる。
論文 参考訳(メタデータ) (2024-02-29T18:57:37Z) - Online Test-Time Adaptation of Spatial-Temporal Traffic Flow Forecasting [13.770733370640565]
本稿では,時空間交通流予測問題に対するオンラインテスト時間適応手法の最初の研究を行う。
本稿では,直列分解法(ADCSD)による適応二重補正法を提案する。
提案手法では,テストフェーズ中にトレーニングされたモデル全体を微調整する代わりに,トレーニングされたモデルの後,ライトネットワークをアタッチし,データ入力が観測されるたびに,ライトネットワークのみをテストプロセスで微調整する。
論文 参考訳(メタデータ) (2024-01-08T12:04:39Z) - MemDA: Forecasting Urban Time Series with Memory-based Drift Adaptation [24.284969264008733]
本稿では,データの周期性を考慮してドリフトを符号化するコンセプトドリフト問題に対する新しい都市時系列予測モデルを提案する。
我々の設計は最先端の手法よりも優れており、既存の予測バックボーンに十分に一般化することができる。
論文 参考訳(メタデータ) (2023-09-25T15:22:28Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Handling Concept Drift in Global Time Series Forecasting [10.732102570751392]
我々は2つの新しい概念ドリフトハンドリング手法、すなわち、誤り寄与度重み付け(ECW)と勾配降下度重み付け(GDW)を提案する。
これらの手法は、最新のシリーズと全シリーズで個別に訓練された2つの予測モデルを使用し、最終的に2つのモデルが提供する予測の重み付け平均を最終予測と見なす。
論文 参考訳(メタデータ) (2023-04-04T03:46:25Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Learning Interpretable Deep State Space Model for Probabilistic Time
Series Forecasting [98.57851612518758]
確率的時系列予測は、その歴史に基づいて将来の分布を推定する。
本稿では,非線形エミッションモデルと遷移モデルとをネットワークによってパラメータ化した,確率的時系列予測のための深部状態空間モデルを提案する。
実験では,我々のモデルが正確かつ鋭い確率予測を生成することを示す。
論文 参考訳(メタデータ) (2021-01-31T06:49:33Z) - Learning Parameter Distributions to Detect Concept Drift in Data Streams [13.20231558027132]
実コンセプトドリフト検出のための新しいフレームワークであるERICSを提案する。
予測モデルのパラメータをランダム変数として扱うことにより、最適パラメータの分布の変化に対応する概念ドリフトが示される。
ERICSはまた、既存のアプローチよりも大きな利点である入力レベルで概念ドリフトを検出することができる。
論文 参考訳(メタデータ) (2020-10-19T11:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。