論文の概要: Two ways towards combining Sequential Neural Network and Statistical
Methods to Improve the Prediction of Time Series
- arxiv url: http://arxiv.org/abs/2110.00082v1
- Date: Thu, 30 Sep 2021 20:34:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 04:46:11.266179
- Title: Two ways towards combining Sequential Neural Network and Statistical
Methods to Improve the Prediction of Time Series
- Title(参考訳): 時系列ニューラルネットワークと統計的手法を組み合わせた時系列予測の2つの方法
- Authors: Jingwei Li
- Abstract要約: 本稿では,データ特徴の統計的抽出を生かした2つの方法,分解に基づく方法,および方法を提案する。
我々は, 時系列データを用いて, 安定性の異なる提案を評価した。
性能評価の結果、どちらの手法もモデルと学習を別々に使用する既存のスキームより優れていることが示された。
- 参考スコア(独自算出の注目度): 0.34265828682659694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistic modeling and data-driven learning are the two vital fields that
attract many attentions. Statistic models intend to capture and interpret the
relationships among variables, while data-based learning attempt to extract
information directly from the data without pre-processing through complex
models. Given the extensive studies in both fields, a subtle issue is how to
properly integrate data based methods with existing knowledge or models. In
this paper, based on the time series data, we propose two different directions
to integrate the two, a decomposition-based method and a method exploiting the
statistic extraction of data features. The first one decomposes the data into
linear stable, nonlinear stable and unstable parts, where suitable statistical
models are used for the linear stable and nonlinear stable parts while the
appropriate machine learning tools are used for the unstable parts. The second
one applies statistic models to extract statistics features of data and feed
them as additional inputs into the machine learning platform for training. The
most critical and challenging thing is how to determine and extract the
valuable information from mathematical or statistical models to boost the
performance of machine learning algorithms. We evaluate the proposal using time
series data with varying degrees of stability. Performance results show that
both methods can outperform existing schemes that use models and learning
separately, and the improvements can be over 60%. Both our proposed methods are
promising in bridging the gap between model-based and data-driven schemes and
integrating the two to provide an overall higher learning performance.
- Abstract(参考訳): 統計モデリングとデータ駆動学習は、多くの注目を集める2つの重要な分野である。
統計モデルは変数間の関係を捉えて解釈することを意図しており、データベースの学習は複雑なモデルを通じて前処理することなくデータから直接情報を抽出する。
両分野での広範な研究を考えると、データベースのメソッドを既存の知識やモデルと適切に統合する方法が微妙な問題である。
本稿では,時系列データに基づいて,データ特徴の統計的抽出を利用した分解法と解析手法の2つの方法を統合する。
まず、データを線形安定・非線形安定・不安定に分解し、線形安定・非線形安定部分に対して適切な統計モデルを、不安定部分に対して適切な機械学習ツールを使用する。
2つ目は統計モデルを適用してデータの統計特徴を抽出し、トレーニング用の機械学習プラットフォームに追加入力として与えるものだ。
最も重要で難しいのは、数学的または統計モデルから貴重な情報を決定・抽出し、機械学習アルゴリズムのパフォーマンスを高める方法である。
時系列データを用いて,安定性の異なる提案を評価した。
パフォーマンスの結果、どちらの手法もモデルと学習を別々に使用する既存のスキームよりも優れており、改善率は60%を超えている。
提案手法はいずれも,モデルベースとデータ駆動方式のギャップを橋渡しし,両者を統合することで,総合的に高い学習性能を提供する。
関連論文リスト
- Data Augmentation for Sparse Multidimensional Learning Performance Data Using Generative AI [17.242331892899543]
学習パフォーマンスデータは、適応学習における正しい解答や問題解決の試みを記述している。
学習性能データは、適応的なアイテム選択のため、ほとんどの実世界のアプリケーションでは、非常にスパースな(80%(sim)90%の欠落)傾向にある。
本稿では,学習者のデータの分散性に対処するために,学習者のデータを拡張するための体系的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T00:25:07Z) - Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Unlearning Information Bottleneck: Machine Unlearning of Systematic Patterns and Biases [6.936871609178494]
本稿では,機械学習のプロセスを強化するための新しい情報理論フレームワークであるUnlearning Information Bottleneck(UIB)を紹介する。
変分上界を提案することにより,データ分布の変化を安価な計算コストと統合する動的事前計算により,モデルパラメータを再検討する。
さまざまなデータセット,モデル,未学習手法を対象とした実験により,本手法は学習後のモデルの性能を維持しながら,体系的なパターンやバイアスを効果的に除去することを示した。
論文 参考訳(メタデータ) (2024-05-22T21:54:05Z) - An Entropy-Based Model for Hierarchical Learning [3.1473798197405944]
実世界のデータセットに共通する特徴は、データドメインがマルチスケールであることである。
本稿では,このマルチスケールデータ構造を利用した学習モデルを提案する。
階層的な学習モデルは、人間の論理的かつ進歩的な学習メカニズムにインスパイアされている。
論文 参考訳(メタデータ) (2022-12-30T13:14:46Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - A Data-Driven Method for Automated Data Superposition with Applications
in Soft Matter Science [0.0]
我々は任意の座標変換で実験データを重畳するデータ駆動非パラメトリック法を開発した。
本手法は, 材料分類, 設計, 発見などの応用を通知する, 解釈可能なデータ駆動モデルを生成する。
論文 参考訳(メタデータ) (2022-04-20T14:58:04Z) - Distilling Interpretable Models into Human-Readable Code [71.11328360614479]
人間可読性は機械学習モデル解釈可能性にとって重要で望ましい標準である。
従来の方法を用いて解釈可能なモデルを訓練し,それを簡潔で可読なコードに抽出する。
本稿では,幅広いユースケースで効率的に,確実に高品質な結果を生成する分別線形曲線フィッティングアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-01-21T01:46:36Z) - Learning physically consistent mathematical models from data using group
sparsity [2.580765958706854]
生物学、高騒音レベル、センサーによる相関、強いシステム間変動といった分野では、データ駆動モデルは非感覚的または物理的に矛盾する。
データ駆動モデリングにおいて$textitpriors$を強制する利点を示すシステム生物学のいくつかの応用例を示す。
論文 参考訳(メタデータ) (2020-12-11T14:45:38Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。