論文の概要: Iterative Forgetting: Online Data Stream Regression Using Database-Inspired Adaptive Granulation
- arxiv url: http://arxiv.org/abs/2403.09588v1
- Date: Thu, 14 Mar 2024 17:26:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 19:38:09.143616
- Title: Iterative Forgetting: Online Data Stream Regression Using Database-Inspired Adaptive Granulation
- Title(参考訳): 反復予測:データベースにインスパイアされた適応的グラデーションを用いたオンラインデータストリーム回帰
- Authors: Niket Kathiriya, Hossein Haeri, Cindy Chen, Kshitij Jerath,
- Abstract要約: 本稿では、R*木からインスピレーションを得て、入ってくるデータストリームからグラニュラーを生成するデータベースインスピレーション付きデータストリーム回帰モデルを提案する。
実験により、この手法がデータを破棄する能力は、レイテンシとトレーニング時間において大幅に改善されることが示された。
- 参考スコア(独自算出の注目度): 1.6874375111244329
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many modern systems, such as financial, transportation, and telecommunications systems, are time-sensitive in the sense that they demand low-latency predictions for real-time decision-making. Such systems often have to contend with continuous unbounded data streams as well as concept drift, which are challenging requirements that traditional regression techniques are unable to cater to. There exists a need to create novel data stream regression methods that can handle these scenarios. We present a database-inspired datastream regression model that (a) uses inspiration from R*-trees to create granules from incoming datastreams such that relevant information is retained, (b) iteratively forgets granules whose information is deemed to be outdated, thus maintaining a list of only recent, relevant granules, and (c) uses the recent data and granules to provide low-latency predictions. The R*-tree-inspired approach also makes the algorithm amenable to integration with database systems. Our experiments demonstrate that the ability of this method to discard data produces a significant order-of-magnitude improvement in latency and training time when evaluated against the most accurate state-of-the-art algorithms, while the R*-tree-inspired granulation technique provides competitively accurate predictions
- Abstract(参考訳): 金融、交通、電気通信などの現代のシステムの多くは、リアルタイム意思決定のために低レイテンシの予測を要求するという意味で、時間に敏感である。
このようなシステムは、しばしば、伝統的な回帰テクニックが耐えられないという難しい要件である概念のドリフトと同様に、連続した無制限のデータストリームと競合する必要があります。
これらのシナリオを処理できる新しいデータストリームレグレッションメソッドを作成する必要がある。
データベースにインスパイアされたデータストリーム回帰モデルを提案する。
(a)R*-ツリーからインスピレーションを得て、関連する情報が保持されるように、入ってくるデータストリームから顆粒を生成する。
b) 情報を時代遅れとみなす粒状体を反復的に忘れ、かつ、最近、関係のある粒状体のみのリストを維持し、
(c) 最新のデータと顆粒を用いて低遅延予測を行う。
R*ツリーにインスパイアされたアプローチは、アルゴリズムをデータベースシステムと統合できるようにする。
我々の実験は、この手法がデータを捨てる能力は、最も正確な最先端のアルゴリズムに対して評価した場合のレイテンシとトレーニング時間において、大幅に改善され、R*ツリーにインスパイアされた顆粒化技術は競合的に正確な予測を提供することを示した。
関連論文リスト
- Temporal Disentangled Contrastive Diffusion Model for Spatiotemporal
Imputation [36.80005620519233]
C$2$TSDは、トレンド情報と季節情報を条件付き特徴として取り入れ、モデル一般化性を改善するために対照的な学習を採用する新しいアプローチである。
3つの実世界のデータセットに対する実験は、様々な最先端ベースラインよりもC$2$TSDの方が優れた性能を示している。
論文 参考訳(メタデータ) (2024-02-18T11:59:04Z) - GenQ: Quantization in Low Data Regimes with Generative Synthetic Data [30.489005912126544]
GenQは、高度な生成AIモデルを使用して高解像度の合成データを生成する新しいアプローチである。
データの可用性が限られている場合、実際のデータは合成データ生成プロセスのガイドに使用される。
厳密な実験を通じて、GenQはデータフリーおよびデータスカース量子化の新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2023-12-07T23:31:42Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation
for Time Series [49.992908221544624]
時系列データは、しばしば多くの欠落した値を示し、これは時系列計算タスクである。
従来の深層学習法は時系列計算に有効であることが示されている。
本研究では,不確実性のある高精度な計算を行う非生成時系列計算法を提案する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Online Evolutionary Neural Architecture Search for Multivariate
Non-Stationary Time Series Forecasting [72.89994745876086]
本研究は、オンラインニューロ進化に基づくニューラルアーキテクチャサーチ(ONE-NAS)アルゴリズムを提案する。
ONE-NASは、オンライン予測タスクのためにリカレントニューラルネットワーク(RNN)を自動設計し、動的にトレーニングする新しいニューラルネットワーク探索手法である。
その結果、ONE-NASは従来の統計時系列予測法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-20T22:25:47Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - A Meta-learning Approach to Reservoir Computing: Time Series Prediction
with Limited Data [0.0]
本研究では,実験プロセスから適切なモデル構造を自動的に抽出するデータ駆動型手法を提案する。
簡単なベンチマーク問題に対して,我々のアプローチを実証する。
論文 参考訳(メタデータ) (2021-10-07T18:23:14Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - Improved Predictive Deep Temporal Neural Networks with Trend Filtering [22.352437268596674]
本稿では,ディープニューラルネットワークとトレンドフィルタリングに基づく新しい予測フレームワークを提案する。
我々は,学習データをトレンドフィルタリングによって時間的に処理した場合,深部時相ニューラルネットワークの予測性能が向上することを明らかにする。
論文 参考訳(メタデータ) (2020-10-16T08:29:36Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Designing Accurate Emulators for Scientific Processes using
Calibration-Driven Deep Models [33.935755695805724]
Learn-by-Calibrating (LbC)は、科学応用においてエミュレータを設計するための新しいディープラーニングアプローチである。
また,LbCは広く適応された損失関数の選択に対して,一般化誤差を大幅に改善することを示した。
LbCは、小さなデータレギュレータでも高品質なエミュレータを実現し、さらに重要なことは、明確な事前条件なしで固有のノイズ構造を復元する。
論文 参考訳(メタデータ) (2020-05-05T16:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。