論文の概要: Extract Dynamic Information To Improve Time Series Modeling: a Case
Study with Scientific Workflow
- arxiv url: http://arxiv.org/abs/2205.09703v1
- Date: Thu, 19 May 2022 17:15:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 14:49:02.501609
- Title: Extract Dynamic Information To Improve Time Series Modeling: a Case
Study with Scientific Workflow
- Title(参考訳): 時系列モデリングを改善するための動的情報の抽出--科学的ワークフローを用いたケーススタディ
- Authors: Jeeyung Kim, Mengtian Jin, Youkow Homma, Alex Sim, Wilko Kroeger,
Kesheng Wu
- Abstract要約: 本研究では,大規模科学ワークフローの現状に関する動的情報を抽出する技術について述べる。
このアプローチの鍵となる考え方は、いくつかの方法で現在のイベントにマッチする最近の過去のデータ転送イベントを見つけることです。
実験の結果,記録された特性に合致する最近の事象を同定し,予測誤差を約12%低減できることがわかった。
- 参考スコア(独自算出の注目度): 3.4365264226554535
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In modeling time series data, we often need to augment the existing data
records to increase the modeling accuracy. In this work, we describe a number
of techniques to extract dynamic information about the current state of a large
scientific workflow, which could be generalized to other types of applications.
The specific task to be modeled is the time needed for transferring a file from
an experimental facility to a data center. The key idea of our approach is to
find recent past data transfer events that match the current event in some
ways. Tests showed that we could identify recent events matching some recorded
properties and reduce the prediction error by about 12% compared to the similar
models with only static features. We additionally explored an application
specific technique to extract information about the data production process,
and was able to reduce the average prediction error by 44%.
- Abstract(参考訳): 時系列データのモデリングでは、モデリング精度を高めるために、既存のデータレコードを拡張する必要があることが多い。
本研究では,他の種類の応用に一般化可能な,大規模科学ワークフローの現在の状態に関する動的情報を抽出する技術について述べる。
モデル化すべき特定のタスクは、実験施設からデータセンターにファイルを転送するのに必要な時間である。
私たちのアプローチの重要なアイデアは、現在のイベントと何らかの方法で一致する、最近のデータ転送イベントを見つけることです。
テストの結果、記録されたプロパティにマッチする最近のイベントを識別でき、静的な特徴しか持たない類似モデルと比較して予測誤差を約12%削減できることがわかった。
また,データ生成プロセスに関する情報を抽出するアプリケーション固有の手法についても検討し,平均予測誤差を44%削減することができた。
関連論文リスト
- Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Benchmarking Data Efficiency and Computational Efficiency of Temporal
Action Localization Models [42.06124795143787]
時間的アクションローカライゼーションでは、入力ビデオが与えられた場合、目的は、それがどのアクションを含むか、どこから始まり、どこで終わるかを予測することである。
この研究は、データ量や計算能力に制約された設定において、現在の深部時間的行動ローカライゼーションモデルがどのように機能するかを探索し、測定する。
論文 参考訳(メタデータ) (2023-08-24T20:59:55Z) - Post-training Model Quantization Using GANs for Synthetic Data
Generation [57.40733249681334]
量子化法における実データを用いたキャリブレーションの代用として合成データを用いた場合について検討する。
本稿では,StyleGAN2-ADAが生成したデータと事前学習したDiStyleGANを用いて定量化したモデルの性能と,実データを用いた量子化とフラクタル画像に基づく代替データ生成手法との比較を行った。
論文 参考訳(メタデータ) (2023-05-10T11:10:09Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Deep Time Series Models for Scarce Data [8.673181404172963]
時系列データは多くの領域で爆発的な速度で成長し、時系列モデリング研究の急増を刺激している。
データ希少性は、膨大なデータ分析の問題で発生する普遍的な問題です。
論文 参考訳(メタデータ) (2021-03-16T22:16:54Z) - Visualising Deep Network's Time-Series Representations [93.73198973454944]
機械学習モデルの普及にもかかわらず、多くの場合、モデルの内部で起きていることに関する洞察のないブラックボックスとして運用される。
本稿では,多次元時系列データの可視化に着目し,この問題に対処する手法を提案する。
高周波在庫市場データセットの実験は、この方法が迅速かつ識別可能な可視化を提供することを示しています。
論文 参考訳(メタデータ) (2021-03-12T09:53:34Z) - Time-Series Imputation with Wasserstein Interpolation for Optimal
Look-Ahead-Bias and Variance Tradeoff [66.59869239999459]
ファイナンスでは、ポートフォリオ最適化モデルをトレーニングする前に、損失の計算を適用することができる。
インキュベーションのために全データセットを使用するルックアヘッドバイアスと、トレーニングデータのみを使用することによるインキュベーションの大きなばらつきとの間には、本質的にトレードオフがある。
提案手法は,提案法における差分とルックアヘッドバイアスのトレードオフを最適に制御するベイズ後部コンセンサス分布である。
論文 参考訳(メタデータ) (2021-02-25T09:05:35Z) - Anomaly Detection at Scale: The Case for Deep Distributional Time Series
Models [14.621700495712647]
我々のアプローチの主な特徴は、実値または実値のベクトルからなる時系列をモデル化するのではなく、実値(またはベクトル)上の確率分布の時系列をモデル化することである。
本手法は,数百万の時系列上の異常検出とスケールのストリーミングに有効である。
我々は,オープンソースの異常検出ツールを,実世界のデータセットに対する平均17%の改善率で上回っていることを示す。
論文 参考訳(メタデータ) (2020-07-30T15:48:55Z) - The Effectiveness of Discretization in Forecasting: An Empirical Study
on Neural Time Series Models [15.281725756608981]
ニューラル予測アーキテクチャの予測性能に及ぼすデータ入力および出力変換の影響について検討する。
バイナリ化は実値入力の正規化に比べてほぼ常に性能が向上することがわかった。
論文 参考訳(メタデータ) (2020-05-20T15:09:28Z) - A Multi-Channel Neural Graphical Event Model with Negative Evidence [76.51278722190607]
イベントデータセットは、タイムライン上で不規則に発生するさまざまなタイプのイベントのシーケンスである。
基礎となる強度関数を推定するために,非パラメトリックディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T23:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。