論文の概要: Real World Time Series Benchmark Datasets with Distribution Shifts:
Global Crude Oil Price and Volatility
- arxiv url: http://arxiv.org/abs/2308.10846v1
- Date: Mon, 21 Aug 2023 16:44:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 12:40:18.747787
- Title: Real World Time Series Benchmark Datasets with Distribution Shifts:
Global Crude Oil Price and Volatility
- Title(参考訳): 流通シフトを伴うリアルタイム時系列ベンチマークデータセット:グローバル原油価格とボラティリティ
- Authors: Pranay Pasula
- Abstract要約: 我々はCOB,Crude Oil Benchmarkデータセットを提示する。
COBには30年間の資産価格が含まれており、大きな流通シフトを示している。
これらのタスクラベルを組み込むことで、4つの連続学習アルゴリズムの性能が普遍的に向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The scarcity of task-labeled time-series benchmarks in the financial domain
hinders progress in continual learning. Addressing this deficit would foster
innovation in this area. Therefore, we present COB, Crude Oil Benchmark
datasets. COB includes 30 years of asset prices that exhibit significant
distribution shifts and optimally generates corresponding task (i.e., regime)
labels based on these distribution shifts for the three most important crude
oils in the world. Our contributions include creating real-world benchmark
datasets by transforming asset price data into volatility proxies, fitting
models using expectation-maximization (EM), generating contextual task labels
that align with real-world events, and providing these labels as well as the
general algorithm to the public. We show that the inclusion of these task
labels universally improves performance on four continual learning algorithms,
some state-of-the-art, over multiple forecasting horizons. We hope these
benchmarks accelerate research in handling distribution shifts in real-world
data, especially due to the global importance of the assets considered. We've
made the (1) raw price data, (2) task labels generated by our approach, (3) and
code for our algorithm available at https://oilpricebenchmarks.github.io.
- Abstract(参考訳): 金融分野におけるタスクラベル付き時系列ベンチマークの不足は、継続的な学習の進歩を妨げる。
この欠陥に対処すれば、この地域のイノベーションが促進されるだろう。
そこで,COB,Crude Oil Benchmarkデータセットを提案する。
COBには30年間の資産価格が含まれており、世界で最も重要な3つの原油の流通シフトに基づいて、大きな流通シフトを示し、対応するタスク(すなわちレジーム)ラベルを最適に生成している。
コントリビューションには、資産価格データをボラティリティプロキシに変換し、期待最大化(EM)を用いたモデルに適合させ、実世界のイベントと整合したコンテキストタスクラベルを生成し、これらのラベルと一般のアルゴリズムを提供することによる、実世界のベンチマークデータセットの作成が含まれている。
これらのタスクラベルを組み込むことで、4つの連続学習アルゴリズム、いくつかの最先端、複数の予測地平線上での性能が向上することを示す。
これらのベンチマークは、特に考慮された資産のグローバルな重要性のために、現実世界のデータにおける分散シフトを扱う研究を加速することを期待している。
1) 原価データ、(2) アプローチによって生成されたタスクラベル、(3) アルゴリズムのコードは https://oilpricebenchmarks.github.io で利用可能です。
関連論文リスト
- Weak-Annotation of HAR Datasets using Vision Foundation Models [9.948823510429902]
本稿では,アノテータがアノテータに注釈を付ける必要のあるデータの量を大幅に削減する,新しいクラスタリングベースのアノテーションパイプラインを提案する。
提案手法を用いることで,3つのHARベンチマークデータセットに対して平均的なラベル付け精度を90%近い精度で達成できることがわかった。
論文 参考訳(メタデータ) (2024-08-09T16:46:53Z) - DSLOB: A Synthetic Limit Order Book Dataset for Benchmarking Forecasting
Algorithms under Distributional Shift [16.326002979578686]
電子取引市場において、リミットオーダーブック(LOB)は、所定のセキュリティのための様々な価格レベルで、保留中の購入/販売注文に関する情報を提供する。
近年、下流機械学習タスクの解決にLOBデータを使うことへの関心が高まっている。
論文 参考訳(メタデータ) (2022-11-17T06:33:27Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Binary Classification with Positive Labeling Sources [71.37692084951355]
WEAPOは、負のラベル付け源を使わずにトレーニングラベルを作成するための、シンプルで競争力のあるWS手法である。
We show WEAPO achieve the highest averaged performance on 10 benchmark datasets。
論文 参考訳(メタデータ) (2022-08-02T19:32:08Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Shifts 2.0: Extending The Dataset of Real Distributional Shifts [25.31085238930148]
シフトデータセットを、高い社会的重要性を持つ工業的、高リスクな応用から得られた2つのデータセットで拡張する。
3次元磁気共鳴脳画像における白質多発性硬化症病変の分節化の課題と船舶の電力消費量の推定について検討した。
これらの新しいデータセットは、研究者が新しい状況における堅牢な一般化と不確実性推定をさらに探求することを可能にする。
論文 参考訳(メタデータ) (2022-06-30T16:51:52Z) - Investigating Power laws in Deep Representation Learning [4.996066540156903]
本研究では,非ラベルデータセットにおける表現の質を評価するためのフレームワークを提案する。
表現学習に影響を与える3つの重要な属性に対して、電力法則の係数$alpha$を推定する。
特に$alpha$はラベルの知識のない表現から計算可能であり、非ラベル付きデータセットにおける表現の質を評価するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2022-02-11T18:11:32Z) - Basket-based Softmax [12.744577044692276]
我々は,バスケットベースソフトマックス(BBS)と呼ばれる新しい採鉱訓練戦略を提案する。
各トレーニングサンプルに対して、他のデータセットから負のクラスをマイニングする手がかりとして、類似度スコアを同時に採用する。
実世界とシミュレーションされたデータセットを用いて、顔認識と再識別のタスクにおけるBBSの効率性と優位性を実証する。
論文 参考訳(メタデータ) (2022-01-23T16:43:29Z) - Extending the WILDS Benchmark for Unsupervised Adaptation [186.90399201508953]
We present the WILDS 2.0 update, which extends 8 of the 10 datasets in the WILDS benchmark of distribution shifts to include curated unlabeled data。
これらのデータセットは、組織学から野生生物保護まで幅広い応用、タスク(分類、回帰、検出)、モダリティにまたがる。
ドメイン不変量や自己学習,自己管理など,ラベルのないデータを活用する最先端の手法を体系的にベンチマークする。
論文 参考訳(メタデータ) (2021-12-09T18:32:38Z) - Out-distribution aware Self-training in an Open World Setting [62.19882458285749]
オープンワールド環境ではラベルのないデータを活用して予測性能をさらに向上します。
注意深いサンプル選択戦略を含む,自己学習を意識したアウト・ディストリビューションを導入する。
当社の分類器は、設計外分布を意識しており、タスク関連の入力と無関係な入力を区別できます。
論文 参考訳(メタデータ) (2020-12-21T12:25:04Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。