論文の概要: Data Augmentation for Deep Candlestick Learner
- arxiv url: http://arxiv.org/abs/2005.06731v2
- Date: Fri, 29 May 2020 06:02:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 04:19:43.656480
- Title: Data Augmentation for Deep Candlestick Learner
- Title(参考訳): 深部キャンドルスティック学習者のデータ拡張
- Authors: Chia-Ying Tsao, Jun-Hao Chen, Samuel Yen-Chi Chen, and Yun-Cheng Tsai
- Abstract要約: そこで本研究では,ロウソクスティックデータを改良したローカルサーチアタックサンプリング手法を提案する。
提案手法は,人間の識別が難しい高品質なデータを生成することができることを示す。
- 参考スコア(独自算出の注目度): 2.104922050913737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To successfully build a deep learning model, it will need a large amount of
labeled data. However, labeled data are hard to collect in many use cases. To
tackle this problem, a bunch of data augmentation methods have been introduced
recently and have demonstrated successful results in computer vision, natural
language and so on. For financial trading data, to our best knowledge,
successful data augmentation framework has rarely been studied. Here we propose
a Modified Local Search Attack Sampling method to augment the candlestick data,
which is a very important tool for professional trader. Our results show that
the proposed method can generate high-quality data which are hard to
distinguish by human and will open a new way for finance community to employ
existing machine learning techniques even if the dataset is small.
- Abstract(参考訳): ディープラーニングモデルをうまく構築するには、大量のラベル付きデータが必要です。
しかし、ラベル付きデータは多くのユースケースで収集が難しい。
この問題に対処するため、近年データ拡張手法が数多く導入され、コンピュータビジョンや自然言語などにおいて成功した成果が示されている。
金融トレーディングデータについては、私たちの知る限り、成功したデータ拡張フレームワークはめったに研究されていない。
本稿では,プロのトレーダにとって非常に重要なツールであるロウソクスティックデータを拡張するための改良されたローカル検索攻撃サンプリング手法を提案する。
提案手法は,人間による識別が難しい高品質なデータを生成することができ,データセットが小さい場合でも,既存の機械学習技術を採用するための新たな方法が提供される。
関連論文リスト
- Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data [54.934578742209716]
現実世界のNLPアプリケーションでは、Large Language Models (LLMs) は巨大なデータセットの広範なトレーニングのために、有望なソリューションを提供する。
LLKDは、教師と学生の両方の信号を組み込んだ適応的なサンプル選択法である。
総合的な実験により,LLKDは高いデータ効率で,様々なデータセットで優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-11-12T18:57:59Z) - Investigating the Impact of Semi-Supervised Methods with Data Augmentation on Offensive Language Detection in Romanian Language [2.2823100315094624]
攻撃的な言語検出は、今日のデジタルランドスケープにおいて重要なタスクです。
堅牢な攻撃的言語検出モデルを構築するには、大量のラベル付きデータが必要である。
半教師付き学習はラベル付きおよびラベルなしのデータを活用することで実現可能なソリューションを提供する。
論文 参考訳(メタデータ) (2024-07-29T15:02:51Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Data Augmentation for Neural NLP [0.0]
データ拡張は、データの不足に対処するための低コストなアプローチである。
本稿では,自然言語処理における最先端データ拡張手法の概要について述べる。
論文 参考訳(メタデータ) (2023-02-22T14:47:15Z) - Evaluating and Crafting Datasets Effective for Deep Learning With Data
Maps [0.0]
大規模なデータセットのトレーニングには、過剰なシステムリソースと実現不可能な時間を要することが多い。
教師付き学習では、大規模なデータセットはサンプルを手動でラベル付けするのにより多くの時間を必要とする。
そこで本研究では,初期のトレーニングセッションの後に,分散モデルの精度に匹敵する精度で,より小さなデータセットをキュレートする手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T03:30:18Z) - Fix your Models by Fixing your Datasets [0.6058427379240697]
現在の機械学習ツールは、データ品質を改善するための合理化されたプロセスを欠いている。
そこで,本研究では,データセットにノイズや誤認のあるサンプルを見つけるための体系的枠組みを提案する。
2つのFortune 500企業のプライベートエンタープライズデータセットと同様に、当社のフレームワークの有効性を公開してみます。
論文 参考訳(メタデータ) (2021-12-15T02:41:50Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Evaluating data augmentation for financial time series classification [85.38479579398525]
2つの最先端ディープラーニングモデルを用いて,ストックデータセットに適用したいくつかの拡張手法を評価する。
比較的小さなデータセット拡張手法では、リスク調整された戻り値のパフォーマンスが最大400%向上する。
より大きなストックデータセット拡張メソッドでは、最大40%の改善が達成される。
論文 参考訳(メタデータ) (2020-10-28T17:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。