論文の概要: Selecting Datasets for Evaluating an Enhanced Deep Learning Framework
- arxiv url: http://arxiv.org/abs/2109.10442v1
- Date: Tue, 21 Sep 2021 22:09:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 13:43:23.952262
- Title: Selecting Datasets for Evaluating an Enhanced Deep Learning Framework
- Title(参考訳): 深層学習フレームワーク評価のためのデータセットの選択
- Authors: Kudakwashe Dandajena, Isabella M. Venter, Mehrdad Ghaziasgar and Reg
Dodds
- Abstract要約: この研究は続くステップに対処し、異常な不規則なシーケンシャルパターンによって特徴づけられる適切なデータセットを選択する。
開発されたフレームワークは、最も適切なデータセットを使用してテストされた。
本研究は、金融市場と日替わりの通貨交換ドメインが、設計したディープラーニングフレームワークの評価に最も適したデータセットであると結論付けた。
- 参考スコア(独自算出の注目度): 0.2999888908665658
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A framework was developed to address limitations associated with existing
techniques for analysing sequences. This work deals with the steps followed to
select suitable datasets characterised by discrete irregular sequential
patterns. To identify, select, explore and evaluate which datasets from various
sources extracted from more than 400 research articles, an interquartile range
method for outlier calculation and a qualitative Billauer's algorithm was
adapted to provide periodical peak detection in such datasets.
The developed framework was then tested using the most appropriate datasets.
The research concluded that the financial market-daily currency exchange
domain is the most suitable kind of data set for the evaluation of the designed
deep learning framework, as it provides high levels of discrete irregular
patterns.
- Abstract(参考訳): 既存の解析技術に関連する制約に対処するフレームワークが開発された。
この研究は続くステップを扱い、不規則な逐次パターンによって特徴づけられる適切なデータセットを選択する。
400以上の研究論文から抽出された様々な情報源から抽出されたデータセットを識別,選択,探索し,評価するために,アウタリエ計算のための異種間距離法と定性ビラーアルゴリズムを適用し,これらのデータセットの周期的なピーク検出を行った。
開発されたフレームワークは、最も適切なデータセットを使用してテストされた。
本研究は、金融市場と日替わりの通貨交換ドメインが、不規則なパターンのレベルが高いため、設計したディープラーニングフレームワークの評価に最も適したデータセットであると結論付けた。
関連論文リスト
- A Dataset for Evaluating Online Anomaly Detection Approaches for Discrete Multivariate Time Series [0.01874930567916036]
現在の公開データセットは小さすぎるため、多様ではない。
我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。
トレーニングとテストサブセットが汚染された、クリーンなバージョンで提供されるように、データセットのさまざまなバージョンを利用可能にしています。
予想通り、ベースライン実験では、データセットの半教師付きバージョンでトレーニングされたアプローチが、教師なしバージョンよりも優れていた。
論文 参考訳(メタデータ) (2024-11-21T09:03:12Z) - Unsupervised feature selection algorithm framework based on neighborhood interval disturbance fusion [8.869067846581943]
多くの教師なし特徴選択アルゴリズムの普遍性と安定性はデータセット構造に大きな影響を与えている。
本稿では、データセットを前処理し、間隔法を用いてデータセットを近似し、新しい間隔データセットの利点と欠点を実験的に検証する。
論文 参考訳(メタデータ) (2024-10-20T05:39:04Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Finding the Homology of Decision Boundaries with Active Learning [26.31885403636642]
本稿では,意思決定境界のホモロジーを回復するための能動的学習アルゴリズムを提案する。
我々のアルゴリズムは、ラベルを必要とするサンプルを逐次かつ適応的に選択する。
いくつかのデータセットの実験では、ホモロジーを回復する際のサンプルの複雑さの改善が示されている。
論文 参考訳(メタデータ) (2020-11-19T04:22:06Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。