論文の概要: Time Series Data Mining Algorithms Towards Scalable and Real-Time
Behavior Monitoring
- arxiv url: http://arxiv.org/abs/2112.14630v1
- Date: Sun, 26 Dec 2021 11:13:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 14:45:01.880518
- Title: Time Series Data Mining Algorithms Towards Scalable and Real-Time
Behavior Monitoring
- Title(参考訳): 時系列データマイニングアルゴリズムによるスケーラブル・リアルタイム行動モニタリング
- Authors: Alireza Abdoli
- Abstract要約: センサから収集した弱いラベル付き時系列データにおいて,形状と特徴量の両方を用いて行動の分類を行うハイブリッドアルゴリズムを提案する。
我々のアルゴリズムは,形状と特徴の組み合わせに基づいて,実・雑音・複雑なデータセットを頑健に分類できることを実証する。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there have been unprecedented technological advances in
sensor technology, and sensors have become more affordable than ever. Thus,
sensor-driven data collection is increasingly becoming an attractive and
practical option for researchers around the globe. Such data is typically
extracted in the form of time series data, which can be investigated with data
mining techniques to summarize behaviors of a range of subjects including
humans and animals. While enabling cheap and mass collection of data,
continuous sensor data recording results in datasets which are big in size and
volume, which are challenging to process and analyze with traditional
techniques in a timely manner. Such collected sensor data is typically
extracted in the form of time series data. There are two main approaches in the
literature, namely, shape-based classification and feature-based
classification. Shape-based classification determines the best class according
to a distance measure. Feature-based classification, on the other hand,
measures properties of the time series and finds the best class according to
the set of features defined for the time series. In this dissertation, we
demonstrate that neither of the two techniques will dominate for some problems,
but that some combination of both might be the best. In other words, on a
single problem, it might be possible that one of the techniques is better for
one subset of the behaviors, and the other technique is better for another
subset of behaviors. We introduce a hybrid algorithm to classify behaviors,
using both shape and feature measures, in weakly labeled time series data
collected from sensors to quantify specific behaviors performed by the subject.
We demonstrate that our algorithm can robustly classify real, noisy, and
complex datasets, based on a combination of shape and features, and tested our
proposed algorithm on real-world datasets.
- Abstract(参考訳): 近年、センサー技術に先例のない技術進歩が見られ、センサはこれまでになく手頃な価格になった。
このように、センサー駆動のデータ収集は、世界中の研究者にとって魅力的で実用的な選択肢になりつつある。
このようなデータは典型的には時系列データとして抽出され、データマイニング技術を用いて人間や動物を含む様々な被験者の行動を要約することができる。
安価で大規模なデータの収集を可能にする一方で、連続センサーのデータ記録は、サイズとボリュームの大きいデータセットをタイムリーに処理し分析することが難しい。
このような収集されたセンサデータは典型的には時系列データとして抽出される。
文献には2つの主要なアプローチ、すなわち形状に基づく分類と特徴に基づく分類がある。
形状に基づく分類は、距離測度に応じて最良クラスを決定する。
一方、特徴に基づく分類は、時系列の特性を測定し、時系列で定義された特徴の集合に従って最適なクラスを見つける。
この論文では、どちらの手法もいくつかの問題では支配的ではないが、両者の組み合わせが最善であることを示す。
言い換えれば、1つの問題において、あるテクニックが1つの振る舞いのサブセットに、もう1つのテクニックが別の振る舞いのサブセットに、より良いかもしれないということです。
本研究では,センサから収集した弱ラベル時系列データを用いて,形状と特徴量の両方を用いて行動の分類を行うハイブリッドアルゴリズムを提案する。
本アルゴリズムは,形状と特徴の組み合わせに基づいて,実,ノイズ,複雑なデータセットをロバストに分類できることを実証し,本アルゴリズムを実世界のデータセット上でテストした。
関連論文リスト
- D3A-TS: Denoising-Driven Data Augmentation in Time Series [0.0]
本研究は,分類と回帰問題に対する時系列におけるデータ拡張のための異なる手法の研究と分析に焦点をあてる。
提案手法は拡散確率モデルを用いており、近年画像処理の分野で成功している。
その結果、この手法が、分類と回帰モデルを訓練するための合成データを作成する上で、高い有用性を示している。
論文 参考訳(メタデータ) (2023-12-09T11:37:07Z) - Binary Quantification and Dataset Shift: An Experimental Investigation [54.14283123210872]
量子化は教師付き学習タスクであり、未学習データの集合のクラス有病率の予測器を訓練する。
定量化と他のタイプのデータセットシフトの関係は、いまだ大きく、未調査のままである。
本稿では,これらのシフトに影響を受けるデータセットの生成プロトコルを確立することにより,データセットシフトの種類を詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T20:11:27Z) - MADS: Modulated Auto-Decoding SIREN for time series imputation [9.673093148930874]
我々は,暗黙のニューラル表現に基づく時系列計算のための新しい自動デコードフレームワークMADSを提案する。
実世界の2つのデータセット上で本モデルを評価し,時系列計算における最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-03T09:08:47Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Deep learning for time series classification [2.0305676256390934]
時系列分析により、時間の経過とともにプロセスの進化を可視化し、理解することができます。
時系列分類は時系列データを自動的にラベル付けするアルゴリズムで構成されている。
ディープラーニングは、教師付き分類タスクに対処する最も効果的な方法の1つとして登場した。
論文 参考訳(メタデータ) (2020-10-01T17:38:40Z) - Data Curves Clustering Using Common Patterns Detection [0.0]
分析とクラスタリングの時系列、あるいは一般にあらゆる種類の曲線は、いくつかの人間の活動にとって重要である。
共通パターン(CP)方法論を用いた新しい曲線クラスタリングについて紹介する。
論文 参考訳(メタデータ) (2020-01-05T18:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。