論文の概要: SCANIA Component X Dataset: A Real-World Multivariate Time Series
Dataset for Predictive Maintenance
- arxiv url: http://arxiv.org/abs/2401.15199v1
- Date: Fri, 26 Jan 2024 20:51:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 19:22:09.290779
- Title: SCANIA Component X Dataset: A Real-World Multivariate Time Series
Dataset for Predictive Maintenance
- Title(参考訳): SCANIA Component X Dataset: 予測メンテナンスのための実世界の多変量時系列データセット
- Authors: Zahra Kharazian, Tony Lindgren, Sindri Magn\'usson, Olof Steinert,
Oskar Andersson Reyna
- Abstract要約: このデータセットには、詳細な運用データ、修理記録、トラックの仕様をキャプチャするさまざまな変数が含まれている。
分類、回帰、生存分析、異常検出などの機械学習応用に適している。
このデータセットをリリースする目的は、国際的に有名な企業の実際のデータを扱う可能性を、幅広い研究者に提供することである。
- 参考スコア(独自算出の注目度): 0.7499722271664147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a description of a real-world, multivariate time series
dataset collected from an anonymized engine component (called Component X) of a
fleet of trucks from SCANIA, Sweden. This dataset includes diverse variables
capturing detailed operational data, repair records, and specifications of
trucks while maintaining confidentiality by anonymization. It is well-suited
for a range of machine learning applications, such as classification,
regression, survival analysis, and anomaly detection, particularly when applied
to predictive maintenance scenarios. The large population size and variety of
features in the format of histograms and numerical counters, along with the
inclusion of temporal information, make this real-world dataset unique in the
field. The objective of releasing this dataset is to give a broad range of
researchers the possibility of working with real-world data from an
internationally well-known company and introduce a standard benchmark to the
predictive maintenance field, fostering reproducible research.
- Abstract(参考訳): 本稿では,スウェーデンのSCANIAのトラック群における,匿名化エンジンコンポーネント(Component X)から収集した実世界の多変量時系列データセットについて述べる。
このデータセットには、詳細な運用データ、修理記録、トラックの仕様を収集し、匿名化による機密性を維持しながら、さまざまな変数が含まれている。
分類、回帰、生存分析、異常検出などの機械学習応用には適しており、特に予測保守シナリオに適用する場合に適している。
ヒストグラムと数値カウンタのフォーマットにおける人口規模と特徴の多様さと時間的情報の導入により、この実世界のデータセットはこの分野でユニークなものとなっている。
このデータセットをリリースする目的は、国際的に有名な企業からの実世界データを扱う可能性を幅広い研究者に与え、予測保守分野に標準ベンチマークを導入し、再現可能な研究を育むことである。
関連論文リスト
- infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Self-supervised Activity Representation Learning with Incremental Data:
An Empirical Study [7.782045150068569]
本研究では,時系列分類タスクにおける自己教師付き表現学習モデルの利用が及ぼす影響について検討する。
4つの公開データセットにおいて,ラベル付きデータのサイズ,分布,ソースが最終分類性能に与える影響を解析した。
論文 参考訳(メタデータ) (2023-05-01T01:39:55Z) - GenSyn: A Multi-stage Framework for Generating Synthetic Microdata using
Macro Data Sources [21.32471030724983]
人口を特徴付ける個人レベルのデータ(マイクロデータ)は多くの現実世界の問題を研究するのに不可欠である。
本研究では,高分解能データの抽出方法として合成データ生成について検討する。
論文 参考訳(メタデータ) (2022-12-08T01:22:12Z) - Large Scale Real-World Multi-Person Tracking [68.27438015329807]
本稿では,新しい大規模多人数追跡データセットであるtexttPersonPath22を提案する。
MOT17、HiEve、MOT20などの高品質なマルチオブジェクト追跡データセットよりも桁違いに大きい。
論文 参考訳(メタデータ) (2022-11-03T23:03:13Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Satellite Image Time Series Analysis for Big Earth Observation Data [50.591267188664666]
本稿では,機械学習を用いた衛星画像時系列解析のためのオープンソースRパッケージである sit について述べる。
本手法は, Cerrado Biome のケーススタディにより, 土地利用と土地被覆マップの精度が高いことを示す。
論文 参考訳(メタデータ) (2022-04-24T15:23:25Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - Monash Time Series Forecasting Archive [6.0617755214437405]
各種ドメインから利用可能な20の時系列データセットを含む総合時系列予測アーカイブを提案する。
特徴分析を行うことで,データセットを特徴付け,それらの類似点と相違点を識別する。
本論文では,8つの誤差指標にまたがる全データセットに対する標準ベースライン予測手法の性能について述べる。
論文 参考訳(メタデータ) (2021-05-14T04:49:58Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - SVIRO: Synthetic Vehicle Interior Rear Seat Occupancy Dataset and
Benchmark [11.101588888002045]
SVIROは10台の異なる車両の旅客室におけるシーンの合成データセットである。
限られたバリエーションに基づいて学習した際の一般化能力と信頼性について、機械学習に基づくアプローチを解析する。
論文 参考訳(メタデータ) (2020-01-10T14:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。