論文の概要: PTRAIL -- A python package for parallel trajectory data preprocessing
- arxiv url: http://arxiv.org/abs/2108.13202v1
- Date: Thu, 26 Aug 2021 20:14:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 12:46:07.255412
- Title: PTRAIL -- A python package for parallel trajectory data preprocessing
- Title(参考訳): PTRAIL -- 並列軌跡データ前処理のためのpythonパッケージ
- Authors: Salman Haidri, Yaksh J. Haranwala, Vania Bogorny, Chiara Renso,
Vinicius Prado da Fonseca, Amilcar Soares
- Abstract要約: 軌道データは、時間とともに空間における位置を変化させる物体の痕跡を表す。
トラジェクトリデータを前処理するように特別に調整されたソフトウェアが必要である。
提案するPTRAILは,数ステップの軌道前処理を行うピソンパッケージである。
- 参考スコア(独自算出の注目度): 2.348339658768759
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trajectory data represent a trace of an object that changes its position in
space over time. This kind of data is complex to handle and analyze, since it
is generally produced in huge quantities, often prone to errors generated by
the geolocation device, human mishandling, or area coverage limitation.
Therefore, there is a need for software specifically tailored to preprocess
trajectory data. In this work we propose PTRAIL, a python package offering
several trajectory preprocessing steps, including filtering, feature
extraction, and interpolation. PTRAIL uses parallel computation and
vectorization, being suitable for large datasets and fast compared to other
python libraries.
- Abstract(参考訳): 軌道データは、時間とともに空間における位置を変える物体の痕跡を表す。
この種のデータは処理や分析が複雑であり、一般的には膨大な量で生成されるため、ジオロケーションデバイスやヒューマンハンドリング、エリアカバレッジの制限によって発生するエラーが発生しやすい。
したがって、トラジェクトリデータの事前処理に適したソフトウェアが必要である。
本稿では,フィルタリングや特徴抽出,補間など,いくつかの軌道前処理ステップを提供するpythonパッケージであるptrailを提案する。
ptrailは並列計算とベクトル化を使い、他のpythonライブラリと比べて大きなデータセットに適しており、高速である。
関連論文リスト
- Timeseria: an object-oriented time series processing library [0.40964539027092917]
TimeseriaはPythonで実装されたオブジェクト指向の時系列処理ライブラリである。
時系列データを操作しやすくし、その上に統計的および機械学習モデルを構築することを目指している。
論文 参考訳(メタデータ) (2024-10-12T15:29:18Z) - Revisiting CNNs for Trajectory Similarity Learning [20.311950784166388]
ConvTrajを導入し、1Dと2Dの畳み込みを併用して、トラジェクトリの逐次的および地理的分布の特徴を捉える。
軌道類似度探索において,ConvTrajが最先端の精度を実現することを示す。
論文 参考訳(メタデータ) (2024-05-30T07:16:03Z) - Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow [49.724842920942024]
金融、気象学、エネルギーといった産業は毎日大量のデータを生み出している。
本研究では,データ分析エージェントであるData-Copilotを提案する。
論文 参考訳(メタデータ) (2023-06-12T16:12:56Z) - PARTIME: Scalable and Parallel Processing Over Time with Deep Neural
Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。
PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。
オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文 参考訳(メタデータ) (2022-10-17T14:49:14Z) - DADApy: Distance-based Analysis of DAta-manifolds in Python [51.37841707191944]
DADApyは、高次元データの分析と特徴付けのためのピソンソフトウェアパッケージである。
固有次元と確率密度を推定し、密度に基づくクラスタリングを行い、異なる距離メトリクスを比較する方法を提供する。
論文 参考訳(メタデータ) (2022-05-04T08:41:59Z) - Data Engineering for HPC with Python [0.0]
データエンジニアリングは、さまざまなデータフォーマット、ストレージ、データ抽出、変換、データ移動を扱う。
データエンジニアリングの1つのゴールは、データを元のデータから、ディープラーニングや機械学習アプリケーションで受け入れられるベクトル/行列/テンソルフォーマットに変換することである。
データを表現および処理するためのテーブル抽象化に基づく分散Python APIを提案する。
論文 参考訳(メタデータ) (2020-10-13T11:53:11Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - PyTorch Distributed: Experiences on Accelerating Data Parallel Training [11.393654219774444]
PyTorchは、ディープラーニングの研究や応用で広く使われている科学計算パッケージである。
本稿では,PyTorch分散データ並列モジュールの設計,実装,評価について述べる。
論文 参考訳(メタデータ) (2020-06-28T20:39:45Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。