論文の概要: Plotly-Resampler: Effective Visual Analytics for Large Time Series
- arxiv url: http://arxiv.org/abs/2206.08703v1
- Date: Fri, 17 Jun 2022 16:12:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 15:46:14.204554
- Title: Plotly-Resampler: Effective Visual Analytics for Large Time Series
- Title(参考訳): plotly-resampler: 大規模時系列の効果的なビジュアル分析
- Authors: Jonas Van Der Donckt, Jeroen Van Der Donckt, Emiel Deprost, Sofie Van
Hoecke
- Abstract要約: Plotly-ResamplerはPlotlyのPythonバインディング用のアドオンで、インタラクティブなツールキットの上にラインチャートのスケーラビリティを向上する。
Plotly-Resamplerのフレキシブルなデータアグリゲーション機能は、新しいアグリゲーション技術の研究への道を開く。
- 参考スコア(独自算出の注目度): 1.0756377625425109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual analytics is arguably the most important step in getting acquainted
with your data. This is especially the case for time series, as this data type
is hard to describe and cannot be fully understood when using for example
summary statistics. To realize effective time series visualization, four
requirements have to be met; a tool should be (1) interactive, (2) scalable to
millions of data points, (3) integrable in conventional data science
environments, and (4) highly configurable. We observe that open source Python
visualization toolkits empower data scientists in most visual analytics tasks,
but lack the combination of scalability and interactivity to realize effective
time series visualization. As a means to facilitate these requirements, we
created Plotly-Resampler, an open source Python library. Plotly-Resampler is an
add-on for Plotly's Python bindings, enhancing line chart scalability on top of
an interactive toolkit by aggregating the underlying data depending on the
current graph view. Plotly-Resampler is built to be snappy, as the reactivity
of a tool qualitatively affects how analysts visually explore and analyze data.
A benchmark task highlights how our toolkit scales better than alternatives in
terms of number of samples and time series. Additionally, Plotly-Resampler's
flexible data aggregation functionality paves the path towards researching
novel aggregation techniques. Plotly-Resampler's integrability, together with
its configurability, convenience, and high scalability, allows to effectively
analyze high-frequency data in your day-to-day Python environment.
- Abstract(参考訳): visual analyticsは間違いなく、データに精通する上で最も重要なステップだ。
これは特に時系列の場合であり、このデータ型は記述が困難であり、例えば要約統計を使用する場合、完全には理解できない。
効果的な時系列可視化を実現するためには,(1)対話的,(2)数百万のデータポイントにスケーラブル,(3)従来のデータサイエンス環境では統合可能,(4)高度に構成可能,の4つの要件を満たす必要がある。
オープンソースのpythonビジュアライゼーションツールキットは、ほとんどのビジュアル分析タスクでデータサイエンティストに役立つが、効果的な時系列視覚化を実現するためにスケーラビリティと対話性の組み合わせが欠如している。
これらの要件を促進する手段として、オープンソースのPythonライブラリであるPlotly-Resamplerを開発しました。
Plotly-Resamplerは、PlotlyのPythonバインディング用のアドオンで、現在のグラフビューに応じて基盤となるデータを集約することで、インタラクティブツールキット上でのラインチャートのスケーラビリティを向上させる。
Plotly-Resamplerは、ツールの反応性が、アナリストがデータを視覚的に探索し分析する方法に質的に影響を及ぼすため、スナッピーに作られている。
ベンチマークタスクでは、サンプル数や時系列の点で、ツールキットのスケールが代替よりも優れている点を強調します。
さらに、Plotly-Resamplerの柔軟なデータアグリゲーション機能は、新しいアグリゲーション技術の研究への道を開く。
plotly-resamplerの可積分性は、構成性、利便性、高スケーラビリティとともに、日々のpython環境での高周波データを効果的に分析できる。
関連論文リスト
- Exploring Scalability in Large-Scale Time Series in DeepVATS framework [3.8436076642278754]
DeepVATSは、Deep Learning(Deep)とVisual Analytics(VA)をマージして、大規模時系列データ(TS)の分析を行うツールである。
Rで開発されたDeep Learningモジュールは、StorageモジュールへのデータセットとDeep Learningモデルのロードを管理する。
本稿では,このツールを紹介し,ログ解析によるスケーラビリティについて検討する。
論文 参考訳(メタデータ) (2024-08-08T15:30:48Z) - Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - GenPlot: Increasing the Scale and Diversity of Chart Derendering Data [0.0]
我々は、合成データを用いて、チャートデレンダリングのための何十億ものプロットを生成するプロットジェネレータであるGenPlotを提案する。
OCR-free chart-to-text translation は視覚言語タスクの最先端の結果を得た。
論文 参考訳(メタデータ) (2023-06-20T17:25:53Z) - PyPOTS: A Python Toolbox for Data Mining on Partially-Observed Time
Series [0.0]
PyPOTSは、部分的に保存された時系列のデータマイニングと分析に特化した、オープンソースのPythonライブラリである。
これは、計算、分類、クラスタリング、予測の4つのタスクに分類される多様なアルゴリズムに容易にアクセスできる。
論文 参考訳(メタデータ) (2023-05-30T07:57:05Z) - VizExtract: Automatic Relation Extraction from Data Visualizations [7.2241069295727955]
本稿では,統計チャートから比較変数を自動的に抽出する枠組みを提案する。
コンピュータビジョンベースのフレームワークを活用して,線グラフや散布プロット,バーグラフなどの視覚化ファセットを自動的に識別し,ローカライズする。
制御された実験では、87.5%の精度で、グラフごとに1-3級数を持つグラフの変数間の相関、色の変化、およびラインスタイルを分類することができる。
論文 参考訳(メタデータ) (2021-12-07T04:27:08Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - Automatic Curation of Large-Scale Datasets for Audio-Visual
Representation Learning [62.47593143542552]
本稿では,自動データセットキュレーションのためのサブセット最適化手法について述べる。
本研究では,高視聴覚対応の映像を抽出し,自己監視モデルが自動的に構築されているにもかかわらず,既存のスケールのビデオデータセットと類似したダウンストリームパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-01-26T14:27:47Z) - MusPy: A Toolkit for Symbolic Music Generation [32.01713268702699]
MusPyは、シンボリック音楽生成のためのオープンソースのPythonライブラリである。
本稿では,現在MusPyが支援している11のデータセットの統計的解析について述べる。
論文 参考訳(メタデータ) (2020-08-05T06:16:13Z) - Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文 参考訳(メタデータ) (2020-05-02T03:09:50Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。