論文の概要: EasyTPP: Towards Open Benchmarking the Temporal Point Processes
- arxiv url: http://arxiv.org/abs/2307.08097v1
- Date: Sun, 16 Jul 2023 16:43:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 15:42:20.308843
- Title: EasyTPP: Towards Open Benchmarking the Temporal Point Processes
- Title(参考訳): easytpp: テンポラリポイントプロセスのオープンベンチマークに向けて
- Authors: Siqiao Xue, Xiaoming Shi, Zhixuan Chu, Yan Wang, Fan Zhou, Hongyan
Hao, Caigao Jiang, Chen Pan, Yi Xu, James Y. Zhang, Qingsong Wen, Jun Zhou,
Hongyuan Mei
- Abstract要約: 時間点過程(TPP)は、最も先進的な生成モデルとして登場した。
多くの強力なモデルが登場したにも拘わらず、それらを評価するための包括的なベンチマークはいまだに存在しない。
EasyTPPは、TPPを評価するための中央ベンチマークを確立することを目的としている。
- 参考スコア(独自算出の注目度): 30.820872224157718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continuous-time event sequences play a vital role in real-world domains such
as healthcare, finance, online shopping, social networks, and so on. To model
such data, temporal point processes (TPPs) have emerged as the most advanced
generative models, making a significant impact in both academic and application
communities. Despite the emergence of many powerful models in recent years,
there is still no comprehensive benchmark to evaluate them. This lack of
standardization impedes researchers and practitioners from comparing methods
and reproducing results, potentially slowing down progress in this field. In
this paper, we present EasyTPP, which aims to establish a central benchmark for
evaluating TPPs. Compared to previous work that also contributed datasets, our
EasyTPP has three unique contributions to the community: (i) a comprehensive
implementation of eight highly cited neural TPPs with the integration of
commonly used evaluation metrics and datasets; (ii) a standardized benchmarking
pipeline for a transparent and thorough comparison of different methods on
different datasets; (iii) a universal framework supporting multiple ML
libraries (e.g., PyTorch and TensorFlow) as well as custom implementations. Our
benchmark is open-sourced: all the data and implementation can be found at this
\href{https://github.com/ant-research/EasyTemporalPointProcess}{\textcolor{blue}{Github
repository}}\footnote{\url{https://github.com/ant-research/EasyTemporalPointProcess}.}.
We will actively maintain this benchmark and welcome contributions from other
researchers and practitioners. Our benchmark will help promote reproducible
research in this field, thus accelerating research progress as well as making
more significant real-world impacts.
- Abstract(参考訳): 継続的イベントシーケンスは、ヘルスケア、ファイナンス、オンラインショッピング、ソーシャルネットワークなど、現実世界のドメインにおいて重要な役割を果たす。
このようなデータをモデル化するために、時間点プロセス(TPP)が最も先進的な生成モデルとして登場し、学術的および応用的なコミュニティに大きな影響を与えている。
近年、多くの強力なモデルが出現しているが、それらを評価するための包括的なベンチマークはない。
この標準化の欠如は、研究者や実践者が手法の比較や結果の再現を妨げ、この分野の進歩を遅らせる可能性がある。
本稿では,TPP評価のための中央ベンチマークを確立することを目的としたEasyTPPを提案する。
データセットにも貢献した以前の作業と比較すると、easytppにはコミュニティに3つのユニークな貢献があります。
i) 一般的に用いられる評価指標とデータセットを統合した,高度に引用された8つの神経TPPの包括的実装。
二 異なるデータセット上の異なる方法の透過的かつ徹底的な比較のための標準ベンチマークパイプライン
(iii) 複数のMLライブラリ(PyTorchやTensorFlowなど)とカスタム実装をサポートする普遍的なフレームワーク。
すべてのデータと実装は、この \href{https://github.com/ant-research/EasyTemporalPointProcess}{\textcolor{blue}{Github repository}}\footnote{\url{https://github.com/ant-research/EasyTemporalPointProcess} で見ることができる。
}.
私たちはこのベンチマークを積極的に維持し、他の研究者や実践者の貢献を歓迎します。
私たちのベンチマークは、この分野における再現可能な研究を促進するのに役立つでしょう。
関連論文リスト
- DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM
Workflows [81.38065762300718]
我々は、研究者が強力な大規模言語モデルを実装することができるオープンソースのPythonライブラリであるDataDreamerを紹介した。
DataDreamerはまた、オープンサイエンスを促進するために提案するベストプラクティスに研究者が従うのを助ける。
論文 参考訳(メタデータ) (2024-02-16T00:10:26Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - Large Models for Time Series and Spatio-Temporal Data: A Survey and
Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。
大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文 参考訳(メタデータ) (2023-10-16T09:06:00Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time
Series [79.64785804590821]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Leaf Segmentation and Counting with Deep Learning: on Model Certainty,
Test-Time Augmentation, Trade-Offs [2.984934409689467]
深い教師付き学習は、セグメンテーションと数え葉でのより良いパフォーマンスモデルを提案する最近の研究で広く使われている。
研究グループによる優れた努力にもかかわらず、より良い方法を提案する主な課題の1つは、ラベル付きデータ可用性の制限である。
論文 参考訳(メタデータ) (2020-12-21T17:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。