論文の概要: DataZoo: Streamlining Traffic Classification Experiments
- arxiv url: http://arxiv.org/abs/2310.19568v1
- Date: Mon, 30 Oct 2023 14:24:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 19:54:54.950856
- Title: DataZoo: Streamlining Traffic Classification Experiments
- Title(参考訳): DataZoo: トラフィック分類実験の合理化
- Authors: Jan Luxemburk, Karel Hynek
- Abstract要約: 本稿では,ネットワークトラフィック分類におけるデータセット管理の効率化を目的としたツールセットであるDataZooを紹介する。
DataZooは、CESNET-QUIC22、CESNET-TLS22、CESNET-TLS22という3つの広範なデータセットにアクセスするための標準化されたAPIを提供する。
DataZooツールセットは、現実的な評価シナリオの作成を簡単にし、分類方法のクロスコンペア化と結果の再現を容易にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The machine learning communities, such as those around computer vision or
natural language processing, have developed numerous supportive tools and
benchmark datasets to accelerate the development. In contrast, the network
traffic classification field lacks standard benchmark datasets for most tasks,
and the available supportive software is rather limited in scope. This paper
aims to address the gap and introduces DataZoo, a toolset designed to
streamline dataset management in network traffic classification and to reduce
the space for potential mistakes in the evaluation setup. DataZoo provides a
standardized API for accessing three extensive datasets -- CESNET-QUIC22,
CESNET-TLS22, and CESNET-TLS-Year22. Moreover, it includes methods for feature
scaling and realistic dataset partitioning, taking into consideration temporal
and service-related factors. The DataZoo toolset simplifies the creation of
realistic evaluation scenarios, making it easier to cross-compare
classification methods and reproduce results.
- Abstract(参考訳): コンピュータビジョンや自然言語処理などの機械学習コミュニティは、開発を加速するために多数の支援ツールとベンチマークデータセットを開発してきた。
対照的に、ネットワークトラフィック分類分野は、ほとんどのタスクの標準ベンチマークデータセットが欠落しており、利用可能なサポートソフトウェアはスコープが限られている。
本稿では,このギャップに対処し,ネットワークトラフィック分類におけるデータセット管理の合理化と,評価設定における潜在的なミスの空間削減を目的としたツールセットであるDataZooを紹介する。
DataZooは、CESNET-QUIC22、CESNET-TLS22、CESNET-TLS-Year22という3つの広範なデータセットにアクセスするための標準化されたAPIを提供する。
さらに、時間的およびサービス関連要因を考慮して、機能スケーリングと現実的なデータセットパーティショニングの方法も含まれている。
DataZooツールセットは、現実的な評価シナリオの作成を簡単にし、分類方法のクロスコンペア化と結果の再現を容易にする。
関連論文リスト
- Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning [3.623224034411137]
オフラインマルチエージェント強化学習(英語: offline multi-agent reinforcement learning, MARL)は、静的データセットを用いてマルチエージェントシステムの最適制御ポリシーを見つける研究のエキサイティングな方向である。
この分野は定義上はデータ駆動型だが、これまでのところ、最先端の結果を達成するための努力は、データを無視してきた。
研究の大部分は、一貫した方法論を使わずに独自のデータセットを生成し、これらのデータセットの特徴に関するまばらな情報を提供する。
論文 参考訳(メタデータ) (2024-09-18T14:13:24Z) - NetBench: A Large-Scale and Comprehensive Network Traffic Benchmark Dataset for Foundation Models [15.452625276982987]
ネットワークトラフィック(ネットワークトラフィック、英: network traffic)は、インターネット上のコンピュータやサイバー物理システム間のパケットの形で送信されるデータ量である。
我々は,ネットワークトラフィック分類と生成タスクの両方において,機械学習モデル,特に基礎モデルを評価するための大規模かつ包括的なベンチマークデータセットであるNetBenchを紹介した。
論文 参考訳(メタデータ) (2024-03-15T14:09:54Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - AI applications in forest monitoring need remote sensing benchmark
datasets [0.0]
森林モニタリングのための厳密で有用なベンチマークデータセットを作成するための要件と考察について述べる。
ベンチマークに貢献できる大規模なデータセットの例をリストアップし、コミュニティ主導の代表的なベンチマークイニシアチブがこの分野にどのような恩恵をもたらすかを示す。
論文 参考訳(メタデータ) (2022-12-20T01:11:40Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Pushing the Limits of Simple Pipelines for Few-Shot Learning: External
Data and Fine-Tuning Make a Difference [74.80730361332711]
コンピュータビジョンにおいて、ほとんどショット学習は重要かつトピック的な問題である。
単純なトランスフォーマーベースのパイプラインは、標準ベンチマークで驚くほど優れたパフォーマンスが得られることを示す。
論文 参考訳(メタデータ) (2022-04-15T02:55:58Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Deep Learning based Pedestrian Inertial Navigation: Methods, Dataset and
On-Device Inference [49.88536971774444]
慣性測定ユニット(IMU)は小型で安価でエネルギー効率が良く、スマートデバイスや移動ロボットに広く使われている。
正確で信頼性の高い歩行者ナビゲーションをサポートするために慣性データをエクスプロイトすることは、新しいインターネット・オブ・シングス・アプリケーションやサービスにとって重要なコンポーネントである。
我々は、深層学習に基づく慣性ナビゲーション研究のための最初の公開データセットであるOxIOD(OxIOD)を提示、リリースする。
論文 参考訳(メタデータ) (2020-01-13T04:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。