論文の概要: Descriptor: Multi-Regional Cloud Honeypot Dataset (MURHCAD)
- arxiv url: http://arxiv.org/abs/2601.05813v1
- Date: Fri, 09 Jan 2026 14:39:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.986172
- Title: Descriptor: Multi-Regional Cloud Honeypot Dataset (MURHCAD)
- Title(参考訳): ディスクリプタ:MURHCAD(Multi-Regional Cloud Honeypot Dataset)
- Authors: Enrique Feito-Casares, Ismael Gómez-Talal, José-Luis Rojo-Álvarez,
- Abstract要約: このデータ記事では、グローバルなサイバー攻撃行動のスタンドアロン分析をサポートするために設計された、包括的で高解像度なハニーネットデータセットを紹介します。
データセットは、地理的に分散した4つの仮想マシンにデプロイされた3つのハニーポット(Cowrie、Dionaea、SentryPeer)によってキャプチャされた132,425の個別攻撃イベントで構成されている。
我々は、このデータセットを異常検出、プロトコルミス研究、脅威インテリジェンス、防衛政策設計で活用しようとする研究者に対して、実用的なガイダンスを提供する。
- 参考スコア(独自算出の注目度): 3.382760600548384
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This data article introduces a comprehensive, high-resolution honeynet dataset designed to support standalone analyses of global cyberattack behaviors. Collected over a continuous 72-hour window (June 9 to 11, 2025) on Microsoft Azure, the dataset comprises 132,425 individual attack events captured by three honeypots (Cowrie, Dionaea, and SentryPeer) deployed across four geographically dispersed virtual machines. Each event record includes enriched metadata (UTC timestamps, source/destination IPs, autonomous system and organizational mappings, geolocation coordinates, targeted ports, and honeypot identifiers alongside derived temporal features and standardized protocol classifications). We provide actionable guidance for researchers seeking to leverage this dataset in anomaly detection, protocol-misuse studies, threat intelligence, and defensive policy design. Descriptive statistics highlight significant skew: 2,438 unique source IPs span 95 countries, yet the top 1% of IPs account for 1% of all events, and three protocols dominate: Session Initiation Protocol (SIP), Telnet, Server Message Block (SMB). Temporal analysis uncovers pronounced rush-hour peaks at 07:00 and 23:00 UTC, interspersed with maintenance-induced gaps that reveal operational blind spots. Geospatial mapping further underscores platform-specific biases: SentryPeer captures concentrated SIP floods in North America and Southeast Asia, Cowrie logs Telnet/SSH scans predominantly from Western Europe and the U.S., and Dionaea records SMB exploits around European nodes. By combining fine-grained temporal resolution with rich, contextual geolocation and protocol metadata, this standalone dataset aims to empower reproducible, cloud-scale investigations into evolving cyber threats. Accompanying analysis code and data access details are provided.
- Abstract(参考訳): このデータ記事では、グローバルなサイバー攻撃行動のスタンドアロン分析をサポートするために設計された、包括的で高解像度なハニーネットデータセットを紹介します。
Microsoft Azure上の72時間の連続ウィンドウ(2025年6月9日から11日)で収集されたデータセットは、地理的に分散された4つの仮想マシンにデプロイされた3つのハニーポット(Cowrie、Dionaea、SentryPeer)によってキャプチャされた132,425の個別攻撃イベントで構成されている。
イベントレコードには、豊富なメタデータ(UTCタイムスタンプ、ソース/デスティネーションIP、自律システムと組織マッピング、ロケーション座標、ターゲットポート、ハニーポット識別子、派生した時間的特徴と標準化されたプロトコル分類)が含まれている。
我々は、このデータセットを異常検出、プロトコルミス研究、脅威インテリジェンス、防衛政策設計で活用しようとする研究者に対して、実用的なガイダンスを提供する。
2.438のユニークなソースIPは95カ国にまたがるが、トップ1%のIPがすべてのイベントの1%を占め、セッション開始プロトコル(SIP)、テルネット、サーバメッセージブロック(SMB)の3つのプロトコルが支配的である。
時間分析により、ラッシュ時のピークは7時と23時であり、運用中の盲点を示すメンテナンスによって引き起こされるギャップが分散している。
SentryPeerは北アメリカと東南アジアの集中したSIP洪水を捉え、CowrieはTelnet/SSHスキャンを主に西ヨーロッパと米国から記録し、Dionaeaは欧州のノード周辺のSMBエクスプロイトを記録している。
このスタンドアロンデータセットは、微細な時間分解能とリッチでコンテキスト的な位置情報とプロトコルメタデータを組み合わせることで、再現可能なクラウドスケールの調査を、サイバー脅威の進化に活用することを目指している。
解析コードとデータアクセスの詳細を提供する。
関連論文リスト
- The NetMob25 Dataset: A High-resolution Multi-layered View of Individual Mobility in Greater Paris Region [64.30214722988666]
本稿では,提案したデータセットのサーベイ設計,収集プロトコル,処理手法,特徴について述べる。
データセットには、人口統計、社会経済、家庭の特徴を記述した個人データベース(i)、タイムスタンプ、輸送モード、旅行目的を含む8,000以上の注釈付き変位を持つトリプスデータベース(ii)、約5億の高周波ポイントからなるRaw GPSトレースデータベース(iii)の3つのコンポーネントが含まれている。
論文 参考訳(メタデータ) (2025-06-06T09:22:21Z) - EPSpatial: Achieving Efficient and Private Statistical Analytics of Geospatial Data [27.954601303169007]
地理空間データ統計は、地理空間内のクライアントの分布を導出する位置データの集約と分析を含む。
地理空間データ分析におけるプライバシー保護の必要性は、クライアント位置情報の不正使用や不正アクセスに関する懸念から、最重要視されている。
地理空間データの正確・効率的・プライベートな統計分析手法である$mathtEPSpatial$を提案する。
論文 参考訳(メタデータ) (2025-05-19T01:51:30Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - Making Privacy-preserving Federated Graph Analytics with Strong Guarantees Practical (for Certain Queries) [0.5203254931216454]
本稿では、ネットワーク転送において、数分の時間とわずかなMIBを必要とするプライバシー保護グラフ分析システムについて、低コストで提案する。
Coloの実装と評価により、人口100万のデバイス上でさまざまなCOVID-19クエリを実行するには、デバイスのCPU時間8.4分未満、ネットワーク転送では4.93 MiBsが必要であることが示されている。
論文 参考訳(メタデータ) (2024-04-02T04:01:31Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - A scalable pipeline for COVID-19: the case study of Germany, Czechia and
Poland [7.753854979677439]
複数のデータソースからデータセットを統合するために,運用データストア(ODS)を構築した。
ODSは、ドイツ、チェコ、ポーランドの新型コロナウイルス(COVID-19)データを保管するだけでなく、他の地域も保存するために構築されている。
データは、バージョン管理されたArimaHoltモデルとその他の分析を使用して予測をサポートし、意思決定をサポートするだけでなく、リスク電卓やアプリもサポートする。
論文 参考訳(メタデータ) (2022-08-27T05:14:01Z) - Detection, Tracking, and Counting Meets Drones in Crowds: A Benchmark [97.07865343576361]
DroneCrowdという新しいドローンキャプチャ型大規模データセットによるベンチマークを構築した。
私たちは4800万人の頭といくつかのビデオレベルの属性を持つ20,800人のトラジェクタに注釈を付けます。
我々は、密集した群衆の物体の検出、追跡、数え上げを行うための強力なベースラインとして、Space-Time Neighbor-Aware Network (STNNet)を設計する。
論文 参考訳(メタデータ) (2021-05-06T04:46:14Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。