論文の概要: Contrastive Learning and Correlation Clustering for Sequences of Network Telescope Data
- arxiv url: http://arxiv.org/abs/2606.04733v1
- Date: Wed, 03 Jun 2026 11:15:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.699748
- Title: Contrastive Learning and Correlation Clustering for Sequences of Network Telescope Data
- Title(参考訳): ネットワーク望遠鏡データの系列に対するコントラスト学習と相関クラスタリング
- Authors: Jannik Presberger, Alexander Männel, Maynard Koch, Thomas C. Schmidt, Matthias Wählisch, Bjoern Andres,
- Abstract要約: 本研究は、事前学習やアノテーションなしで、比較学習によって意味論的に意味のあるペアワイズ関係を推定できるかどうかを考察する。
本稿では,ネットワークフローレコードの最小処理列を組込み,コントラスト学習を用いて学習するトランスフォーマーモデルを提案する。
学習された類似性は、異なるソースから派生したシーケンスよりも、同じソースから派生したシーケンスの平均よりも高く、この性質は目に見えないソースのシーケンスに一般化する。
- 参考スコア(独自算出の注目度): 42.40186787583839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding activities of Internet scanners is challenging; it often requires identifying relationships between sources, a task for which semantic annotations are scarce. This work investigates whether semantically meaningful pairwise relationships between sequences of network flow records can be estimated by contrastive learning, without pretraining and without annotations. To this end, we propose a transformer model that embeds minimally preprocessed sequences of network flow records and train it using contrastive learning. With the similarities obtained from this model, we state a correlation clustering problem and solve it locally. Experimentally, we show: Learned similarities are higher on average for sequences originating from the same source than for sequences originating from different sources, and this property generalizes to unseen sequences of unseen sources. Moreover, correlation clustering yields clusters consistent with scanner labels. The complete source code of the algorithms and for reproducing the experiments is publicly available.
- Abstract(参考訳): インターネットスキャナーの活動を理解することは困難であり、しばしば、セマンティックアノテーションが不足しているタスクであるソース間の関係を特定する必要がある。
本研究は,事前学習やアノテーションなしで,コントラスト学習によって,ネットワークフローレコードのシーケンス間の意味的に意味のあるペアワイズ関係を推定できるかどうかを考察する。
そこで本研究では,ネットワークフローレコードの最小処理列を組込み,コントラスト学習を用いて学習するトランスフォーマーモデルを提案する。
このモデルから得られた類似性により、相関クラスタリング問題を記述し、局所的に解決する。
実験により、学習された類似性は、異なるソースから派生したシーケンスよりも、同じソースから派生したシーケンスに対して平均的に高い値を示し、この性質は目に見えないソースのシーケンスに一般化する。
さらに、相関クラスタリングは、スキャナラベルと一貫性のあるクラスタを生成する。
アルゴリズムの完全なソースコードと実験の再現が公開されている。
関連論文リスト
- Spuriousness-Aware Meta-Learning for Learning Robust Classifiers [26.544938760265136]
Spurious correlations is brittle associations between certain attribute of inputs and target variables。
深部画像分類器はしばしばそれらを予測に利用し、相関が持たないデータの一般化が不十分になる。
スプリアス相関の影響を緩和することはロバストなモデル一般化に不可欠であるが、しばしばデータ内のスプリアス相関のアノテーションを必要とする。
論文 参考訳(メタデータ) (2024-06-15T21:41:25Z) - Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。
階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文 参考訳(メタデータ) (2023-05-11T10:30:35Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Decomposing neural networks as mappings of correlation functions [57.52754806616669]
本研究では,ディープフィードフォワードネットワークによって実装された確率分布のマッピングについて検討する。
ニューラルネットワークで使用できる異なる情報表現と同様に、データに不可欠な統計を識別する。
論文 参考訳(メタデータ) (2022-02-10T09:30:31Z) - Mutual Information Scaling for Tensor Network Machine Learning [0.0]
本稿では,テンソルネットワーク機械学習における相関解析の適用方法を示す。
古典的データが量子状態に類似した相関スケーリングパターンを持つかどうかを考察する。
我々は,MNISTデータセットとTiny Imagesデータセットのスケーリングパターンを特徴付け,後者における境界法スケーリングの明確な証拠を見出す。
論文 参考訳(メタデータ) (2021-02-27T02:17:51Z) - Deep Archimedean Copulas [98.96141706464425]
ACNetは、構造的特性を強制する、新しい差別化可能なニューラルネットワークアーキテクチャである。
我々は、ACNetが共通のアルキメデスコピュラスを近似し、データに適合する可能性のある新しいコプラを生成することができることを示した。
論文 参考訳(メタデータ) (2020-12-05T22:58:37Z) - Network Classifiers Based on Social Learning [71.86764107527812]
空間と時間に対して独立に訓練された分類器を結合する新しい手法を提案する。
提案したアーキテクチャは、ラベルのないデータで時間とともに予測性能を改善することができる。
この戦略は高い確率で一貫した学習をもたらすことが示され、未訓練の分類器に対して頑健な構造が得られる。
論文 参考訳(メタデータ) (2020-10-23T11:18:20Z) - Exploiting non-i.i.d. data towards more robust machine learning
algorithms [0.0]
機械学習アルゴリズムは、データからパターンや相関を見つけるのに優れていることがますます示されている。
本稿では,普遍因果関係を優先する正規化方式を提案する。
従来のl-正規化に対して、分配外試験セットでより良い性能が得られる。
論文 参考訳(メタデータ) (2020-10-07T14:15:37Z) - Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2020-09-26T20:36:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。