論文の概要: Mapping the Internet: Modelling Entity Interactions in Complex
Heterogeneous Networks
- arxiv url: http://arxiv.org/abs/2104.09650v1
- Date: Mon, 19 Apr 2021 21:32:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 03:09:12.642998
- Title: Mapping the Internet: Modelling Entity Interactions in Complex
Heterogeneous Networks
- Title(参考訳): インターネットのマッピング:複雑な異種ネットワークにおけるエンティティインタラクションのモデリング
- Authors: \v{S}imon Mandl\'ik and Tom\'a\v{s} Pevn\'y
- Abstract要約: サンプル表現、モデル定義、トレーニングのための汎用性のある統一フレームワークHMill'を提案します。
フレームワークに実装されたモデルによって実現されたすべての関数の集合に対する普遍近似定理の拡張を示す。
このフレームワークを使ってサイバーセキュリティドメインから3つの異なる問題を解決する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Even though machine learning algorithms already play a significant role in
data science, many current methods pose unrealistic assumptions on input data.
The application of such methods is difficult due to incompatible data formats,
or heterogeneous, hierarchical or entirely missing data fragments in the
dataset. As a solution, we propose a versatile, unified framework called
`HMill' for sample representation, model definition and training. We review in
depth a multi-instance paradigm for machine learning that the framework builds
on and extends. To theoretically justify the design of key components of HMill,
we show an extension of the universal approximation theorem to the set of all
functions realized by models implemented in the framework. The text also
contains a detailed discussion on technicalities and performance improvements
in our implementation, which is published for download under the MIT License.
The main asset of the framework is its flexibility, which makes modelling of
diverse real-world data sources with the same tool possible. Additionally to
the standard setting in which a set of attributes is observed for each object
individually, we explain how message-passing inference in graphs that represent
whole systems of objects can be implemented in the framework. To support our
claims, we solve three different problems from the cybersecurity domain using
the framework. The first use case concerns IoT device identification from raw
network observations. In the second problem, we study how malicious binary
files can be classified using a snapshot of the operating system represented as
a directed graph. The last provided example is a task of domain blacklist
extension through modelling interactions between entities in the network. In
all three problems, the solution based on the proposed framework achieves
performance comparable to specialized approaches.
- Abstract(参考訳): 機械学習アルゴリズムはすでにデータサイエンスにおいて重要な役割を果たすが、現在の多くの手法は入力データに非現実的な仮定をもたらす。
このような手法の適用は、データセットの非互換なデータフォーマット、あるいは不均一、階層的、あるいは完全に欠落したデータフラグメントのために困難である。
そこで本研究では,サンプル表現,モデル定義,トレーニングのための汎用統一フレームワークであるHMillを提案する。
我々は、フレームワークが構築し拡張する機械学習のためのマルチインスタンスパラダイムを深くレビューする。
HMillの鍵成分の設計を理論的に正当化するために、フレームワークで実装されたモデルによって実現されたすべての関数の集合に対する普遍近似定理の拡張を示す。
このテキストには、技術と実装のパフォーマンス改善に関する詳細な議論も含まれており、mitライセンス下でダウンロードで公開されています。
フレームワークの主な資産は柔軟性である。これにより、さまざまな現実世界のデータソースを同じツールでモデリングできる。
さらに、個々のオブジェクトに対して属性の集合を個別に観察する標準的な設定に加えて、オブジェクトのシステム全体を表すグラフにおけるメッセージパッシング推論をフレームワークに実装する方法を説明します。
当社の主張を支持するため、このフレームワークを使用してサイバーセキュリティドメインから3つの異なる問題を解決する。
最初のユースケースは、生のネットワーク観測からIoTデバイスを識別するものだ。
第2の問題は,有向グラフとして表されるオペレーティングシステムのスナップショットを用いて,悪意のあるバイナリファイルの分類方法を検討することである。
最後に提供される例は、ネットワーク内のエンティティ間の相互作用をモデル化するドメインブラックリスト拡張のタスクである。
3つの問題すべてにおいて、提案されたフレームワークに基づくソリューションは、専門的なアプローチに匹敵するパフォーマンスを達成する。
関連論文リスト
- Generic Multi-modal Representation Learning for Network Traffic Analysis [6.372999570085887]
ネットワークトラフィック分析は、ネットワーク管理、トラブルシューティング、セキュリティに不可欠である。
異なるユースケースを解決できる柔軟なマルチモーダルオートエンコーダ(MAE)パイプラインを提案する。
我々は、MAEアーキテクチャは汎用的であり、複数のシナリオで有用な表現の学習に使用できると論じる。
論文 参考訳(メタデータ) (2024-05-04T12:24:29Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - Hawk: An Industrial-strength Multi-label Document Classifier [0.0]
本稿では,これらの問題の重要性を詳述し,上記の問題に対処する独自のニューラルネットワークアーキテクチャを提案する。
ハイドラネットのようなアーキテクチャは、モジュール性を改善するための粒度の制御と、重み付けされた損失駆動タスク固有のヘッドを備えるように設計されている。
実験結果から,提案手法は既存の手法よりもかなり優れていることがわかった。
論文 参考訳(メタデータ) (2023-01-15T09:52:18Z) - FV-UPatches: Enhancing Universality in Finger Vein Recognition [0.6299766708197883]
限られたデータで学習しながら一般化を実現するユニバーサルラーニングベースのフレームワークを提案する。
提案フレームワークは、他の静脈ベースの生体認証にも応用可能性を示す。
論文 参考訳(メタデータ) (2022-06-02T14:20:22Z) - Fashionformer: A simple, Effective and Unified Baseline for Human
Fashion Segmentation and Recognition [80.74495836502919]
本研究では,共同ファッションセグメンテーションと属性認識に着目した。
本稿では,セグメンテーションのためのオブジェクトクエリと属性予測のための属性クエリを紹介する。
属性ストリームのために,よりきめ細かい特徴を探索する新しいマルチレイヤレンダリングモジュールを設計する。
論文 参考訳(メタデータ) (2022-04-10T11:11:10Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - Towards a Flexible Embedding Learning Framework [15.604564543883122]
本稿では,学習表現に組み込むことができる関係性の観点から柔軟な埋め込み学習フレームワークを提案する。
サンプリング機構は、入力と出力埋め込みによって捕捉された情報との直接接続を確立するために慎重に設計される。
実験の結果,提案するフレームワークは,関連エンティティ・リレーショナル・マトリクスのセットと合わせて,様々なデータマイニングタスクにおける既存の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-09-23T08:00:56Z) - iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection [48.83883375118966]
iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。
ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2020-03-09T13:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。