論文の概要: NEMA: Automatic Integration of Large Network Management Databases
- arxiv url: http://arxiv.org/abs/2006.01294v1
- Date: Mon, 1 Jun 2020 22:21:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:24:29.444597
- Title: NEMA: Automatic Integration of Large Network Management Databases
- Title(参考訳): NEMA:大規模ネットワーク管理データベースの自動統合
- Authors: Fubao Wu, Han Hee Song, Jiangtao Yin, Lixin Gao, Mario Baldi, Narendra
Anand
- Abstract要約: 本研究では,大規模なNEMA(Network MAnagement Database)のためのマッチング手法を開発し,効率的なデータ統合と接続のためのインスタンスレベルのマッチングをデプロイする。
1,458のフィールドを持つ大規模データベースを計測した結果,NEMAのアキュラシーは最大2%-10%高い値を示した。
- 参考スコア(独自算出の注目度): 2.729259935203344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Network management, whether for malfunction analysis, failure prediction,
performance monitoring and improvement, generally involves large amounts of
data from different sources. To effectively integrate and manage these sources,
automatically finding semantic matches among their schemas or ontologies is
crucial. Existing approaches on database matching mainly fall into two
categories. One focuses on the schema-level matching based on schema properties
such as field names, data types, constraints and schema structures. Network
management databases contain massive tables (e.g., network products, incidents,
security alert and logs) from different departments and groups with nonuniform
field names and schema characteristics. It is not reliable to match them by
those schema properties. The other category is based on the instance-level
matching using general string similarity techniques, which are not applicable
for the matching of large network management databases. In this paper, we
develop a matching technique for large NEtwork MAnagement databases (NEMA)
deploying instance-level matching for effective data integration and
connection. We design matching metrics and scores for both numerical and
non-numerical fields and propose algorithms for matching these fields. The
effectiveness and efficiency of NEMA are evaluated by conducting experiments
based on ground truth field pairs in large network management databases. Our
measurement on large databases with 1,458 fields, each of which contains over
10 million records, reveals that the accuracies of NEMA are up to 95%. It
achieves 2%-10% higher accuracy and 5x-14x speedup over baseline methods.
- Abstract(参考訳): ネットワーク管理は、故障分析、障害予測、パフォーマンス監視、改善のいずれにおいても、一般的に異なるソースからの大量のデータを必要とする。
これらのソースを効果的に統合し管理するには、スキーマやオントロジー間のセマンティックマッチを自動的に見つけることが重要です。
既存のデータベースマッチングのアプローチは主に2つのカテゴリに分類される。
ひとつは、フィールド名、データ型、制約、スキーマ構造などのスキーマプロパティに基づいたスキーマレベルのマッチングに焦点を当てている。
ネットワーク管理データベースには、異なる部門やグループから大量のテーブル(例えば、ネットワーク製品、インシデント、セキュリティアラート、ログ)が含まれており、不均一なフィールド名やスキーマ特性を持っている。
これらのスキーマプロパティと一致させることは信頼できない。
他のカテゴリは、大規模ネットワーク管理データベースのマッチングには適用できない汎用文字列類似技術を用いたインスタンスレベルのマッチングに基づいている。
本稿では,大規模なNEMA(Network MAnagement Database)のインスタンスレベルマッチングを効果的に利用するためのマッチング手法を開発した。
我々は数値場と非数値場の両方のマッチングメトリックとスコアを設計し、これらのフィールドをマッチングするためのアルゴリズムを提案する。
大規模ネットワーク管理データベースにおいて,地上真理フィールドペアを用いた実験を行い,nemaの有効性と効率を評価した。
1,458のフィールドを持つ大規模データベースにおける測定結果から,nemaの精度は最大95%であることがわかった。
2%-10%の精度と5x-14xの高速化を実現している。
関連論文リスト
- ReMatch: Retrieval Enhanced Schema Matching with LLMs [0.874967598360817]
本稿では,検索強化大言語モデル(LLM)を用いたスキーママッチングのためのReMatchという新しい手法を提案する。
大規模な実世界のスキーマに対する実験結果から,ReMatchが効果的なマーカであることが示された。
論文 参考訳(メタデータ) (2024-03-03T17:14:40Z) - Selecting Walk Schemes for Database Embedding [6.7609045625714925]
関係データベースのコンポーネントの埋め込みについて検討する。
我々は、動的データベース用に設計された最近のFoRWaRDアルゴリズムに焦点を当てる。
いくつかの情報的ウォークスキームに焦点をあてることで,品質を維持しつつ,埋め込みをはるかに高速に行うことができることを示す。
論文 参考訳(メタデータ) (2024-01-20T11:39:32Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - Bandit Sampling for Multiplex Networks [8.771092194928674]
多数のレイヤを持つ多重ネットワーク上でのスケーラブルな学習アルゴリズムを提案する。
オンライン学習アルゴリズムは、トレーニング中に関連する情報を持つレイヤのみを集約するように、関連する隣のレイヤをサンプリングする方法を学ぶ。
合成シナリオと実世界のシナリオの両方に関する実験結果を示す。
論文 参考訳(メタデータ) (2022-02-08T03:26:34Z) - Unsupervised Domain-adaptive Hash for Networks [81.49184987430333]
ドメイン適応型ハッシュ学習はコンピュータビジョンコミュニティでかなりの成功を収めた。
UDAHと呼ばれるネットワークのための教師なしドメイン適応型ハッシュ学習手法を開発した。
論文 参考訳(メタデータ) (2021-08-20T12:09:38Z) - Multi-Source Domain Adaptation for Object Detection [52.87890831055648]
我々は、Divide-and-Merge Spindle Network (DMSN)と呼ばれる、より高速なR-CNNベースのフレームワークを提案する。
DMSNはドメイン非ネイティブを同時に強化し、識別力を維持することができる。
擬似目標部分集合の最適パラメータを近似する新しい擬似学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-30T03:17:20Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - LEAPME: Learning-based Property Matching with Embeddings [5.2078071454435815]
LEAPME(LEArning-based Property Matching with Embeddings)と呼ばれる機械学習による新しいプロパティマッチング手法を提案する。
このアプローチでは、プロパティ名とインスタンス値の両方のドメイン固有のセマンティクスをよりよく活用するために、ワード埋め込みを多用している。
実世界データを用いた複数のマルチソースデータセットに対する5つのベースラインの比較評価により,LEAPMEの有効性が示唆された。
論文 参考訳(メタデータ) (2020-10-05T12:42:39Z) - Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog [70.79442700890843]
本稿では,対象ドメインと各ドメインの関連性を自動的に活用する新しい動的核融合ネットワーク(DF-Net)を提案する。
トレーニングデータが少ないと、平均13.9%の事前最良モデルを上回り、転送可能性を示す。
論文 参考訳(メタデータ) (2020-04-23T08:17:22Z) - iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection [48.83883375118966]
iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。
ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2020-03-09T13:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。