論文の概要: A Deep Learning Approach for Ontology Enrichment from Unstructured Text
- arxiv url: http://arxiv.org/abs/2112.08554v1
- Date: Thu, 16 Dec 2021 01:32:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-18 07:17:29.137814
- Title: A Deep Learning Approach for Ontology Enrichment from Unstructured Text
- Title(参考訳): 非構造化テキストからのオントロジー富化のための深層学習手法
- Authors: Lalit Mohan Sanagavarapu, Vivek Iyer and Raghu Reddy
- Abstract要約: 既存のWeb上の攻撃、コントロール、アドバイザリの情報脆弱性は、セキュリティ分析を表現し、実行する機会を提供する。
自然言語処理とMLモデルに基づくオントロジーエンリッチメントアルゴリズムは、単語、フレーズ、文における概念の文脈的抽出に問題がある。
大規模なDBデータセットと2.8GBのウィキペディアコーパスとUniversal Sentenceでトレーニングされた双方向LSTMは、ISOベースの情報セキュリティを強化するためにデプロイされる。
- 参考スコア(独自算出の注目度): 2.932750332087746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Information Security in the cyber world is a major cause for concern, with a
significant increase in the number of attack surfaces. Existing information on
vulnerabilities, attacks, controls, and advisories available on the web
provides an opportunity to represent knowledge and perform security analytics
to mitigate some of the concerns. Representing security knowledge in the form
of ontology facilitates anomaly detection, threat intelligence, reasoning and
relevance attribution of attacks, and many more. This necessitates dynamic and
automated enrichment of information security ontologies. However, existing
ontology enrichment algorithms based on natural language processing and ML
models have issues with contextual extraction of concepts in words, phrases,
and sentences. This motivates the need for sequential Deep Learning
architectures that traverse through dependency paths in text and extract
embedded vulnerabilities, threats, controls, products, and other
security-related concepts and instances from learned path representations. In
the proposed approach, Bidirectional LSTMs trained on a large DBpedia dataset
and Wikipedia corpus of 2.8 GB along with Universal Sentence Encoder is
deployed to enrich ISO 27001-based information security ontology. The model is
trained and tested on a high-performance computing (HPC) environment to handle
Wiki text dimensionality. The approach yielded a test accuracy of over 80% when
tested with knocked-out concepts from ontology and web page instances to
validate the robustness.
- Abstract(参考訳): サイバー世界の情報セキュリティは、攻撃面の数を大幅に増加させ、懸念の主な原因となっている。
webで利用可能な脆弱性、攻撃、コントロール、アドバイザリに関する既存の情報は、知識を表現し、セキュリティ分析を行い、懸念を緩和する機会を提供する。
セキュリティ知識をオントロジーの形で表現することは、異常検出、脅威知性、推論とアタックの関連性、その他多くのことを促進する。
これにより、動的かつ自動的な情報セキュリティオントロジーの強化が必要となる。
しかし、自然言語処理とMLモデルに基づく既存のオントロジーエンリッチメントアルゴリズムは、単語、フレーズ、文における概念の文脈的抽出に問題がある。
これにより、テキスト内の依存関係パスを横切り、埋め込まれた脆弱性、脅威、コントロール、製品、その他のセキュリティ関連の概念やインスタンスを学習パス表現から抽出する、シーケンシャルなディープラーニングアーキテクチャの必要性が高まる。
提案手法では,大規模なDBpediaデータセットと2.8GBのウィキペディアコーパスとUniversal Sentence Encoderでトレーニングされた双方向LSTMを,ISO 27001ベースの情報セキュリティオントロジーの強化のためにデプロイする。
このモデルは、Wikiテキストの次元を扱うために、ハイパフォーマンスコンピューティング(HPC)環境で訓練され、テストされる。
このアプローチは、オントロジーとWebページインスタンスのノックアウトコンセプトでテストし、ロバスト性を検証するときに80%以上のテスト精度を得た。
関連論文リスト
- CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity [49.657358248788945]
サイバー脅威インテリジェンス(CTI)レポートのテキスト記述は、サイバー脅威に関する豊富な知識源である。
現在のCTI抽出法は柔軟性と一般化性に欠けており、しばしば不正確で不完全な知識抽出をもたらす。
CTINexusは,大規模言語モデルのテキスト内学習(ICL)を最適化した新しいフレームワークである。
論文 参考訳(メタデータ) (2024-10-28T14:18:32Z) - Dynamic Neural Control Flow Execution: An Agent-Based Deep Equilibrium Approach for Binary Vulnerability Detection [4.629503670145618]
ソフトウェア脆弱性はサイバーセキュリティの課題だ。
DeepEXEはエージェントベースの暗黙のニューラルネットワークで、プログラムの実行パスを模倣する。
DeepEXEは正確かつ効率的な手法であり、最先端の脆弱性検出方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-03T22:07:50Z) - HW-V2W-Map: Hardware Vulnerability to Weakness Mapping Framework for
Root Cause Analysis with GPT-assisted Mitigation Suggestion [3.847218857469107]
HW-V2W-Map Frameworkは、ハードウェア脆弱性とIoT(Internet of Things)セキュリティに焦点を当てた機械学習(ML)フレームワークである。
私たちが提案したアーキテクチャには,オントロジーを更新するプロセスを自動化する,オントロジー駆動のストーリテリングフレームワークが組み込まれています。
提案手法は,GPT (Generative Pre-trained Transformer) Large Language Models (LLMs) を用いて緩和提案を行った。
論文 参考訳(メタデータ) (2023-12-21T02:14:41Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - DCDetector: An IoT terminal vulnerability mining system based on
distributed deep ensemble learning under source code representation [2.561778620560749]
この研究の目的は、C/C++のような高レベルの言語のソースコードの脆弱性をインテリジェントに検出することである。
これにより、ソースコードのセンシティブな文関連スライスをコード表現し、分散深層学習モデルの設計により脆弱性を検出することができる。
実験により,従来の静的解析の偽陽性率を低減し,機械学習の性能と精度を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-11-29T14:19:14Z) - Towards Automated Classification of Attackers' TTPs by combining NLP
with ML Techniques [77.34726150561087]
我々は,NLP(Natural Language Processing)と,研究におけるセキュリティ情報抽出に使用される機械学習技術の評価と比較を行った。
本研究では,攻撃者の戦術や手法に従って非構造化テキストを自動的に分類するデータ処理パイプラインを提案する。
論文 参考訳(メタデータ) (2022-07-18T09:59:21Z) - Multi-features based Semantic Augmentation Networks for Named Entity
Recognition in Threat Intelligence [7.321994923276344]
本稿では,入力トークンの表現を豊かにするために,異なる言語的特徴を取り入れた意味拡張手法を提案する。
特に,各入力トークンの構成特徴,形態的特徴,音声特徴の一部を符号化して集約し,その堅牢性を向上させる。
サイバーセキュリティデータセットDNRTIとMalwareTextDBについて実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-07-01T06:55:12Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - OntoEnricher: A Deep Learning Approach for Ontology Enrichment from
Unstructured Text [2.707154152696381]
Web上で利用可能な脆弱性、コントロール、アドバイザリに関する既存の情報は、知識を表現し、関心事の一部を緩和するために分析を行う機会を提供する。
これは情報セキュリティの動的かつ自動化された強化を必要とする。
自然言語処理とMLモデルに基づく既存のオントロジーエンリッチメントアルゴリズムは、単語、フレーズ、文における概念の文脈的抽出に問題がある。
論文 参考訳(メタデータ) (2021-02-08T09:43:05Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。