論文の概要: Multi-features based Semantic Augmentation Networks for Named Entity
Recognition in Threat Intelligence
- arxiv url: http://arxiv.org/abs/2207.00232v1
- Date: Fri, 1 Jul 2022 06:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 13:42:58.277633
- Title: Multi-features based Semantic Augmentation Networks for Named Entity
Recognition in Threat Intelligence
- Title(参考訳): 脅威知能における名前付きエンティティ認識のための多機能セマンティック拡張ネットワーク
- Authors: Peipei Liu, Hong Li, Zuoguang Wang, Jie Liu, Yimo Ren, Hongsong Zhu
- Abstract要約: 本稿では,入力トークンの表現を豊かにするために,異なる言語的特徴を取り入れた意味拡張手法を提案する。
特に,各入力トークンの構成特徴,形態的特徴,音声特徴の一部を符号化して集約し,その堅牢性を向上させる。
サイバーセキュリティデータセットDNRTIとMalwareTextDBについて実験を行い,提案手法の有効性を実証した。
- 参考スコア(独自算出の注目度): 7.321994923276344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting cybersecurity entities such as attackers and vulnerabilities from
unstructured network texts is an important part of security analysis. However,
the sparsity of intelligence data resulted from the higher frequency variations
and the randomness of cybersecurity entity names makes it difficult for current
methods to perform well in extracting security-related concepts and entities.
To this end, we propose a semantic augmentation method which incorporates
different linguistic features to enrich the representation of input tokens to
detect and classify the cybersecurity names over unstructured text. In
particular, we encode and aggregate the constituent feature, morphological
feature and part of speech feature for each input token to improve the
robustness of the method. More than that, a token gets augmented semantic
information from its most similar K words in cybersecurity domain corpus where
an attentive module is leveraged to weigh differences of the words, and from
contextual clues based on a large-scale general field corpus. We have conducted
experiments on the cybersecurity datasets DNRTI and MalwareTextDB, and the
results demonstrate the effectiveness of the proposed method.
- Abstract(参考訳): 非構造化ネットワークテキストから攻撃者や脆弱性などのサイバーセキュリティエンティティを抽出することは、セキュリティ分析の重要な部分である。
しかし、高い頻度の変動とサイバーセキュリティエンティティ名のランダム性に起因するインテリジェンスデータのスパーシティは、セキュリティ関連の概念やエンティティの抽出において、現在の方法がうまく機能することを困難にしている。
そこで本研究では,異なる言語的特徴を取り入れ,入力トークンの表現を充実させ,非構造化テキスト上でサイバーセキュリティ名の検出と分類を行う意味的拡張手法を提案する。
特に,各入力トークンの構成特徴,形態的特徴,音声特徴の一部を符号化して集約し,その堅牢性を向上させる。
さらに、トークンはサイバーセキュリティドメインのコーパスにおいて最もよく似たKワードから付加的なセマンティック情報を取得し、そこでは注意モジュールを使用して単語の違いを計測し、大規模な汎用フィールドコーパスに基づくコンテキスト的手がかりから取得する。
サイバーセキュリティデータセットDNRTIとMalwareTextDBについて実験を行い,提案手法の有効性を実証した。
関連論文リスト
- CTINEXUS: Leveraging Optimized LLM In-Context Learning for Constructing Cybersecurity Knowledge Graphs Under Data Scarcity [49.657358248788945]
サイバー脅威インテリジェンス(CTI)レポートのテキスト記述は、サイバー脅威に関する豊富な知識源である。
現在のCTI抽出法は柔軟性と一般化性に欠けており、しばしば不正確で不完全な知識抽出をもたらす。
CTINexusは,大規模言語モデルのテキスト内学習(ICL)を最適化した新しいフレームワークである。
論文 参考訳(メタデータ) (2024-10-28T14:18:32Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - LSTM Recurrent Neural Networks for Cybersecurity Named Entity Recognition [1.411911111800469]
本論文で実証されたモデルはドメイン独立であり,サイバーセキュリティ領域のエンティティに特有の機能に依存しない。
得られた結果から, 本手法は, 注釈付きコーパスが適度な大きさであることから, 技工法の現状よりも優れていた。
論文 参考訳(メタデータ) (2024-08-30T08:35:48Z) - Undecimated Wavelet Transform for Word Embedded Semantic Marginal
Autoencoder in Security improvement and Denoising different Languages [0.0]
本研究は、セキュリティ対策の改善と複数の言語を認知するための新しい戦略を提供する。
未知のウェーブレット変換は、顕著な言語パターンを特定するための特徴抽出ツールとして使用される。
提案システムでは,データ内の時間的・地理的なリンクを保存しながら,重要な情報を捕捉することができる。
論文 参考訳(メタデータ) (2023-07-06T04:10:40Z) - Blockchain-aided Secure Semantic Communication for AI-Generated Content
in Metaverse [59.04428659123127]
仮想交通ネットワークにおけるAIGCサービスのためのブロックチェーン支援セマンティックコミュニケーションフレームワークを提案する。
学習に基づくセマンティック・アタック・スキームを用いて,種々の損失関数を用いて,敵対的セマンティック・データを生成する。
また、ブロックチェーンとゼロ知識証明を用いて、敵対的セマンティックデータのセマンティック類似性の違いを識別するセマンティックディフェンススキームを設計する。
論文 参考訳(メタデータ) (2023-01-25T02:32:02Z) - Neuro-Symbolic Artificial Intelligence (AI) for Intent based Semantic
Communication [85.06664206117088]
6Gネットワークはデータ転送のセマンティクスと有効性(エンドユーザ)を考慮する必要がある。
観測データの背後にある因果構造を学習するための柱としてNeSy AIが提案されている。
GFlowNetは、無線システムにおいて初めて活用され、データを生成する確率構造を学ぶ。
論文 参考訳(メタデータ) (2022-05-22T07:11:57Z) - A Deep Learning Approach for Ontology Enrichment from Unstructured Text [2.932750332087746]
既存のWeb上の攻撃、コントロール、アドバイザリの情報脆弱性は、セキュリティ分析を表現し、実行する機会を提供する。
自然言語処理とMLモデルに基づくオントロジーエンリッチメントアルゴリズムは、単語、フレーズ、文における概念の文脈的抽出に問題がある。
大規模なDBデータセットと2.8GBのウィキペディアコーパスとUniversal Sentenceでトレーニングされた双方向LSTMは、ISOベースの情報セキュリティを強化するためにデプロイされる。
論文 参考訳(メタデータ) (2021-12-16T01:32:21Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - OntoEnricher: A Deep Learning Approach for Ontology Enrichment from
Unstructured Text [2.707154152696381]
Web上で利用可能な脆弱性、コントロール、アドバイザリに関する既存の情報は、知識を表現し、関心事の一部を緩和するために分析を行う機会を提供する。
これは情報セキュリティの動的かつ自動化された強化を必要とする。
自然言語処理とMLモデルに基づく既存のオントロジーエンリッチメントアルゴリズムは、単語、フレーズ、文における概念の文脈的抽出に問題がある。
論文 参考訳(メタデータ) (2021-02-08T09:43:05Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Deep Learning Approach for Intelligent Named Entity Recognition of Cyber
Security [5.180648702293017]
名前付きエンティティ認識(NER)は、構造化されていないデータを構造化データに変換するための最初のステップである。
本稿では,条件付きランダムフィールド(CRF)を組み込んだディープラーニング(DL)に基づくアプローチを提案する。
Bidirectional Gated Recurrent Unit(Bi-GRU)、Convolutional Neural Network(CNN)、CRFの組み合わせは、公開されているベンチマークデータセット上の他のDLフレームワークと比較してパフォーマンスが良くなった。
論文 参考訳(メタデータ) (2020-03-31T00:36:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。