論文の概要: LSTM Recurrent Neural Networks for Cybersecurity Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2409.10521v1
- Date: Fri, 30 Aug 2024 08:35:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-22 21:32:16.756723
- Title: LSTM Recurrent Neural Networks for Cybersecurity Named Entity Recognition
- Title(参考訳): エンティティ認識というサイバーセキュリティのためのLSTMリカレントニューラルネットワーク
- Authors: Houssem Gasmi, Jannik Laval, Abdelaziz Bouras,
- Abstract要約: 本論文で実証されたモデルはドメイン独立であり,サイバーセキュリティ領域のエンティティに特有の機能に依存しない。
得られた結果から, 本手法は, 注釈付きコーパスが適度な大きさであることから, 技工法の現状よりも優れていた。
- 参考スコア(独自算出の注目度): 1.411911111800469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated and timely conversion of cybersecurity information from unstructured online sources, such as blogs and articles to more formal representations has become a necessity for many applications in the domain nowadays. Named Entity Recognition (NER) is one of the early phases towards this goal. It involves the detection of the relevant domain entities, such as product, version, attack name, etc. in technical documents. Although generally considered a simple task in the information extraction field, it is quite challenging in some domains like cybersecurity because of the complex structure of its entities. The state of the art methods require time-consuming and labor intensive feature engineering that describes the properties of the entities, their context, domain knowledge, and linguistic characteristics. The model demonstrated in this paper is domain independent and does not rely on any features specific to the entities in the cybersecurity domain, hence does not require expert knowledge to perform feature engineering. The method used relies on a type of recurrent neural networks called Long Short-Term Memory (LSTM) and the Conditional Random Fields (CRFs) method. The results we obtained showed that this method outperforms the state of the art methods given an annotated corpus of a decent size.
- Abstract(参考訳): ブログや記事などの構造化されていないオンラインソースから、よりフォーマルな表現への自動的かつタイムリーなサイバーセキュリティ情報の変換は、近年、ドメイン内の多くのアプリケーションにとって必要となっている。
名前付きエンティティ認識(NER)は、この目標に向けた初期段階の1つです。
これは、技術文書で製品、バージョン、アタック名など、関連するドメインエンティティを検出することを含む。
一般的には情報抽出分野における単純なタスクと考えられているが、そのエンティティの複雑な構造のため、サイバーセキュリティのようないくつかの領域では、かなり難しい。
最先端の手法は、エンティティの特性、そのコンテキスト、ドメイン知識、言語特性を記述する、時間と労働集約的な特徴工学を必要とする。
本論文で実証されたモデルはドメイン独立であり,サイバーセキュリティ領域のエンティティに特有の機能に依存しないため,機能工学を行うための専門知識は必要ない。
この手法は、Long Short-Term Memory (LSTM) と Conditional Random Fields (CRFs) と呼ばれる一連のリカレントニューラルネットワークに依存している。
その結果, 注釈付きコーパスが適度な大きさであることから, この手法は最先端の手法よりも優れていることがわかった。
関連論文リスト
- Large language models as oracles for instantiating ontologies with domain-specific knowledge [0.0]
セマンティックなデータでインテリジェントなシステムを構築するには、ドメイン固有の知識を設計し、インスタンス化する必要がある。
結果として得られる経験プロセスは、時間を要する、エラーを起こしやすい、オントロジーデザイナーの個人的な背景に偏っていることが多い。
ドメイン固有の知識を自動的にインスタンス化するための,ドメインに依存しない新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-05T14:04:07Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Towards Generalization on Real Domain for Single Image Dehazing via
Meta-Learning [41.99615673136883]
合成画像から得られた内部情報は、通常、実際の領域では準最適である。
本稿では,メタラーニングに基づくドメイン一般化フレームワークを提案する。
提案手法は,最先端の競争相手よりも優れた一般化能力を有する。
論文 参考訳(メタデータ) (2022-11-14T07:04:00Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain [52.783709712318405]
非教師なしドメイン適応(UDA)は、ラベル豊富なソースドメインから関連するがラベルのないターゲットドメインに知識を伝達する、かなりの注目を集めている。
本研究では,大規模なドメインギャップと伝達知識を橋渡しし,クラス非ネイティブ情報の損失を軽減するために,SAFF(style-aware feature fusion)法を提案する。
論文 参考訳(メタデータ) (2022-09-05T10:06:03Z) - Multi-features based Semantic Augmentation Networks for Named Entity
Recognition in Threat Intelligence [7.321994923276344]
本稿では,入力トークンの表現を豊かにするために,異なる言語的特徴を取り入れた意味拡張手法を提案する。
特に,各入力トークンの構成特徴,形態的特徴,音声特徴の一部を符号化して集約し,その堅牢性を向上させる。
サイバーセキュリティデータセットDNRTIとMalwareTextDBについて実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-07-01T06:55:12Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights [1.6308268213252761]
新しいドメイン内で特定の情報ニーズを満たすためにタスクベースのアプローチを使用します。
美術NLP技術の状態を構成したパイプラインを使用して、インスタンスレベルのセマンティック構造を自動的に抽出する。
論文 参考訳(メタデータ) (2021-04-18T19:28:10Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - Domain-Transferable Method for Named Entity Recognition Task [0.6040938686276304]
本稿では、任意の名前付きエンティティの集合に対して、ドメイン固有のNERモデルを学習する方法について述べる。
我々は、人間の努力なしに監督が得られ、ニューラルモデルが互いに学習できると仮定する。
論文 参考訳(メタデータ) (2020-11-24T15:45:52Z) - Zero-Resource Cross-Domain Named Entity Recognition [68.83177074227598]
既存のドメイン名付きエンティティ認識モデルは、多くのラベルなしコーパスや、ターゲットドメイン内のラベル付きNERトレーニングデータに依存している。
外部リソースを一切使用しないドメイン間NERモデルを提案する。
論文 参考訳(メタデータ) (2020-02-14T09:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。