論文の概要: AGIR: Automating Cyber Threat Intelligence Reporting with Natural
Language Generation
- arxiv url: http://arxiv.org/abs/2310.02655v1
- Date: Wed, 4 Oct 2023 08:25:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 16:01:48.635401
- Title: AGIR: Automating Cyber Threat Intelligence Reporting with Natural
Language Generation
- Title(参考訳): AGIR: 自然言語生成によるサイバー脅威情報報告の自動化
- Authors: Filippo Perrina, Francesco Marchiori, Mauro Conti, Nino Vincenzo Verde
- Abstract要約: 我々は,CTIレポートの変換ツールであるAGIR(Automatic Generation of Intelligence Reports)を紹介する。
AGIRの主な目的は、包括的インテリジェンスレポートを生成するための労働集約的なタスクを自動化することで、セキュリティアナリストを強化することである。
我々はAGIRのレポート生成能力を定量的かつ質的に評価する。
- 参考スコア(独自算出の注目度): 15.43868945929965
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cyber Threat Intelligence (CTI) reporting is pivotal in contemporary risk
management strategies. As the volume of CTI reports continues to surge, the
demand for automated tools to streamline report generation becomes increasingly
apparent. While Natural Language Processing techniques have shown potential in
handling text data, they often struggle to address the complexity of diverse
data sources and their intricate interrelationships. Moreover, established
paradigms like STIX have emerged as de facto standards within the CTI
community, emphasizing the formal categorization of entities and relations to
facilitate consistent data sharing. In this paper, we introduce AGIR (Automatic
Generation of Intelligence Reports), a transformative Natural Language
Generation tool specifically designed to address the pressing challenges in the
realm of CTI reporting. AGIR's primary objective is to empower security
analysts by automating the labor-intensive task of generating comprehensive
intelligence reports from formal representations of entity graphs. AGIR
utilizes a two-stage pipeline by combining the advantages of template-based
approaches and the capabilities of Large Language Models such as ChatGPT. We
evaluate AGIR's report generation capabilities both quantitatively and
qualitatively. The generated reports accurately convey information expressed
through formal language, achieving a high recall value (0.99) without
introducing hallucination. Furthermore, we compare the fluency and utility of
the reports with state-of-the-art approaches, showing how AGIR achieves higher
scores in terms of Syntactic Log-Odds Ratio (SLOR) and through questionnaires.
By using our tool, we estimate that the report writing time is reduced by more
than 40%, therefore streamlining the CTI production of any organization and
contributing to the automation of several CTI tasks.
- Abstract(参考訳): サイバー脅威インテリジェンス(CTI)の報告は、現代のリスク管理戦略において重要である。
ctiレポートの量が増え続けるにつれ、レポート生成を合理化する自動化ツールの需要がますます高まっている。
自然言語処理技術はテキストデータを扱う可能性を示しているが、多種多様なデータソースと複雑な相互関係の複雑さに対処するのに苦労することが多い。
さらに、STIXのような確立されたパラダイムはCTIコミュニティ内の事実上の標準として現れ、一貫性のあるデータ共有を容易にするためのエンティティと関係の正式な分類を強調している。
本稿では,ctiレポーティングにおける差し迫った課題に対処するための,トランスフォーメーションな自然言語生成ツールであるagir(automatic generation of intelligence reports)を紹介する。
AGIRの主な目的は、エンティティグラフの形式的表現から包括的なインテリジェンスレポートを生成するための労働集約的なタスクを自動化することで、セキュリティアナリストを強化することである。
AGIRはテンプレートベースのアプローチの利点とChatGPTのような大規模言語モデルの能力を組み合わせることで、2段階のパイプラインを利用する。
我々はAGIRのレポート生成能力を定量的かつ質的に評価する。
生成したレポートは、ホルマリン言語で表現された情報を正確に伝達し、幻覚を起こすことなく高いリコール値(0.99)を達成する。
さらに,本報告の流布度と有効性を比較し,Syntactic Log-Odds Ratio (SLOR) やアンケートを通じてAGIRがより高いスコアを得られるかを示した。
このツールを用いることで,レポート作成時間を40%以上削減できると推定し,任意の組織のcti生産を合理化し,複数のctiタスクの自動化に寄与する。
関連論文リスト
- Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - FLIP: Towards Fine-grained Alignment between ID-based Models and
Pretrained Language Models for CTR Prediction [51.64257638308695]
本稿では,クリックスルー率(CTR)予測のためのIDベースモデルと事前学習言語モデル(FLIP)間の細粒度特徴レベルのアライメントを提案する。
具体的には、1つのモダリティ(トークンや特徴)のマスキングされたデータは、他のモダリティの助けを借りて回復し、特徴レベルの相互作用とアライメントを確立する必要がある。
論文 参考訳(メタデータ) (2023-10-30T11:25:03Z) - ClickPrompt: CTR Models are Strong Prompt Generators for Adapting
Language Models to CTR Prediction [46.65360449769386]
クリックスルー率(CTR)の予測は、様々なインターネットアプリケーションにとってますます不可欠になっている。
従来のCTRモデルは、マルチフィールド分類データをワンホット符号化によりID特徴に変換し、特徴間の協調信号を抽出する。
我々は、CTRモデルを組み込んで対話対応ソフトプロンプトを生成する、新しいモデル非依存フレームワーク(ClickPrompt)を提案する。
論文 参考訳(メタデータ) (2023-10-13T16:37:53Z) - Time for aCTIon: Automated Analysis of Cyber Threat Intelligence in the
Wild [2.4669630540735215]
サイバー脅威インテリジェンス(CTI)は、リスクの評価と組織のセキュリティ向上に重要な役割を果たしている。
既存の構造化CTI抽出ツールには性能制限がある。
我々はこれらのギャップを埋め、新しい大きなオープンベンチマークデータセットと構造化されたCTI情報抽出ツールであるaCTIonを提供する。
論文 参考訳(メタデータ) (2023-07-14T13:43:16Z) - Natural Language Processing of Aviation Occurrence Reports for Safety
Management [7.008490462870145]
本稿では,航空安全発生報告の分析を支援するために,自然言語処理(NLP)手法について検討する。
適切な条件下では、発生レポートのラベル付けを変換器ベースの分類器で効果的に自動化することができる。
論文 参考訳(メタデータ) (2023-01-13T17:00:09Z) - Towards Coherent and Consistent Use of Entities in Narrative Generation [5.715103211247915]
物語生成の最終課題に焦点をあて、生成した物語における長距離エンティティの一貫性と一貫性を分析する。
本稿では,エンティティ使用量の観点からモデル性能を測定するための,一連の自動測定指標を提案する。
次に,学習済みのLMを動的エンティティメモリでエンドツーエンドに拡張する手法を提案する。
論文 参考訳(メタデータ) (2022-02-03T17:19:21Z) - AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction [54.20039200180071]
我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
論文 参考訳(メタデータ) (2021-09-10T08:11:56Z) - EXTRACTOR: Extracting Attack Behavior from Threat Reports [6.471387545969443]
本稿では,ctiレポートから簡潔な攻撃行動を自動的に抽出するプロヴァンサと呼ばれる新しい手法とツールを提案する。
provenanceORはテキストに対して強い仮定をしておらず、非構造化テキストから攻撃行動をグラフとして抽出することができる。
この評価結果から,CTIレポートから簡潔なグラフを抽出し,サイバー分析ツールで脅威ハンティングに活用できることが示された。
論文 参考訳(メタデータ) (2021-04-17T18:51:00Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z) - Exploring Software Naturalness through Neural Language Models [56.1315223210742]
ソフトウェア自然性仮説(Software Naturalness hypothesis)は、自然言語処理で使用されるのと同じ手法でプログラミング言語を理解することができると主張している。
この仮説は,事前学習されたトランスフォーマーベース言語モデルを用いて,コード解析タスクを実行することによって検討する。
論文 参考訳(メタデータ) (2020-06-22T21:56:14Z) - Few-shot Natural Language Generation for Task-Oriented Dialog [113.07438787659859]
FewShotWozは,タスク指向対話システムにおける数ショットの学習設定をシミュレートする最初の NLG ベンチマークである。
我々は, SC-GPTモデルを開発し, その制御可能な生成能力を得るために, 注釈付きNLGコーパスの大規模なセットで事前学習を行った。
FewShotWozとMulti-Domain-WOZデータセットの実験は、提案したSC-GPTが既存の手法を大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2020-02-27T18:48:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。