論文の概要: Instantiating Standards: Enabling Standard-Driven Text TTP Extraction with Evolvable Memory
- arxiv url: http://arxiv.org/abs/2505.09261v1
- Date: Wed, 14 May 2025 10:22:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.416533
- Title: Instantiating Standards: Enabling Standard-Driven Text TTP Extraction with Evolvable Memory
- Title(参考訳): 標準の確立: 進化可能なメモリによる標準駆動型テキストTTP抽出の実現
- Authors: Cheng Meng, ZhengWei Jiang, QiuYun Wang, XinYi Li, ChunYan Ma, FangMing Dong, FangLi Ren, BaoXu Liu,
- Abstract要約: 抽象的な標準定義を実行可能な文脈化された知識に変換する新しいフレームワークを導入する。
本手法では,Large Language Model (LLM) を用いて知識の生成,更新,適用を行う。
実験の結果,GPT-4oを11%上回るテクニックF1スコアが得られた。
- 参考スコア(独自算出の注目度): 4.909107168534244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting MITRE ATT\&CK Tactics, Techniques, and Procedures (TTPs) from natural language threat reports is crucial yet challenging. Existing methods primarily focus on performance metrics using data-driven approaches, often neglecting mechanisms to ensure faithful adherence to the official standard. This deficiency compromises reliability and consistency of TTP assignments, creating intelligence silos and contradictory threat assessments across organizations. To address this, we introduce a novel framework that converts abstract standard definitions into actionable, contextualized knowledge. Our method utilizes Large Language Model (LLM) to generate, update, and apply this knowledge. This framework populates an evolvable memory with dual-layer situational knowledge instances derived from labeled examples and official definitions. The first layer identifies situational contexts (e.g., "Communication with C2 using encoded subdomains"), while the second layer captures distinctive features that differentiate similar techniques (e.g., distinguishing T1132 "Data Encoding" from T1071 "Application Layer Protocol" based on whether the focus is on encoding methods or protocol usage). This structured approach provides a transparent basis for explainable TTP assignments and enhanced human oversight, while also helping to standardize other TTP extraction systems. Experiments show our framework (using Qwen2.5-32B) boosts Technique F1 scores by 11\% over GPT-4o. Qualitative analysis confirms superior standardization, enhanced transparency, and improved explainability in real-world threat intelligence scenarios. To the best of our knowledge, this is the first work that uses the LLM to generate, update, and apply the a new knowledge for TTP extraction.
- Abstract(参考訳): MITRE ATT\&CK Tactics, Techniques, and procedures(TTP)を自然言語の脅威レポートから抽出することは、非常に難しい。
既存のメソッドは主に、データ駆動アプローチを使用したパフォーマンスメトリクスに重点を置いており、しばしば公式標準への忠実な準拠を保証するメカニズムを無視している。
この欠陥はTTP割り当ての信頼性と一貫性を損なうもので、情報サイロと組織間の矛盾する脅威評価を生み出している。
そこで本研究では,抽象的な標準定義を実践可能な文脈的知識に変換する新しいフレームワークを提案する。
本手法では,Large Language Model (LLM) を用いて知識の生成,更新,適用を行う。
このフレームワークは、ラベル付き例と公式定義から派生した2層状態知識インスタンスで、進化可能なメモリをポップアップさせる。
第1のレイヤは状況コンテキスト(例えば、エンコードされたサブドメインを使用するC2との通信)を識別し、第2のレイヤは、同様のテクニックを区別する特徴(例えば、T1132 "Data Encoding"とT1071 "Application Layer Protocol"を区別する)を、メソッドのエンコーディングやプロトコルの使用にフォーカスするかどうかに基づいて、キャプチャする。
この構造化アプローチは、説明可能なTTP割り当てと強化された人間の監視のための透過的な基盤を提供すると同時に、他のTTP抽出システムを標準化する助けとなる。
実験の結果、我々のフレームワーク(Qwen2.5-32B)はGPT-4oよりも11%向上した。
質的分析は、より優れた標準化、透明性の向上、現実世界の脅威インテリジェンスシナリオにおける説明可能性の向上を確認できる。
私たちの知る限りでは、TLP抽出のための新しい知識を生成し、更新し、適用するためにLLMを使用する最初の作品です。
関連論文リスト
- Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Ownership Verification with Reasoning [58.57194301645823]
大規模言語モデル (LLM) は、検索強化生成機構 (RAG) を通じて現実のアプリケーションに統合されつつある。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、通常、中毒攻撃を伴う。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Enhancing Visual Continual Learning with Language-Guided Supervision [76.38481740848434]
継続的な学習は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。
ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。
具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 監視信号として機能する。
論文 参考訳(メタデータ) (2024-03-24T12:41:58Z) - Noise Contrastive Estimation-based Matching Framework for Low-Resource
Security Attack Pattern Recognition [49.536368818512116]
TTP(Tactics, Techniques and Procedures)は、サイバーセキュリティドメインにおける高度な攻撃パターンを表す。
そこで本研究では,TTPラベルへのテキストの割り当てが,両者の直接的な意味的類似性によって決定される,異なる学習パラダイムの問題を定式化する。
本稿では,効果的なサンプリングベース学習機構を備えたニューラルマッチングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:02:00Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z) - Reinforcement Learning-powered Semantic Communication via Semantic
Similarity [13.569045590522316]
我々は,ビットレベルの精度を厳格に確保する代わりに,セマンティック情報を保存するための新しいセマンティックコミュニケーション機構を導入する。
一般的に使用されるビットレベルのメトリクスは、重要な意味や構造を捉えるのに脆弱であることを示す。
ユーザ定義のセマンティック測定を同時に最適化できる強化学習(RL)ベースのソリューションを提案しました。
論文 参考訳(メタデータ) (2021-08-27T05:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。