論文の概要: GRID: Graph Representation of Intelligence Data for Security Text Knowledge Graph Construction
- arxiv url: http://arxiv.org/abs/2605.16714v1
- Date: Fri, 15 May 2026 23:54:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.920474
- Title: GRID: Graph Representation of Intelligence Data for Security Text Knowledge Graph Construction
- Title(参考訳): GRID:セキュリティテキスト知識グラフ構築のためのインテリジェンスデータのグラフ表現
- Authors: Liangyi Huang, Zichen Liu, Fei Shao, Shang Ma, Mengshi Zhang, Zihao Chen, Yanfang Ye, Xusheng Xiao,
- Abstract要約: セキュリティテキスト知識グラフ構築のためのエンドツーエンドフレームワークであるGRID(Graph Representation of Intelligence Data)を提案する。
GRIDはまず、トレース可能な記事-グラフアライメントを作成することで、CTIの記事からセキュリティドメインの監視を構築する。
Task-bankの報酬はオフラインで構築でき、後のトレーニング実行で再利用できる。
- 参考スコア(独自算出の注目度): 27.237633809729743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Security knowledge graphs can provide computable external memory for security agents, but constructing them from long-form cyber threat intelligence (CTI) remains difficult: LLMs often lack grounded security-domain knowledge, and end-to-end document-to-graph training is hard to supervise with cheap, stable rewards. We present GRID (Graph Representation of Intelligence Data), an end-to-end framework for security text knowledge graph construction. GRID first builds security-domain supervision from CTI articles by creating traceable article-graph alignments through graph extraction and knowledge-graph-conditioned text revision. It then turns document-to-graph learning into a scripted task bank combining four-option multi-select questions with triple-level regex matching targets, yielding more stable task-specific rewards than repeatedly scoring full graph outputs with an LLM judge. Using this supervision pipeline, we train two Qwen3-4B-Instruct-2507-based 4B extractors: a primary Task-bank Reward model and a secondary End2End Reward model with LLM-as-judge precision/recall rewards. On 249 CTI articles from GRID, CASIE, CTINexus, MalKG, and SecureNLP, the Task-bank Reward model with the ontology-guided GRID extraction pipeline reaches 84.62% source-averaged precision, 64.91% source-averaged recall, and 68.53% Avg F1, achieving the best source-averaged recall and near-top Avg F1 with lower token usage and deployment cost. The End2End Reward model reaches 76.91% precision, 53.85% recall, and 58.06% Avg F1. Further analyses show that task-bank rewards can be built once offline and reused across later post-training runs, outperforming online End2End LLM-as-judge reward and weaker alternatives such as Choice-only Reward and End2End SFT without RL.
- Abstract(参考訳): セキュリティ知識グラフは、セキュリティエージェントに計算可能な外部メモリを提供することができるが、長期的なサイバー脅威インテリジェンス(CTI)からそれらを構築することは難しい。
セキュリティテキスト知識グラフ構築のためのエンドツーエンドフレームワークであるGRID(Graph Representation of Intelligence Data)を提案する。
GRIDはまず、グラフ抽出と知識グラフ条件付きテキストリビジョンを通じてトレース可能な記事-グラフアライメントを作成することで、CTIの記事からセキュリティドメインの監視を構築する。
そして、文書からグラフへの学習をスクリプト化されたタスクバンクに変換し、4つのオプションの複数選択された質問と3段階のregexマッチングターゲットを組み合わせる。
この監視パイプラインを用いて、2つのQwen3-4B-Instruct-2507ベースの4B抽出器(プライマリタスクバンク・リワードモデルと、LCM-as-judge精度/リコール報酬付きエンド2エンド・リワードモデル)を訓練する。
GRID、CASIE、CTINexus、MalKG、SecureNLPの249のCTI記事において、オントロジー誘導GRID抽出パイプラインを備えたタスクバンク・リワードモデルが84.62%のソース平均精度、64.91%のソース平均リコール、68.53%のAvg F1に達し、トークン使用率とデプロイコストが低下した。
End2End Rewardモデルは76.91%の精度、53.85%のリコール、58.06%のAvg F1に達する。
オンラインのEnd2End LLM-as-judge報酬よりも優れており、Choice-only RewardやEnd2End SFTのような弱い代替品よりもRLを使わずに優れている。
関連論文リスト
- VLAA-GUI: Knowing When to Stop, Recover, and Search, A Modular Framework for GUI Automation [98.38575149237442]
VLAA-GUIは3つの統合コンポーネントを中心に構築されたモジュラーGUIフレームワークである。
必須完全性検証は、UIで観測可能な成功基準と検証を、各完了ステップで実施する。
強制的なループブレーカは、繰り返し失敗した後、多層切替インタラクションモードを提供する。
論文 参考訳(メタデータ) (2026-04-23T07:42:37Z) - LLMSniffer: Detecting LLM-Generated Code via GraphCodeBERT and Supervised Contrastive Learning [0.31034395048547575]
ソフトウェア開発における大規模言語モデル(LLM)は、AI生成コードと人書きコードとを区別することが重要な課題である。
本稿では,2段階の教師付きコントラスト学習パイプラインを用いて,GraphCodeBERTを微調整する検出フレームワークを提案する。
GPTSnifferとWhodunitの2つのベンチマークデータセットを評価した。
論文 参考訳(メタデータ) (2026-04-17T13:32:25Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval [50.30107119622642]
大規模言語モデル(LLM)は推論と生成において優れているが、本質的には静的事前学習データによって制限されている。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識に基盤を置くことでこの問題に対処する。
MarAG-R1は、LLMが複数の検索機構を動的に調整できる強化学習型マルチツールRAGフレームワークである。
論文 参考訳(メタデータ) (2025-10-31T15:51:39Z) - ExCyTIn-Bench: Evaluating LLM agents on Cyber Threat Investigation [15.227180564453016]
サイバー脅威調査におけるLCMエージェントxの評価を行う最初のベンチマークであるExCyTIn-Benchを提案する。
我々は、専門家が作成した検出ロジックで抽出したセキュリティログを活用して脅威調査グラフを構築する。
グラフ上のペアノードを用いてLLMを用いて質問を生成し、開始ノードを背景コンテキストとし、終了ノードを回答とする。
論文 参考訳(メタデータ) (2025-07-14T17:06:26Z) - Evaluating the Use of LLMs for Documentation to Code Traceability [3.076436880934678]
大規模言語モデルは、様々なソフトウェアドキュメンテーションとソースコードの間のトレースリンクを確立することができる。
私たちは2つのオープンソースプロジェクト(Unity CatalogとCrawl4AI)から2つの新しいデータセットを作成します。
その結果、最高の性能のLLMは2つのデータセットで79.4%と80.4%のF1スコアを達成した。
論文 参考訳(メタデータ) (2025-06-19T16:18:53Z) - Compile Scene Graphs with Reinforcement Learning [69.36723767339001]
次世代予測は大規模言語モデル(LLM)の訓練の基本原理である
本稿では,マルチモーダルLLM(M-LLM)であるR1-SGGを紹介する。
私たちは、Hard Recall、Hard Recall+Relax、Soft Recallの3つのリコールベースのバリエーションを含む、グラフ中心の報酬セットを設計します。
論文 参考訳(メタデータ) (2025-04-18T10:46:22Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。