論文の概要: Tug-of-War within A Decade: Conflict Resolution in Vulnerability Analysis via Teacher-Guided Retrieval-Augmented Generations
- arxiv url: http://arxiv.org/abs/2604.14172v1
- Date: Wed, 25 Mar 2026 07:32:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.697773
- Title: Tug-of-War within A Decade: Conflict Resolution in Vulnerability Analysis via Teacher-Guided Retrieval-Augmented Generations
- Title(参考訳): 10年以内のTug-of-War:教師誘導型検索世代による脆弱性分析における紛争解決
- Authors: Ziyin Zhou, Jianyi Zhang, Xu ji, Yilong Li, Jiameng Han, Zhangchi Zhao,
- Abstract要約: 大規模言語モデル(LLM)は、サイバーセキュリティの脆弱性を分析し、対処するために不可欠である。
本稿では,CVE(Common Vulnerabilities and Exposures)の検出と分析において,知識の相違と矛盾の問題に焦点をあてる。
この問題に対処するために,CRVA-TGRAGと呼ばれる革新的な2段階のフレームワークを提案する。
- 参考スコア(独自算出の注目度): 11.29615928080523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are essential for analyzing and addressing vulnerabilities in cybersecurity. However, among over 200,000 vulnerabilities were discovered in the past decade, more than 30,000 have been changed or updated. This necessitates frequent updates to the training datasets and internal knowledge bases of LLMs to maintain knowledge consistency. In this paper, we focus on the problem of knowledge discrepancy and conflict within CVE (Common Vulnerabilities and Exposures) detection and analysis. This problem hinders LLMs' ability to retrieve the latest knowledge from original training datasets, leading to knowledge conflicts, fabrications of factually incorrect results, and generation hallucinations. To address this problem, we propose an innovative two-stage framework called CRVA-TGRAG (Conflict Resolution in Vulnerability Analysis via Teacher-Guided Retrieval-Augmented Generation). First, to improve document retrieval accuracy during the retrieval stage, we utilize Parent Document Segmentation and an ensemble retrieval scheme based on semantic similarity and inverted indexing. Second, to enhance LLMs' capabilities based on the retrieval of CVE dataset in generation stage, we employ a teacher-guided preference optimization technique to fine-tune LLMs. Our framework not only enhances the quality of content retrieval through RAG but also leverages the advantages of preference fine-tuning in LLMs to answer questions more effectively and precisely. Experiments demonstrate our method achieves higher accuracy in retrieving the latest CVEs compared to external knowledge bases. In conclusion, our framework significantly mitigates potential knowledge conflicts and inconsistencies that may arise from relying solely on LLMs for knowledge retrieval.
- Abstract(参考訳): 大規模言語モデル(LLM)は、サイバーセキュリティの脆弱性を分析し、対処するために不可欠である。
しかし、過去10年間に20万以上の脆弱性が発見され、3万人以上が変更または更新された。
これにより、LLMのトレーニングデータセットと内部知識ベースを頻繁に更新し、知識の整合性を維持する必要がある。
本稿では,CVE(Common Vulnerabilities and Exposures)の検出と分析において,知識の相違と矛盾の問題に焦点をあてる。
この問題は、LLMが元のトレーニングデータセットから最新の知識を回収する能力を妨げ、知識の衝突、事実的に誤った結果の生成、そして生成幻覚を引き起こす。
この問題に対処するため,CRVA-TGRAG(教師ガイドによる脆弱性解析における紛争解決)という,革新的な2段階のフレームワークを提案する。
まず、検索段階における文書検索精度を向上させるために、意味的類似性や逆インデックス化に基づくペアレント文書セグメンテーションとアンサンブル検索方式を用いる。
第2に、世代別CVEデータセットの検索に基づくLLMの能力向上のために、教師誘導の選好最適化技術を用いて微調整LSMを提案する。
我々のフレームワークは、RAGによるコンテンツ検索の質を高めるだけでなく、LLMにおける選好微調整の利点を活用して、より効果的かつ正確に質問に答える。
実験により, 最新のCVEの検索精度は, 外部知識ベースと比較して高いことがわかった。
結論として,本フレームワークは,LLMのみに頼って知識検索を行うことによって生じる潜在的な知識の矛盾や不整合を著しく軽減する。
関連論文リスト
- TruthfulRAG: Resolving Factual-level Conflicts in Retrieval-Augmented Generation with Knowledge Graphs [10.861331756147477]
本稿では,RAGシステムにおける事実レベルの知識紛争を解決するためにTrathfulRAGを提案する。
TruthfulRAGは、検索されたコンテンツからトリプルを体系的に抽出することで、知識グラフ(KG)を構築する。
大規模な実験により、TrathfulRAGは既存の手法より優れていることが判明した。
論文 参考訳(メタデータ) (2025-11-13T14:49:44Z) - Rethinking LLM Parametric Knowledge as Post-retrieval Confidence for Dynamic Retrieval and Reranking [23.1400319714807]
大規模言語モデル(LLM)は、知識の範囲を超えて疑問に直面したとき、しばしば不正確な応答(幻覚)を生成する。
Retrieval-Augmented Generation (RAG)は、外部知識を活用することでこの問題に対処するが、重要な課題は、検索されたコンテキストが特定のクエリに応答する能力を効果的に強化するかどうかである。
この課題は知識境界認識の重要性を浮き彫りにしており、これは現在の手法が個別のラベルや限られた信号障害に適切に対処する方法である。
論文 参考訳(メタデータ) (2025-09-08T09:37:20Z) - Accommodate Knowledge Conflicts in Retrieval-augmented LLMs: Towards Reliable Response Generation in the Wild [11.058848731627233]
大規模言語モデル (LLM) には高度な情報検索システムがある。
LLMは、しばしば内部記憶と検索された外部情報の間の知識の衝突に直面している。
スウィンVIBは,変分情報ボトルネックモデルのパイプラインを,検索した情報の適応的拡張に統合する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-04-17T14:40:31Z) - R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.30285670315334]
textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。
本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。
提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-03-07T17:14:44Z) - Retrieving, Rethinking and Revising: The Chain-of-Verification Can Improve Retrieval Augmented Generation [38.80878966092216]
大規模言語モデル(LLM)の強化を目的とした最近の検索拡張生成(RAG)
本稿では,外部検索の正しさと内部生成の整合性を高めるためのチェーン・オブ・バリフィケーション(CoV-RAG)を提案する。
論文 参考訳(メタデータ) (2024-10-08T08:34:54Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation [109.8527403904657]
大規模言語モデル(LLM)は,その知識に対する信頼度が低く,内部知識と外部知識の衝突をうまく扱えないことを示す。
検索の強化は、LLMの知識境界に対する認識を高める効果的なアプローチであることが証明されている。
本稿では,文書を動的に活用するための簡易な手法を提案する。
論文 参考訳(メタデータ) (2023-07-20T16:46:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。