論文の概要: Aligning Core Aspects: Improving Vulnerability Proof-of-Concepts via Cross-Source Insights
- arxiv url: http://arxiv.org/abs/2508.18109v1
- Date: Mon, 25 Aug 2025 15:18:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.835217
- Title: Aligning Core Aspects: Improving Vulnerability Proof-of-Concepts via Cross-Source Insights
- Title(参考訳): コア面の整合性 - クロスソースインサイトによる概念の脆弱性証明の改善
- Authors: Lingxiao Wang, Wenjing Dang, Mengyao Zhang, Yue Wang, Xianzong Wu, Sen Chen,
- Abstract要約: 公共プラットフォームにおけるPoCレポートにおける情報不足に関する最初の研究を行う。
公開プラットフォームで利用可能なPoCレポートには,少なくとも1つの重要な側面が欠けていることが分かりました。
我々はPoCレポートの欠落した側面情報を補完するマルチソース情報融合法を開発した。
- 参考スコア(独自算出の注目度): 7.595114357457011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For vulnerabilities, Proof-of-Concept (PoC) plays an irreplaceable role in demonstrating the exploitability. PoC reports may include critical information such as specific usage, test platforms, and more, providing essential insights for researchers. However, in reality, due to various PoC templates across PoC platforms, PoC reports extensively suffer from information deficiency, leading the suboptimal quality and limited usefulness. Fortunately, we found that information deficiency of PoC reports could be mitigated by the completion from multiple sources given the same referred vulnerability. In this paper, we conduct the first study on the deficiency of information in PoC reports across public platforms. We began by collecting 173,170 PoC reports from 4 different platforms and defined 8 key aspects that PoCs should contain. By integrating rule-based matching and a fine-tuned BERT-NER model for extraction of key aspects, we discovered that all PoC reports available on public platforms have at least one missing key aspect. Subsequently, we developed a multi-source information fusion method to complete the missing aspect information in PoC reports by leveraging CVE entries and related PoC reports from different sources. Finally, we successfully completed 69,583 PoC reports (40.18% of all reports).
- Abstract(参考訳): 脆弱性に対して、Proof-of-Concept(PoC)は、エクスプロイラビリティを示す上で、相応の役割を果たす。
PoCレポートには、特定の使用状況やテストプラットフォームなどの重要な情報が含まれ、研究者にとって重要な洞察を提供する可能性がある。
しかし、PoCプラットフォームにまたがる様々なPoCテンプレートにより、PoCレポートは情報不足に広範囲に悩まされ、最適以下の品質と限られた有用性をもたらす。
幸いなことに、PoCレポートの情報不足は、同様の脆弱性が指摘されている複数のソースからの完了によって軽減される可能性がある。
本稿では,公共のプラットフォームにまたがるPoCレポートにおける情報不足に関する最初の研究を行う。
まず4つのプラットフォームから173,170のPoCレポートを収集し、PoCが含むべき8つの重要な側面を定義しました。
ルールベースマッチングと細調整されたBERT-NERモデルを組み合わせることで,公開プラットフォーム上で利用可能なPoCレポートには,少なくとも1つの重要な側面が欠落していることが判明した。
その後,異なる情報源からのCVEエントリと関連するPoCレポートを活用することで,PoCレポートの欠落した側面情報を補完するマルチソース情報融合手法を開発した。
最終的に69,583件のPoCレポート(全報告の40.18%)を完了しました。
関連論文リスト
- Predicting known Vulnerabilities from Attack News: A Transformer-Based Approach [0.39134914399411086]
本稿では,ソフトウェア脆弱性,特にCVE(Common Vulnerabilities and Exposures)の予測プロセスについて検討する。
本稿では,各ニュースレポートに対応する最も可能性の高いCVEのランクリストを生成するために,意味的類似性に基づくアプローチを提案する。
実験の結果,しきい値に基づくフィルタリングでは,精度が81%に達することがわかった。
論文 参考訳(メタデータ) (2026-02-23T08:47:48Z) - I Can't Believe It's Not a Valid Exploit [0.23749905164931204]
我々は,大規模言語モデルによるJavaセキュリティ脆弱性に対するPoC生成フレームワークPoC-Gymを開発した。
静的解析ツールによるガイダンスがPoC生成の成功率を向上させるか否かを評価し,結果のPoCを手作業で検査する。
論文 参考訳(メタデータ) (2026-02-04T02:59:03Z) - Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.16077040470975]
Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文 参考訳(メタデータ) (2026-01-21T16:13:57Z) - Analyzing the Availability of E-Mail Addresses for PyPI Libraries [89.21869606965578]
81.6%のライブラリには、少なくとも1つの有効な電子メールアドレスが含まれており、PyPIが主要なソースとなっている。
698,000以上の無効なエントリを識別します。
論文 参考訳(メタデータ) (2026-01-20T14:54:58Z) - Real-World Usability of Vulnerability Proof-of-Concepts: A Comprehensive Study [13.380820971152104]
野生におけるPoCsの大規模研究を行い,その可利用性,完全性,有効性を評価した。
我々は13プラットフォームから470,921のPoCとそれらのレポートを収集し、現在最も広く公開されているPoCのコレクションを表現した。
我々の調査によると、CVEの脆弱性の78.9%はPoCを欠いていることが判明し、既存のPoCレポートでは、効果的な脆弱性の理解と再現に必要な必須コンポーネントの約30%が欠落している。
論文 参考訳(メタデータ) (2025-10-21T09:22:36Z) - A Systematic Study on Generating Web Vulnerability Proof-of-Concepts Using Large Language Models [13.035038702785512]
本稿では,Webアプリケーション脆弱性に対するLarge Language Models(LLMs)ベースのPoC生成に関する実証的研究について紹介する。
以上の結果から, LLMは公共データのみを用いて, 8%~34%の症例で作業用PoCを自動生成できることがわかった。
さらなる分析によると、コードコンテキストを補完することで成功率が17%-20%向上し、関数レベルが9%-13%改善した。
論文 参考訳(メタデータ) (2025-10-11T10:15:38Z) - CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - PoCGen: Generating Proof-of-Concept Exploits for Vulnerabilities in Npm Packages [16.130469984234956]
PoCGenは、npmパッケージの脆弱性に対するPoCエクスプロイトを自動生成し、検証する新しいアプローチである。
大規模な言語モデル(LLM)をPoCエクスプロイト生成のための静的および動的解析技術と併用する、初めての完全自律型アプローチである。
論文 参考訳(メタデータ) (2025-06-05T12:37:33Z) - Fixseeker: An Empirical Driven Graph-based Approach for Detecting Silent Vulnerability Fixes in Open Source Software [12.706661324384319]
オープンソースソフトウェアの脆弱性は、ダウンストリームアプリケーションに重大なセキュリティリスクをもたらす。
多くのセキュリティパッチは、セキュリティへの影響を明確に示すことなく、OSSリポジトリの新しいコミットで静かにリリースされている。
グラフベースのアプローチであるFixseekerを提案し、ハンクレベルでのコード変更間の様々な相関関係を抽出し、無声脆弱性の修正を検出する。
論文 参考訳(メタデータ) (2025-03-26T06:16:58Z) - From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。
本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。
実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文 参考訳(メタデータ) (2023-10-22T16:07:06Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization Benchmark and a Case Study on Summarizing Diverse Information from News Articles [136.84278943588652]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - CAR: Conceptualization-Augmented Reasoner for Zero-Shot Commonsense
Question Answering [56.592385613002584]
ゼロショットコモンセンス質問応答の課題に対処するために,概念化強化推論器(CAR)を提案する。
CARは、CommonSenseの知識を多くの高レベルなインスタンスに抽象化し、CommonSenseの知識ベースの範囲を拡大する。
CARは、既存のメソッドよりも、ゼロショットのコモンセンスシナリオに関する質問に答えることにより、より堅牢に一般化する。
論文 参考訳(メタデータ) (2023-05-24T08:21:31Z) - ZeroKBC: A Comprehensive Benchmark for Zero-Shot Knowledge Base
Completion [54.898479917173]
知識ベース補完は、知識グラフの欠落するリンクを予測することを目的としている。
以前のKBCタスクは主に、トレーニングセットにすべてのテストエンティティとリレーションが現れる設定に焦点を当てていました。
我々は、ゼロショットKBCの様々なシナリオをカバーする包括的なベンチマークであるZeroKBCを開発した。
論文 参考訳(メタデータ) (2022-12-06T16:02:09Z) - NLPeer: A Unified Resource for the Computational Study of Peer Review [58.71736531356398]
NLPeer - 5万以上の論文と5つの異なる会場からの1万1千件のレビューレポートからなる、初めて倫理的にソースされたマルチドメインコーパス。
従来のピアレビューデータセットを拡張し、解析および構造化された論文表現、豊富なメタデータ、バージョニング情報を含む。
我々の研究は、NLPなどにおけるピアレビューの体系的、多面的、エビデンスに基づく研究への道のりをたどっている。
論文 参考訳(メタデータ) (2022-11-12T12:29:38Z) - Reducing Information Overload: Because Even Security Experts Need to Blink [0.0]
コンピュータ緊急対応チーム(CERTs)は、セキュリティ関連の情報量の増加を処理しようとする課題に直面している。
この研究は、自動情報統合のための最適なアプローチを特定するために、5つのセキュリティ関連データセットにクラスタリングアルゴリズムと埋め込みモデルを組み合わせた196の組合せを評価する。
クラスタリングにより、セマンティックコヒーレンスを維持しながら、情報処理の要求を90%以上削減できることを示す。
論文 参考訳(メタデータ) (2022-10-25T14:50:11Z) - Czech Grammar Error Correction with a Large and Diverse Corpus [64.94696028072698]
文法的誤り訂正(GEC)のための注釈付きチェコ語コーパスを大規模かつ多種多様に導入する。
Grammar Error Correction Corpus for Czech (GECCC)は、非ネイティブ話者によって書かれた高いエラー密度エッセイからウェブサイトテキストまで、さまざまな4つのドメインを提供している。
我々は、トランスフォーマーをベースとしたいくつかのチェコのGECシステムを比較し、将来の研究に強力なベースラインを設定している。
論文 参考訳(メタデータ) (2022-01-14T18:20:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。