論文の概要: Weakly Supervised Vulnerability Localization via Multiple Instance Learning
- arxiv url: http://arxiv.org/abs/2509.11312v1
- Date: Sun, 14 Sep 2025 15:11:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.025997
- Title: Weakly Supervised Vulnerability Localization via Multiple Instance Learning
- Title(参考訳): 複数インスタンス学習による脆弱性局所化の弱さ
- Authors: Wenchao Gu, Yupan Chen, Yanlin Wang, Hongyu Zhang, Cuiyun Gao, Michael R. Lyu,
- Abstract要約: WeAkly によるマルチプルインスタンス学習による脆弱性ローカライゼーションのための WAVES という新しい手法を提案する。
WAVESは、ある関数が脆弱かどうか(すなわち脆弱性検出)を判定し、脆弱なステートメントをピンポイントする機能を持っている。
提案手法は,文レベルの脆弱性ローカライゼーションにおいて,脆弱性検出と最先端のパフォーマンスにおいて同等のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 46.980136742826836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software vulnerability detection has emerged as a significant concern in the field of software security recently, capturing the attention of numerous researchers and developers. Most previous approaches focus on coarse-grained vulnerability detection, such as at the function or file level. However, the developers would still encounter the challenge of manually inspecting a large volume of code inside the vulnerable function to identify the specific vulnerable statements for modification, indicating the importance of vulnerability localization. Training the model for vulnerability localization usually requires ground-truth labels at the statement-level, and labeling vulnerable statements demands expert knowledge, which incurs high costs. Hence, the demand for an approach that eliminates the need for additional labeling at the statement-level is on the rise. To tackle this problem, we propose a novel approach called WAVES for WeAkly supervised Vulnerability Localization via multiplE inStance learning, which does not need the additional statement-level labels during the training. WAVES has the capability to determine whether a function is vulnerable (i.e., vulnerability detection) and pinpoint the vulnerable statements (i.e., vulnerability localization). Specifically, inspired by the concept of multiple instance learning, WAVES converts the ground-truth label at the function-level into pseudo labels for individual statements, eliminating the need for additional statement-level labeling. These pseudo labels are utilized to train the classifiers for the function-level representation vectors. Extensive experimentation on three popular benchmark datasets demonstrates that, in comparison to previous baselines, our approach achieves comparable performance in vulnerability detection and state-of-the-art performance in statement-level vulnerability localization.
- Abstract(参考訳): ソフトウェア脆弱性検出は最近、ソフトウェアセキュリティの分野で重要な関心事として現れ、多くの研究者や開発者の注目を集めている。
これまでのほとんどのアプローチは、関数やファイルレベルなど、粗い粒度の脆弱性検出に重点を置いていた。
しかしながら、開発者は、脆弱性のある関数内の大量のコードを手動で検査して、修正のための特定の脆弱性のあるステートメントを特定するという課題に直面し、脆弱性のローカライゼーションの重要性を示している。
脆弱性ローカライゼーションのモデルをトレーニングするには、通常、ステートメントレベルでの地味なラベルが必要であり、脆弱なステートメントのラベル付けには専門家の知識が要求されるため、高いコストが発生する。
したがって、ステートメントレベルでの追加ラベリングの必要性を排除するアプローチの需要は高まっている。
そこで本研究では,WAVES for WeAklyによるマルチプルインスタンス学習による脆弱性ローカライゼーション(Vulnerability Localization)を提案する。
WAVESは、ある関数が脆弱かどうか(すなわち脆弱性検出)を判定し、脆弱なステートメント(すなわち脆弱性のローカライゼーション)をピンポイントする機能を持っている。
具体的には、複数のインスタンス学習の概念にインスパイアされたWAVESは、ファンクションレベルの基底真実ラベルを個々のステートメントの擬似ラベルに変換し、追加のステートメントレベルのラベリングを不要にする。
これらの擬似ラベルを使用して、関数レベルの表現ベクトルの分類器を訓練する。
一般的な3つのベンチマークデータセットに対する大規模な実験により、従来のベースラインと比較して、脆弱性検出とステートレベルの脆弱性ローカライゼーションにおける最先端のパフォーマンスに匹敵する性能を達成できることが示されている。
関連論文リスト
- VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - Learning to Focus: Context Extraction for Efficient Code Vulnerability Detection with Language Models [16.23854525619129]
言語モデル(LM)は脆弱性検出の約束を示すが、脆弱で不確実な脆弱性位置のため、長く現実世界のコードに苦労する。
本研究では、LMに基づく脆弱性検出を学習し、センシティブなコンテキストを選択するモデルに依存しないフレームワークであるFocusVulを提案する。
論文 参考訳(メタデータ) (2025-05-23T04:41:54Z) - Open-Vocabulary Object Detection via Language Hierarchy [58.674088014474506]
我々はLHST(Language Hierarchical Self-Training)を設計し、弱教師付き検出器トレーニングに言語階層を導入する。
LHSTは、画像レベルのラベルを言語階層で拡張し、拡張されたラベルと自己学習の共正規化を可能にする。
提案手法は、14の広く研究されている対象検出データセットに対して、一貫して優れた一般化性能を実現する。
論文 参考訳(メタデータ) (2024-10-27T08:20:03Z) - SliceLocator: Locating Vulnerable Statements with Graph-based Detectors [33.395068754566935]
SliceLocatorは、すべての潜在的な脆弱性トリガリングステートメントから、最も重み付けされたフローパスを選択することで、最も関連性の高いテントフローを特定する。
SliceLocatorは、最先端の4つのGNNベースの脆弱性検知器で一貫して動作することを示す。
論文 参考訳(メタデータ) (2024-01-05T10:15:04Z) - Improved Adaptive Algorithm for Scalable Active Learning with Weak
Labeler [89.27610526884496]
Weak Labeler Active Cover (WL-AC)は、要求される精度を維持しながら、クエリの複雑さを低減するために、低品質の弱いラベルを堅牢に活用することができる。
受動学習と同一の精度を維持しつつラベル数を著しく削減し, 劣化したMNISTデータセット上での有効性を示す。
論文 参考訳(メタデータ) (2022-11-04T02:52:54Z) - VELVET: a noVel Ensemble Learning approach to automatically locate
VulnErable sTatements [62.93814803258067]
本稿では,ソースコード中の脆弱な文を見つけるための新しいアンサンブル学習手法であるVELVETを提案する。
我々のモデルは、グラフベースとシーケンスベースニューラルネットワークを組み合わせて、プログラムグラフの局所的およびグローバル的コンテキストを捕捉する。
VELVETは、合成データと実世界のデータに対して、それぞれ99.6%と43.6%の精度を達成している。
論文 参考訳(メタデータ) (2021-12-20T22:45:27Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。