論文の概要: A Large Scale Study of AI-based Binary Function Similarity Detection Techniques for Security Researchers and Practitioners
- arxiv url: http://arxiv.org/abs/2511.01180v1
- Date: Mon, 03 Nov 2025 03:10:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.09478
- Title: A Large Scale Study of AI-based Binary Function Similarity Detection Techniques for Security Researchers and Practitioners
- Title(参考訳): セキュリティ研究者と実践者を対象としたAIに基づくバイナリ関数類似性検出手法の大規模研究
- Authors: Jingyi Shi, Yufeng Chen, Yang Xiao, Yuekang Li, Zhengzi Xu, Sihao Qiu, Chi Zhang, Keyu Qi, Yeting Li, Xingchu Chen, Yanyan Zou, Yang Liu, Wei Huo,
- Abstract要約: バイナリ関数類似性検出(BFSD)は、ソフトウェアセキュリティの基本技術である。
AIベースのBFSDツールの最近の進歩は、大幅なパフォーマンス向上につながっている。
このギャップに対処するために,AIベースのBFSDツールに関する大規模な実証的研究を行った。
- 参考スコア(独自算出の注目度): 20.470574733047442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Binary Function Similarity Detection (BFSD) is a foundational technique in software security, underpinning a wide range of applications including vulnerability detection, malware analysis. Recent advances in AI-based BFSD tools have led to significant performance improvements. However, existing evaluations of these tools suffer from three key limitations: a lack of in-depth analysis of performance-influencing factors, an absence of realistic application analysis, and reliance on small-scale or low-quality datasets. In this paper, we present the first large-scale empirical study of AI-based BFSD tools to address these gaps. We construct two high-quality and diverse datasets: BinAtlas, comprising 12,453 binaries and over 7 million functions for capability evaluation; and BinAres, containing 12,291 binaries and 54 real-world 1-day vulnerabilities for evaluating vulnerability detection performance in practical IoT firmware settings. Using these datasets, we evaluate nine representative BFSD tools, analyze the challenges and limitations of existing BFSD tools, and investigate the consistency among BFSD tools. We also propose an actionable strategy for combining BFSD tools to enhance overall performance (an improvement of 13.4%). Our study not only advances the practical adoption of BFSD tools but also provides valuable resources and insights to guide future research in scalable and automated binary similarity detection.
- Abstract(参考訳): バイナリ関数類似性検出(BFSD)はソフトウェアセキュリティの基本技術であり、脆弱性検出、マルウェア解析など幅広いアプリケーションを支える。
AIベースのBFSDツールの最近の進歩は、大幅なパフォーマンス向上につながっている。
しかし、これらのツールの既存の評価には、パフォーマンスに影響する要因の詳細な分析の欠如、現実的なアプリケーション分析の欠如、小規模または低品質のデータセットへの依存の3つの重要な制限がある。
本稿では,このギャップに対処するAIベースのBFSDツールについて,大規模な実証的研究を行った。
BinAtlasは12,453のバイナリと700万以上の関数で構成され、BinAresは12,291のバイナリと54の現実世界の1日間の脆弱性を含み、実際のIoTファームウェア設定で脆弱性検出性能を評価する。
これらのデータセットを用いて,9つの代表的なBFSDツールを評価し,既存のBFSDツールの課題と限界を分析し,BFSDツール間の一貫性を検討する。
また,BFSDツールを組み合わせて総合的な性能向上を図るための実用的な戦略を提案する(13.4%の改善)。
我々の研究は、BFSDツールの実用化を前進させるだけでなく、スケーラブルで自動化されたバイナリ類似性検出における将来の研究をガイドするための貴重なリソースや洞察も提供します。
関連論文リスト
- A Large Scale Empirical Analysis on the Adherence Gap between Standards and Tools in SBOM [54.38424417079265]
ソフトウェア・ビル・オブ・マテリアル(Software Bill of Materials, SBOM)は、ソフトウェア情報を整理する機械読み取り可能なアーティファクトである。
標準に従って、組織はSBOMの生成と利用のためのツールを開発した。
本稿では,我々の自動評価フレームワークであるSAPを用いて,接着ギャップの大規模2段階解析を行った。
論文 参考訳(メタデータ) (2026-01-09T08:26:05Z) - Ensembling Large Language Models for Code Vulnerability Detection: An Empirical Evaluation [69.8237598448941]
本研究では,ソースコードの脆弱性検出において,Large Language Models(LLM)の性能を高めるためのアンサンブル学習の可能性を検討する。
脆弱性検出に適したスタック機能であるDynamic Gated Stacking (DGS)を提案する。
論文 参考訳(メタデータ) (2025-09-16T03:48:22Z) - Revisiting Third-Party Library Detection: A Ground Truth Dataset and Its Implications Across Security Tasks [12.328841506102963]
6000以上のアプリを対象に,最先端の10個のTPL検出技術に関する大規模な実証的研究を行った。
我々の評価は、ツールの脆弱性をR8時代の変換、バージョン識別の弱い、候補ライブラリの不正確な対応、類似性のしきい値の一般化の難しさ、大規模実行時のランタイム/メモリオーバーヘッドを禁止している。
論文 参考訳(メタデータ) (2025-09-04T10:48:02Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Advancing Tool-Augmented Large Language Models via Meta-Verification and Reflection Learning [63.2198957755528]
本稿では,2つの重要なイノベーションを通じてシステム2推論を包括的に行う新しいツール拡張LDMであるTool-MVRを提案する。
具体的には、まず、API、クエリ、推論トラジェクトリを厳格に検証する体系的なパイプラインであるMulti-Agent Meta-Verification(MAMV)を紹介します。
第2に,ツールフィードバックを活用することで,ツールのリフレクション機能を向上させるExploration-based Reflection Learning (EXPLORE)を提案する。
論文 参考訳(メタデータ) (2025-06-05T04:35:49Z) - An Empirical Analysis of Vulnerability Detection Tools for Solidity Smart Contracts Using Line Level Manually Annotated Vulnerabilities [5.357551358237259]
本稿では,Solidityスマートコントラクトに特化して設計された自動脆弱性解析ツールの実証評価を行う。
行レベルの脆弱性ラベルを手動でアノテートした2,182インスタンスのアノテートデータセットを用いて評価を行った。
私たちは、最大76.78%の脆弱性を発見できる3つのツールのセットを特定しました。
論文 参考訳(メタデータ) (2025-05-21T17:01:18Z) - Understanding the AI-powered Binary Code Similarity Detection [41.39226562321616]
AIによるバイナリコード類似度検出(BinSD)は、プログラム分析に広く応用されている。
BinSD問題がどの程度解決されたか、特に現実世界のアプリケーションで定量的に理解することは困難である。
本稿では,最先端AIを用いたBinSD手法の体系的評価を行う。
論文 参考訳(メタデータ) (2024-10-10T02:13:01Z) - Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - SAFE: Advancing Large Language Models in Leveraging Semantic and Syntactic Relationships for Software Vulnerability Detection [23.7268575752712]
ソフトウェア脆弱性(SV)は、安全クリティカルなセキュリティシステムにとって、一般的かつ重要な懸念事項として浮上している。
本稿では,SVDのソースコードデータから意味的・統語的関係を学習し,活用するための大規模言語モデルの能力を高める新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T00:49:02Z) - Vulnerability Detection with Code Language Models: How Far Are We? [40.455600722638906]
PrimeVulは、脆弱性検出のためのコードLMのトレーニングと評価のための新しいデータセットである。
これは、人間の検証されたベンチマークに匹敵するラベルの精度を達成する、新しいデータラベリング技術を含んでいる。
また、厳密なデータ重複解消戦略と時系列データ分割戦略を実装して、データの漏洩問題を軽減している。
論文 参考訳(メタデータ) (2024-03-27T14:34:29Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。