論文の概要: A Large Scale Study of AI-based Binary Function Similarity Detection Techniques for Security Researchers and Practitioners
- arxiv url: http://arxiv.org/abs/2511.01180v1
- Date: Mon, 03 Nov 2025 03:10:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.09478
- Title: A Large Scale Study of AI-based Binary Function Similarity Detection Techniques for Security Researchers and Practitioners
- Title(参考訳): セキュリティ研究者と実践者を対象としたAIに基づくバイナリ関数類似性検出手法の大規模研究
- Authors: Jingyi Shi, Yufeng Chen, Yang Xiao, Yuekang Li, Zhengzi Xu, Sihao Qiu, Chi Zhang, Keyu Qi, Yeting Li, Xingchu Chen, Yanyan Zou, Yang Liu, Wei Huo,
- Abstract要約: バイナリ関数類似性検出(BFSD)は、ソフトウェアセキュリティの基本技術である。
AIベースのBFSDツールの最近の進歩は、大幅なパフォーマンス向上につながっている。
このギャップに対処するために,AIベースのBFSDツールに関する大規模な実証的研究を行った。
- 参考スコア(独自算出の注目度): 20.470574733047442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Binary Function Similarity Detection (BFSD) is a foundational technique in software security, underpinning a wide range of applications including vulnerability detection, malware analysis. Recent advances in AI-based BFSD tools have led to significant performance improvements. However, existing evaluations of these tools suffer from three key limitations: a lack of in-depth analysis of performance-influencing factors, an absence of realistic application analysis, and reliance on small-scale or low-quality datasets. In this paper, we present the first large-scale empirical study of AI-based BFSD tools to address these gaps. We construct two high-quality and diverse datasets: BinAtlas, comprising 12,453 binaries and over 7 million functions for capability evaluation; and BinAres, containing 12,291 binaries and 54 real-world 1-day vulnerabilities for evaluating vulnerability detection performance in practical IoT firmware settings. Using these datasets, we evaluate nine representative BFSD tools, analyze the challenges and limitations of existing BFSD tools, and investigate the consistency among BFSD tools. We also propose an actionable strategy for combining BFSD tools to enhance overall performance (an improvement of 13.4%). Our study not only advances the practical adoption of BFSD tools but also provides valuable resources and insights to guide future research in scalable and automated binary similarity detection.
- Abstract(参考訳): バイナリ関数類似性検出(BFSD)はソフトウェアセキュリティの基本技術であり、脆弱性検出、マルウェア解析など幅広いアプリケーションを支える。
AIベースのBFSDツールの最近の進歩は、大幅なパフォーマンス向上につながっている。
しかし、これらのツールの既存の評価には、パフォーマンスに影響する要因の詳細な分析の欠如、現実的なアプリケーション分析の欠如、小規模または低品質のデータセットへの依存の3つの重要な制限がある。
本稿では,このギャップに対処するAIベースのBFSDツールについて,大規模な実証的研究を行った。
BinAtlasは12,453のバイナリと700万以上の関数で構成され、BinAresは12,291のバイナリと54の現実世界の1日間の脆弱性を含み、実際のIoTファームウェア設定で脆弱性検出性能を評価する。
これらのデータセットを用いて,9つの代表的なBFSDツールを評価し,既存のBFSDツールの課題と限界を分析し,BFSDツール間の一貫性を検討する。
また,BFSDツールを組み合わせて総合的な性能向上を図るための実用的な戦略を提案する(13.4%の改善)。
我々の研究は、BFSDツールの実用化を前進させるだけでなく、スケーラブルで自動化されたバイナリ類似性検出における将来の研究をガイドするための貴重なリソースや洞察も提供します。
関連論文リスト
- Ensembling Large Language Models for Code Vulnerability Detection: An Empirical Evaluation [69.8237598448941]
本研究では,ソースコードの脆弱性検出において,Large Language Models(LLM)の性能を高めるためのアンサンブル学習の可能性を検討する。
脆弱性検出に適したスタック機能であるDynamic Gated Stacking (DGS)を提案する。
論文 参考訳(メタデータ) (2025-09-16T03:48:22Z) - Revisiting Third-Party Library Detection: A Ground Truth Dataset and Its Implications Across Security Tasks [12.328841506102963]
6000以上のアプリを対象に,最先端の10個のTPL検出技術に関する大規模な実証的研究を行った。
我々の評価は、ツールの脆弱性をR8時代の変換、バージョン識別の弱い、候補ライブラリの不正確な対応、類似性のしきい値の一般化の難しさ、大規模実行時のランタイム/メモリオーバーヘッドを禁止している。
論文 参考訳(メタデータ) (2025-09-04T10:48:02Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Advancing Tool-Augmented Large Language Models via Meta-Verification and Reflection Learning [63.2198957755528]
本稿では,2つの重要なイノベーションを通じてシステム2推論を包括的に行う新しいツール拡張LDMであるTool-MVRを提案する。
具体的には、まず、API、クエリ、推論トラジェクトリを厳格に検証する体系的なパイプラインであるMulti-Agent Meta-Verification(MAMV)を紹介します。
第2に,ツールフィードバックを活用することで,ツールのリフレクション機能を向上させるExploration-based Reflection Learning (EXPLORE)を提案する。
論文 参考訳(メタデータ) (2025-06-05T04:35:49Z) - An Empirical Analysis of Vulnerability Detection Tools for Solidity Smart Contracts Using Line Level Manually Annotated Vulnerabilities [5.357551358237259]
本稿では,Solidityスマートコントラクトに特化して設計された自動脆弱性解析ツールの実証評価を行う。
行レベルの脆弱性ラベルを手動でアノテートした2,182インスタンスのアノテートデータセットを用いて評価を行った。
私たちは、最大76.78%の脆弱性を発見できる3つのツールのセットを特定しました。
論文 参考訳(メタデータ) (2025-05-21T17:01:18Z) - Understanding the AI-powered Binary Code Similarity Detection [41.39226562321616]
AIによるバイナリコード類似度検出(BinSD)は、プログラム分析に広く応用されている。
BinSD問題がどの程度解決されたか、特に現実世界のアプリケーションで定量的に理解することは困難である。
本稿では,最先端AIを用いたBinSD手法の体系的評価を行う。
論文 参考訳(メタデータ) (2024-10-10T02:13:01Z) - Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - SAFE: Advancing Large Language Models in Leveraging Semantic and Syntactic Relationships for Software Vulnerability Detection [23.7268575752712]
ソフトウェア脆弱性(SV)は、安全クリティカルなセキュリティシステムにとって、一般的かつ重要な懸念事項として浮上している。
本稿では,SVDのソースコードデータから意味的・統語的関係を学習し,活用するための大規模言語モデルの能力を高める新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T00:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。