Fugu-MT 論文翻訳(概要): Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity Detection by Incorporating Domain Knowledge

論文の概要: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity Detection by Incorporating Domain Knowledge

arxiv url: http://arxiv.org/abs/2301.00511v2
Date: Mon, 22 May 2023 02:01:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-24 13:48:17.442954
Title: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity Detection by Incorporating Domain Knowledge
Title（参考訳）: asteria-pro: ドメイン知識を組み込んだディープラーニングベースのバイナリコード類似性検出
Authors: Shouguo Yang, Chaopeng Dong, Yang Xiao, Yiran Cheng, Zhiqiang Shi, Zhi Li, and Limin Sun
Abstract要約: 本稿では,ドメイン知識に基づく事前フィルタリングと再分類モジュールを組み込んだ新しいディープラーニング強化アーキテクチャを提案する。 Asteria-Proは、高い精度で1,482の脆弱な関数を91.65%検出する。
参考スコア（独自算出の注目度）: 8.93208472340743
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The widespread code reuse allows vulnerabilities to proliferate among a vast variety of firmware. There is an urgent need to detect these vulnerable code effectively and efficiently. By measuring code similarities, AI-based binary code similarity detection is applied to detecting vulnerable code at scale. Existing studies have proposed various function features to capture the commonality for similarity detection. Nevertheless, the significant code syntactic variability induced by the diversity of IoT hardware architectures diminishes the accuracy of binary code similarity detection. In our earlier study and the tool Asteria, we adopt a Tree-LSTM network to summarize function semantics as function commonality and the evaluation result indicates an advanced performance. However, it still has utility concerns due to excessive time costs and inadequate precision while searching for large-scale firmware bugs. To this end, we propose a novel deep learning enhancement architecture by incorporating domain knowledge-based pre-filtration and re-ranking modules, and we develop a prototype based on Asteria called Asteria-Pro. Pre-filtration module seeks to eliminates dissimilar functions to boost subsequent deep learning model calculations, while re-ranking module aims to raises the rankings of vulnerable functions among candidates generated by deep learning model. Our evaluation indicates that pre-filtration module cuts the calculation time by 96.9% and re-ranking improves MRR and Recall by 23.71% and 36.4%. By incorporating the pre-filtration and re-ranking modules, Asteria-Pro outperforms existing state-of-the-art approaches in bug search task, by a significant large margin. We conduct a large-scale real-world firmware bug search and Asteria-Pro manages to detect 1,482 vulnerable functions with a high precision 91.65%.
Abstract（参考訳）: コード再利用の普及により、さまざまなファームウェア間で脆弱性が拡散する。脆弱性のあるコードを効果的かつ効率的に検出する必要がある。コード類似度を測定することにより、AIベースのバイナリコード類似度検出が、大規模な脆弱性コードの検出に適用される。既存の研究は類似性検出の共通性を捉えるために様々な機能的特徴を提案している。しかしながら、iotハードウェアアーキテクチャの多様性によって引き起こされる重要なコード構文の変動性は、バイナリコードの類似性検出の精度を低下させる。先行研究とツールasteriaでは,tree-lstmネットワークを用いて関数意味論を関数の共通性として要約し,評価結果から高度な性能を示す。しかし、大規模なファームウェアのバグを探しながら、過度な時間的コストと不適切な精度のために、実用上の懸念がある。この目的のために,ドメイン知識に基づく事前フィルタリングと再ランキングモジュールを組み込んだ新しいディープラーニング拡張アーキテクチャを提案し,asteria-proと呼ばれるasteriaベースのプロトタイプを開発した。事前フィルタリングモジュールは、その後のディープラーニングモデル計算を促進するために異種関数を排除し、再ランク付けモジュールは、ディープラーニングモデルが生成する候補の中で脆弱な関数のランクを上げることを目的としている。評価の結果, プレフィルタモジュールは計算時間を96.9%削減し, MRRとリコールを23.71%, 36.4%改善した。 Asteria-Proは、プレフィルタと再ランクモジュールを組み込むことで、バグ検索タスクにおける既存の最先端のアプローチよりも大幅にパフォーマンスが向上する。我々は大規模な実世界のファームウェアのバグサーチを行い、Asteria-Proは91.65%の精度で1,482の脆弱な機能を検出する。

関連論文リスト

ReSIM: Re-ranking Binary Similarity Embeddings to Improve Function Search Performance [6.94939106765873]
本稿では,ニューラルリランカを用いた埋め込み型検索を補完する新しい機能検索システムであるReSIMを紹介する。 2つのベンチマークデータセット上に7つの埋め込みモデルにまたがってReSIMを評価し、探索効率を一貫した改善を実証した。
論文参考訳（メタデータ） (2026-02-10T08:57:49Z)
Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3202103799131795]
SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。 SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文参考訳（メタデータ） (2026-02-02T23:55:08Z)
Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文参考訳（メタデータ） (2025-10-13T07:35:04Z)
Ensembling Large Language Models for Code Vulnerability Detection: An Empirical Evaluation [69.8237598448941]
本研究では,ソースコードの脆弱性検出において,Large Language Models(LLM)の性能を高めるためのアンサンブル学習の可能性を検討する。脆弱性検出に適したスタック機能であるDynamic Gated Stacking (DGS)を提案する。
論文参考訳（メタデータ） (2025-09-16T03:48:22Z)
MalCodeAI: Autonomous Vulnerability Detection and Remediation via Language Agnostic Code Reasoning [0.0]
MalCodeAIは、自律的なコードセキュリティ分析と修復のための言語に依存しないパイプラインである。コード分解と意味推論をQwen2.5-Coder-3B-Instructモデルで組み合わせる。 MalCodeAIは、レッドハットスタイルのエクスプロイトトレース、CVSSベースのリスクスコアリング、ゼロショットの一般化をサポートし、複雑なゼロデイ脆弱性を検出する。
論文参考訳（メタデータ） (2025-07-15T01:25:04Z)
Dense Object Detection Based on De-homogenized Queries [12.33849715319161]
デンス物体検出は、自動走行、ビデオ監視、その他の分野で広く利用されている。現在、非最大抑圧(NMS)のような欲求的アルゴリズムに基づく検出手法は、密集したシナリオにおいて繰り返し予測や欠落検出をしばしば生成している。終端から終端までのDETR(Detection TRansformer)をNMSなどの後処理の復号化能力をネットワークに組み込む検知器として利用することで,クエリベースの検出器における均一なクエリがネットワークの復号化能力とエンコーダの学習効率を低下させることがわかった。
論文参考訳（メタデータ） (2025-02-11T02:36:10Z)
Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。 IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-10-24T09:09:20Z)
R+R: Revisiting Static Feature-Based Android Malware Detection using Machine Learning [4.014524824655106]
マシンラーニング(ML)を使用した静的な機能ベースのAndroidマルウェア検出は、そのスケーラビリティと効率性から、依然として重要な課題である。既存のアプローチは、しばしばセキュリティクリティカルな懸念を無視する。本稿では,モデル選択と評価のための厳密な手法を提案する。
論文参考訳（メタデータ） (2024-09-11T16:37:50Z)
Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification [6.975902383951604]
現在の手法は、予測不可能なアウトリーチ分布で困難に直面している。本稿では,これらの課題に対処するため,Dual for Threshold-Based Re-Classification (DETER)を提案する。我々のモデルは以前のベンチマークより優れており、未知のインテントに対するF1スコアの13%と5%に向上しています。
論文参考訳（メタデータ） (2024-05-30T11:46:42Z)
Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。提案手法の有効性を広範囲な実験により実証する。
論文参考訳（メタデータ） (2024-04-06T13:14:04Z)
Code Detection for Hardware Acceleration Using Large Language Models [0.0]
本研究は,大規模言語モデル(LLM)を用いたコード検出の最初の解析である。コード検出のための予備的かつ素直なプロンプトと,新しいプロンプト戦略を提案する。その結果, GEMM, 畳み込み, FFTでは68.8%, 22.3%, 79.2%の精度が得られた。我々の新たなプロンプト戦略は偽陽性を大幅に減らし, 総合的精度(91.1%, 97.9%, 99.7%)は良好である。
論文参考訳（メタデータ） (2023-07-19T17:21:58Z)
A Dependable Hybrid Machine Learning Model for Network Intrusion Detection [1.222622290392729]
本稿では,機械学習とディープラーニングを組み合わせたハイブリッドモデルを提案する。提案手法は,KDDCUP'99とCIC-MalMem-2022の2つのデータセットでテストした場合,優れた結果が得られる。
論文参考訳（メタデータ） (2022-12-08T20:19:27Z)
UniASM: Binary Code Similarity Detection without Fine-tuning [0.8271859911016718]
バイナリ関数の表現を学習するために,UniASMと呼ばれるトランスフォーマーベースのバイナリコード埋め込みモデルを提案する。既知の脆弱性検索の現実的なタスクでは、UniASMは現在のベースラインをすべて上回っている。
論文参考訳（メタデータ） (2022-10-28T14:04:57Z)
Clear Memory-Augmented Auto-Encoder for Surface Defect Detection [10.829080460965478]
本稿では,異常な前景を修復し,背景を鮮明に保存するメモリ拡張オートエンコーダを提案する。できるだけ現実的で機能豊富な異常をシミュレートするために, 汎用的な人工異常生成アルゴリズムを提案する。最後に,欠陥セグメンテーションのための新しいマルチスケール特徴残差検出法を提案する。
論文参考訳（メタデータ） (2022-08-08T02:39:03Z)
Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文参考訳（メタデータ） (2021-03-23T19:45:26Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)
Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文参考訳（メタデータ） (2020-05-21T06:11:33Z)
Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。我々は,再建基準の代替として,異常スコアの代替尺度を提案した。提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文参考訳（メタデータ） (2020-03-24T08:26:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。