論文の概要: PEM: Representing Binary Program Semantics for Similarity Analysis via a
Probabilistic Execution Model
- arxiv url: http://arxiv.org/abs/2308.15449v2
- Date: Wed, 30 Aug 2023 01:57:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 12:06:36.363639
- Title: PEM: Representing Binary Program Semantics for Similarity Analysis via a
Probabilistic Execution Model
- Title(参考訳): PEM:確率的実行モデルによる類似性解析のためのバイナリプログラムセマンティクスの表現
- Authors: Xiangzhe Xu, Zhou Xuan, Shiwei Feng, Siyuan Cheng, Yapeng Ye, Qingkai
Shi, Guanhong Tao, Le Yu, Zhuo Zhang, and Xiangyu Zhang
- Abstract要約: 本稿では,バイナリプログラムのセマンティクスを表現する新しい手法を提案する。
対象バイナリの入力空間とプログラムパス空間を効果的にサンプリングできる新しい確率的実行エンジンに基づいている。
実世界の35k機能を有する9つのプロジェクトに対する評価と6つの最先端技術との比較により,PEMは一般的な設定で96%の精度を達成できることが示された。
- 参考スコア(独自算出の注目度): 25.014876893315208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Binary similarity analysis determines if two binary executables are from the
same source program. Existing techniques leverage static and dynamic program
features and may utilize advanced Deep Learning techniques. Although they have
demonstrated great potential, the community believes that a more effective
representation of program semantics can further improve similarity analysis. In
this paper, we propose a new method to represent binary program semantics. It
is based on a novel probabilistic execution engine that can effectively sample
the input space and the program path space of subject binaries. More
importantly, it ensures that the collected samples are comparable across
binaries, addressing the substantial variations of input specifications. Our
evaluation on 9 real-world projects with 35k functions, and comparison with 6
state-of-the-art techniques show that PEM can achieve a precision of 96% with
common settings, outperforming the baselines by 10-20%.
- Abstract(参考訳): binary similarity analysisは、2つのバイナリ実行ファイルが同じソースプログラムのものであるかどうかを判断する。
既存の技術は静的および動的プログラム機能を利用し、高度なディープラーニング技術を利用する。
彼らは大きな可能性を示したが、コミュニティはプログラムの意味論をより効果的に表現することで、類似性分析をさらに改善できると考えている。
本稿では,バイナリプログラムのセマンティクスを表現する新しい手法を提案する。
これは、対象バイナリの入力空間とプログラムパス空間を効果的にサンプリングできる、新しい確率的実行エンジンに基づいている。
さらに重要なことは、収集されたサンプルがバイナリ間で同等であることを保証することで、入力仕様のかなりのバリエーションに対処する。
実世界の9つのプロジェクトにおける35k関数の評価と6つの最先端技術との比較により,PEMは共通設定で96%の精度を達成でき,ベースラインを10~20%上回る結果となった。
関連論文リスト
- TRIAD: Automated Traceability Recovery based on Biterm-enhanced
Deduction of Transitive Links among Artifacts [53.92293118080274]
トレーサビリティにより、ステークホルダは、ソフトウェアライフサイクル全体で導入されたソフトウェアアーティファクト間のトレースリンクを抽出し、理解することができます。
ほとんどの場合、Information Retrieval (IR) など、ソフトウェアアーティファクト間のテキストの類似性に依存している。
論文 参考訳(メタデータ) (2023-12-28T06:44:24Z) - Improved Tree Search for Automatic Program Synthesis [91.3755431537592]
重要な要素は、有効なプログラムの空間における効率的な探索を可能にすることである。
ここでは2つの大きな異なるDSL上でのアート結果の状態を導くMCTSの変種を提案する。
論文 参考訳(メタデータ) (2023-03-13T15:09:52Z) - AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets [27.022212653067367]
本稿では,重みとアクティベーションを共に1ビット値に分割したBNN(Binary Neural Networks)について検討する。
最適二元集合を適応的に得るために、AdaBin と呼ばれる単純で効果的なアプローチを提案する。
ベンチマークモデルとデータセットの実験結果は、提案されたAdaBinが最先端のパフォーマンスを達成可能であることを示している。
論文 参考訳(メタデータ) (2022-08-17T05:43:33Z) - MAGPIE: Machine Automated General Performance Improvement via Evolution
of Software [19.188864062289433]
MAGPIEは統合されたソフトウェア改善フレームワークである。
共通の編集シーケンスに基づく表現を提供し、特定の改善テクニックから探索プロセスを分離する。
論文 参考訳(メタデータ) (2022-08-04T17:58:43Z) - Learning from Self-Sampled Correct and Partially-Correct Programs [96.66452896657991]
そこで本研究では,モデルが学習中にサンプリングを行い,自己サンプリングされた完全正当プログラムと部分正当プログラムの両方から学習することを提案する。
自己サンプリング型プログラムと部分修正型プログラムを併用することで,学習とサンプリングプロセスのガイドに役立てることができることを示す。
提案手法は,MLEを用いた単一の参照プログラムからの学習と比較して,パス@kの性能を3.1%から12.3%向上させる。
論文 参考訳(メタデータ) (2022-05-28T03:31:07Z) - Natural Language to Code Translation with Execution [82.52142893010563]
実行結果-プログラム選択のための最小ベイズリスク復号化。
そこで本研究では,自然言語からコードへのタスクにおいて,事前訓練されたコードモデルの性能を向上することを示す。
論文 参考訳(メタデータ) (2022-04-25T06:06:08Z) - Enforcing Consistency in Weakly Supervised Semantic Parsing [68.2211621631765]
本稿では,関連する入力に対する出力プログラム間の整合性を利用して,スプリアスプログラムの影響を低減することを提案する。
より一貫性のあるフォーマリズムは、一貫性に基づくトレーニングを必要とせずに、モデルパフォーマンスを改善することにつながります。
論文 参考訳(メタデータ) (2021-07-13T03:48:04Z) - Semantic-aware Binary Code Representation with BERT [27.908093567605484]
バグ発見、マルウェア分析、コードクローン検出など、幅広いバイナリ分析アプリケーションでは、バイナリコード上でのコンテキスト意味の回復が必要である。
近年,バイナリのコード表現を自動再構築するために,機械学習に基づくバイナリ解析手法が提案されている。
本稿では,バイナリコードのセマンティックなコード表現を生成するためにBERTを利用するDeepSemanticを提案する。
論文 参考訳(メタデータ) (2021-06-10T03:31:29Z) - Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。
モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。
これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文 参考訳(メタデータ) (2020-12-23T20:40:18Z) - Improving the Effectiveness of Traceability Link Recovery using
Hierarchical Bayesian Networks [21.15456830607455]
We implement a HierarchiCal Probabilistic Model for SoftwarE Traceability (Comet)
彗星は、テキスト類似性の複数の尺度の相補的な観察能力を組み合わせることで、人工物間の関係をモデル化することができる。
我々は、最適に設定されたベースラインのセットに対する改善を示す、Cometの包括的な経験的評価を行う。
論文 参考訳(メタデータ) (2020-05-18T19:38:29Z) - Bin2vec: Learning Representations of Binary Executable Programs for
Security Tasks [15.780176500971244]
我々は、計算プログラムグラフとともに、GCN(Graph Convolutional Networks)を活用する新しいアプローチであるBin2vecを紹介する。
我々は,2つの意味的に異なるバイナリ解析タスクを解くために,我々の表現を用いることで,このアプローチの汎用性を実証する。
我々は、ソースコードベースのinst2vecアプローチと比較して、分類誤差を40%削減して、新しい最先端結果を設定した。
論文 参考訳(メタデータ) (2020-02-09T15:46:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。