論文の概要: A Study of Rarely Appeared Instructions in an Executable Binary
- arxiv url: http://arxiv.org/abs/2310.08011v1
- Date: Thu, 12 Oct 2023 03:22:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:01:27.708177
- Title: A Study of Rarely Appeared Instructions in an Executable Binary
- Title(参考訳): 実行可能バイナリに出現する稀なインストラクションの検討
- Authors: Nozima Murodova, Hyungjoon Koo
- Abstract要約: 実行可能バイナリは通常、多数のマシン命令を含む。
本研究では,このような稀な命令を情報源レベルで詳細な解析により検討する。
- 参考スコア(独自算出の注目度): 2.327900742250532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An executable binary typically contains a large number of machine
instructions. Although the statistics of popular instructions is well known,
the distribution of non-popular instructions has been relatively under
explored. Our finding shows that an arbitrary group of binaries com es with
both i) a similar distribution of common machine instructions, and ii) quite a
few rarely appeared instructions (e.g., less than five occurrences) apart from
the distribution. Their infrequency may represent the signature of a code chunk
or the footprint of a binary. In this work, we investigate such rare
instructions with an in-depth analysis at the source level, clas sifying them
into four categories.
- Abstract(参考訳): 実行可能バイナリは通常、多数のマシン命令を含む。
一般的な命令の統計はよく知られているが、非人気命令の分布は比較的研究されている。
我々の発見は、任意のバイナリ群が両方と一致することを示している。
一 共通機械命令の類似の分布、及び
二 分布とは別に、稀に現れる指示(例5つ未満の指示)がかなり少ないこと。
その頻度はコードチャンクの署名やバイナリのフットプリントを表すこともある。
そこで本研究では,これらを4つのカテゴリに分類し,ソースレベルでの詳細な解析を行う。
関連論文リスト
- On the Role of Pre-trained Embeddings in Binary Code Analysis [7.161446721947512]
事前訓練されたアセンブリコードの埋め込みは、バイナリコード解析タスクを解決するためのゴールドスタンダードになっている。
自然言語処理とは対照的に、ラベル情報はバイナリコード解析において多くのタスクにおいて不足しない。
我々は,120万関数のコーパスを用いて,5つの下流タスクに対するアセンブリコードに対する最近の埋め込みを体系的に評価した。
論文 参考訳(メタデータ) (2025-02-12T10:50:46Z) - pyBregMan: A Python library for Bregman Manifolds [56.880400342980394]
ブレグマン多様体(英: Bregman manifold)は、情報幾何学における双対平坦空間であり、ブレグマン発散の正準発散として認められる。
本稿では,ブレグマン多様体上の汎用演算を実装した pyBregMan の設計について述べる。
このライブラリはまた、統計学、機械学習、情報融合などにおける様々なアプリケーションのためのいくつかのコアアルゴリズムも提供している。
論文 参考訳(メタデータ) (2024-08-08T02:38:19Z) - One Prompt is not Enough: Automated Construction of a Mixture-of-Expert Prompts [110.94724216491753]
大規模言語モデル(LLM)は、言語命令やコンテキスト内デモによって、強力な一般化能力を示す。
命令設計を自動化するために様々な手法が検討されてきたが、探索されたプロンプトを1つの命令に制限した。
我々はMixture-of-Expertパラダイムを採用し、問題空間を一連のサブリージョンに分割する。
地域ごとに専門的な専門家を構築するための2段階のプロセスが開発されている。
専門家1人当たりの命令の地域ベースの共同探索は、それに割り当てられたデモを補完し、相乗効果をもたらす。
論文 参考訳(メタデータ) (2024-06-28T23:05:08Z) - Unsupervised Binary Code Translation with Application to Code Similarity Detection and Vulnerability Discovery [2.022692275087205]
クロスアーキテクチャのバイナリコード解析が新たな問題となっている。
ディープラーニングベースのバイナリ分析は、有望な成功を収めている。
低リソースのISAでは、十分な量のデータを見つけることは困難である。
論文 参考訳(メタデータ) (2024-04-29T18:09:28Z) - How Far Have We Gone in Binary Code Understanding Using Large Language Models [51.527805834378974]
バイナリコード理解におけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。
評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文 参考訳(メタデータ) (2024-04-15T14:44:08Z) - CP-BCS: Binary Code Summarization Guided by Control Flow Graph and
Pseudo Code [79.87518649544405]
本稿ではCP-BCSと呼ばれる制御フローグラフと擬似コード案内バイナリコード要約フレームワークを提案する。
CP-BCSは双方向の命令レベル制御フローグラフと擬似コードを利用して、専門家の知識を取り入れ、包括的なバイナリ関数の実行動作と論理意味論を学ぶ。
論文 参考訳(メタデータ) (2023-10-24T14:20:39Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Further Decimating the Inductive Programming Search Space with
Instruction Digrams [0.0]
命令ダイアグラムを用いて,探索中の命令選択を制限できることが示される。
これにより、検索ベースの帰納的プログラミング技術を用いて生成できるプログラムのサイズが大幅に増大する。
論文 参考訳(メタデータ) (2023-05-22T15:58:18Z) - BinBert: Binary Code Understanding with a Fine-tunable and
Execution-aware Transformer [2.8523943706562638]
本稿では,新しいアセンブリコードモデルであるBinBertを紹介する。
BinBertは、アセンブリ命令シーケンスとシンボル実行情報の巨大なデータセットに基づいて事前トレーニングされたトランスフォーマー上に構築されている。
微調整を通じて、BinBertは特定のタスクに事前学習で得られた一般的な知識をどう適用するかを学ぶ。
論文 参考訳(メタデータ) (2022-08-13T17:48:52Z) - On component interactions in two-stage recommender systems [82.38014314502861]
2段階のレコメンデータは、YouTube、LinkedIn、Pinterestなど、多くのオンラインプラットフォームで使用されている。
ランク付け器と評価器の相互作用が全体の性能に大きく影響していることが示される。
特に、Mixture-of-Expertsアプローチを用いて、アイテムプールの異なるサブセットに特化するように、ノミネータを訓練する。
論文 参考訳(メタデータ) (2021-06-28T20:53:23Z) - Semantic-aware Binary Code Representation with BERT [27.908093567605484]
バグ発見、マルウェア分析、コードクローン検出など、幅広いバイナリ分析アプリケーションでは、バイナリコード上でのコンテキスト意味の回復が必要である。
近年,バイナリのコード表現を自動再構築するために,機械学習に基づくバイナリ解析手法が提案されている。
本稿では,バイナリコードのセマンティックなコード表現を生成するためにBERTを利用するDeepSemanticを提案する。
論文 参考訳(メタデータ) (2021-06-10T03:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。