Fugu-MT 論文翻訳(概要): StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation

論文の概要: StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation

arxiv url: http://arxiv.org/abs/2406.04568v1
Date: Fri, 7 Jun 2024 01:08:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-10 15:48:53.535185
Title: StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation
Title（参考訳）: StackSight: 大きな言語モデルとNeurosymbolic Chain-of-Thought逆コンパイルによるWebAssemblyの展開
Authors: Weike Fang, Zhejian Zhou, Junzhou He, Weihang Wang,
Abstract要約: StackSightは静的解析アルゴリズムを通じて仮想スタックの変更を視覚化し、追跡し、チェーン・オブ・シークレット・プロンプトを適用する。評価結果は、StackSightがWebAssemblyの逆コンパイルを大幅に改善していることを示している。またユーザ調査では、StackSightが生成したコードスニペットの勝利率が大幅に高く、コードのセマンティクスをよりよく把握できることを示した。
参考スコア（独自算出の注目度）: 2.1094456929188676
License: http://creativecommons.org/licenses/by/4.0/
Abstract: WebAssembly enables near-native execution in web applications and is increasingly adopted for tasks that demand high performance and robust security. However, its assembly-like syntax, implicit stack machine, and low-level data types make it extremely difficult for human developers to understand, spurring the need for effective WebAssembly reverse engineering techniques. In this paper, we propose StackSight, a novel neurosymbolic approach that combines Large Language Models (LLMs) with advanced program analysis to decompile complex WebAssembly code into readable C++ snippets. StackSight visualizes and tracks virtual stack alterations via a static analysis algorithm and then applies chain-of-thought prompting to harness LLM's complex reasoning capabilities. Evaluation results show that StackSight significantly improves WebAssembly decompilation. Our user study also demonstrates that code snippets generated by StackSight have significantly higher win rates and enable a better grasp of code semantics.
Abstract（参考訳）: WebAssemblyはWebアプリケーションでほぼネイティブな実行を可能にし、高いパフォーマンスと堅牢なセキュリティを必要とするタスクにますます採用されている。しかし、アセンブリライクな構文、暗黙のスタックマシン、低レベルのデータ型は、人間の開発者が理解するのが極めて困難であり、WebAssemblyのリバースエンジニアリング技術を効果的に必要とします。本稿では,大規模言語モデル(LLM)と高度なプログラム解析を組み合わせた新しいニューロシンボリックアプローチであるStackSightを提案し,複雑なWebAssemblyコードを読みやすいC++スニペットに分解する。 StackSightは静的解析アルゴリズムを通じて仮想スタックの変更を視覚化し追跡し、LLMの複雑な推論機能を活用するためにチェーン・オブ・シークレット・プロンプトを適用する。評価結果は、StackSightがWebAssemblyの逆コンパイルを大幅に改善していることを示している。ユーザ調査では、StackSightが生成したコードスニペットの勝利率が大幅に高く、コードのセマンティクスをよりよく把握できることを示した。

関連論文リスト

Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。 In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文参考訳（メタデータ） (2025-11-03T17:21:39Z)
WALT: Web Agents that Learn Tools [66.73502484310121]
WALTは、Webサイト機能を再利用不能なツールにリバースエンジニアリングするフレームワークである。 WALTはアドホックなスキルを仮説化するのではなく、既にウェブサイトに設計されている自動化の堅牢な実装を公開している。 VisualWebArenaとWebArenaでは、WALTはより少ないステップとLLM依存の推論でより高い成功を達成している。
論文参考訳（メタデータ） (2025-10-01T23:41:47Z)
WebThinker: Empowering Large Reasoning Models with Deep Research Capability [60.81964498221952]
WebThinkerは、大規模な推論モデルに、Webを自律的に検索し、Webページをナビゲートし、推論プロセス中に研究レポートをドラフトする権限を与えるディープリサーチエージェントである。また、textbf Autonomous Think-Search-and-Draft戦略を採用しており、モデルがシームレスに推論、情報収集、レポート作成をリアルタイムで行うことができる。我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文参考訳（メタデータ） (2025-04-30T16:25:25Z)
Reusing Legacy Code in WebAssembly: Key Challenges of Cross-Compilation and Code Semantics Preservation [4.796846173598521]
WebAssemblyコンパイラがコードの再利用性をどのように満たしているかを調査する。レガシーC/C++コードをWebAssemblyにクロスコンパイルする際の重要な課題を特定します。 WasmCheckerを使用して、WebAssemblyコンパイラが必ずしもコードセマンティクスを保存するとは限らないことを目撃する。
論文参考訳（メタデータ） (2024-12-28T20:24:41Z)
FullStack Bench: Evaluating LLMs as Full Stack Coders [108.63536080569877]
FullStack Benchは、幅広いアプリケーションドメインを含むフルスタックプログラミングに焦点を当てている。 FullStack Benchのマルチ言語プログラミング機能を評価するために,16の広く使用されているプログラミング言語から実世界の命令とそれに対応する単体テストケースを設計する。
論文参考訳（メタデータ） (2024-11-30T16:58:42Z)
EnStack: An Ensemble Stacking Framework of Large Language Models for Enhanced Vulnerability Detection in Source Code [1.9374282535132379]
本稿では,自然言語処理(NLP)技術を用いた脆弱性検出を支援する,新たなアンサンブルスタックフレームワークであるEnStackを紹介する。本手法は,コード理解に特化した複数の事前学習型大規模言語モデル(LLM)を相乗化する。メタ分類器はそれぞれのLSMの強度を集約し、微妙で複雑な脆弱性を検知する包括的なモデルをもたらす。
論文参考訳（メタデータ） (2024-11-25T16:47:10Z)
Is This the Same Code? A Comprehensive Study of Decompilation Techniques for WebAssembly Binaries [4.66875056781341]
本稿では,C-based decompilerの正確性,可読性,構造的類似性など,様々な側面から実験的に評価する新しいフレームワークを提案する。これによりWASMとネイティブバイナリに依存するソフトウェアシステムのセキュリティと信頼性が向上する。
論文参考訳（メタデータ） (2024-11-04T17:08:03Z)
Building Call Graph of WebAssembly Programs via Abstract Semantics [0.24103772239130034]
WebAssemblyは、ポータビリティとパフォーマンスに重点を置いて人気を集めているコードのバイナリフォーマットである。 WebAssemblyのバイナリフォーマットは、悪意のあるソフトウェアの手段として使用される傾向がある。 WebAssemblyのセキュリティ検証、情報フロー制御、より一般的には、行動特性を検証するツールの開発には、かなりの関心がある。
論文参考訳（メタデータ） (2024-07-08T09:32:47Z)
Multi-modal Learning for WebAssembly Reverse Engineering [7.18491643197374]
We present WasmRev, a first multi-modal pre-trained language model for WebAssembly reverse engineering。 WasmRevは大規模マルチモーダルコーパス上で自己教師型学習を用いて事前訓練される。 WasmRevを3つの重要なリバースエンジニアリングタスク、タイプリカバリ、関数目的の識別、WebAssemblyの要約に微調整します。
論文参考訳（メタデータ） (2024-04-04T03:03:38Z)
Code-Switched Language Identification is Harder Than You Think [69.63439391717691]
コードスイッチングは、文字と音声の通信において一般的な現象である。 CSコーパスの構築の応用について検討する。タスクをもっと多くの言語に拡張することで、タスクをより現実的にします。文レベルのマルチラベルタグ付け問題としてタスクを再構築し、より難易度の高いものにする。
論文参考訳（メタデータ） (2024-02-02T15:38:47Z)
SoK: Analysis techniques for WebAssembly [0.0]
WebAssemblyは低レベルのバイトコード言語で、C、C++、Rustといった言語をネイティブに近いパフォーマンスでブラウザで実行できる。 CやC++のようなメモリ不安全な言語の脆弱性は、WebAssemblyバイナリの脆弱性に変換できる。 WebAssemblyは暗号鍵のような悪意ある目的で使われてきた。
論文参考訳（メタデータ） (2024-01-11T14:28:13Z)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。 LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。 LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳（メタデータ） (2023-10-30T17:55:02Z)
When Do Program-of-Thoughts Work for Reasoning? [51.2699797837818]
本稿では,コードと推論能力の相関性を測定するために,複雑性に富んだ推論スコア(CIRS)を提案する。具体的には、抽象構文木を用いて構造情報をエンコードし、論理的複雑性を計算する。コードはhttps://github.com/zjunlp/EasyInstructのEasyInstructフレームワークに統合される。
論文参考訳（メタデータ） (2023-08-29T17:22:39Z)
CodeIE: Large Code Generation Models are Better Few-Shot Information Extractors [92.17328076003628]
大規模コーパスで事前訓練された大規模言語モデル(LLM)は、多くのNLPタスクにおいて、驚くべき数ショットの学習能力を示している。本稿では、自然言語の代わりに構造化された出力をコード形式で再キャストすることを提案する。
論文参考訳（メタデータ） (2023-05-09T18:40:31Z)
Enhancing Semantic Code Search with Multimodal Contrastive Learning and Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文参考訳（メタデータ） (2022-04-07T08:49:27Z)
COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。 COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文参考訳（メタデータ） (2020-10-19T13:53:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。