論文の概要: When Dataflow Analysis Meets Large Language Models
- arxiv url: http://arxiv.org/abs/2402.10754v1
- Date: Fri, 16 Feb 2024 15:21:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-19 15:42:08.649556
- Title: When Dataflow Analysis Meets Large Language Models
- Title(参考訳): Dataflow Analysisが大規模言語モデルに出会ったとき
- Authors: Chengpeng Wang, Wuqi Zhang, Zian Su, Xiangzhe Xu, Xiaoheng Xie,
Xiangyu Zhang
- Abstract要約: 本稿では,LLMDFAについて述べる。LLMDFAはLLLMを利用したデータフロー解析フレームワークで,コンパイルインフラを必要とせずに任意のコードスニペットを解析する。
LLMDFAは、要約に基づくデータフロー分析にヒントを得て、問題を3つのサブプロブレムに分解し、いくつかの重要な戦略によって効果的に解決する。
評価の結果,本設計は幻覚を緩和し,推論能力を向上し,データフロー関連バグの検出において高い精度とリコールが得られることがわかった。
- 参考スコア(独自算出の注目度): 9.458251511218817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dataflow analysis is a powerful code analysis technique that reasons
dependencies between program values, offering support for code optimization,
program comprehension, and bug detection. Existing approaches require the
successful compilation of the subject program and customizations for downstream
applications. This paper introduces LLMDFA, an LLM-powered dataflow analysis
framework that analyzes arbitrary code snippets without requiring a compilation
infrastructure and automatically synthesizes downstream applications. Inspired
by summary-based dataflow analysis, LLMDFA decomposes the problem into three
sub-problems, which are effectively resolved by several essential strategies,
including few-shot chain-of-thought prompting and tool synthesis. Our
evaluation has shown that the design can mitigate the hallucination and improve
the reasoning ability, obtaining high precision and recall in detecting
dataflow-related bugs upon benchmark programs, outperforming state-of-the-art
(classic) tools, including a very recent industrial analyzer.
- Abstract(参考訳): データフロー分析は、プログラム値間の依存関係を推論し、コード最適化、プログラム理解、バグ検出をサポートする強力なコード解析技術である。
既存のアプローチでは、サブジェクトプログラムのコンパイルとダウンストリームアプリケーションのカスタマイズを成功させる必要がある。
本稿では,コンパイルインフラストラクチャを必要とせず任意のコードスニペットを解析し,下流アプリケーションを自動的に合成する,llmを活用したデータフロー解析フレームワークllmdfaを紹介する。
LLMDFAは、要約に基づくデータフロー分析にヒントを得て、問題を3つのサブプロブレムに分解する。
評価の結果,この設計は幻覚を緩和し,推論能力の向上,高精度化,ベンチマークプログラムにおけるデータフロー関連バグの検出におけるリコール,最新の産業分析装置を含む最先端(古典的)ツールよりも優れることが示された。
関連論文リスト
- An Extensible Framework for Architecture-Based Data Flow Analysis for Information Security [1.7749883815108154]
セキュリティ関連プロパティは、しばしばデータフロー図(DFD)に基づいて分析される
データフロー解析のためのオープンかつフレームワークを提案する。
このフレームワークはDFDと互換性があり、Palladioアーキテクチャ記述言語からデータフローを抽出することもできる。
論文 参考訳(メタデータ) (2024-03-14T13:52:41Z) - Characterization of Large Language Model Development in the Datacenter [57.49531095113406]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - A Thorough Examination of Decoding Methods in the Era of LLMs [76.30313058201182]
復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-10T11:14:53Z) - The Hitchhiker's Guide to Program Analysis: A Journey with Large
Language Models [18.026567399243]
大規模言語モデル(LLM)は静的解析に代わる有望な選択肢を提供する。
本稿では,LLM支援静的解析のオープン空間を深く掘り下げる。
LLiftは,静的解析ツールとLLMの両方を併用した,完全に自動化されたフレームワークである。
論文 参考訳(メタデータ) (2023-08-01T02:57:43Z) - FuzzyFlow: Leveraging Dataflow To Find and Squash Program Optimization
Bugs [92.47146416628965]
FuzzyFlowはプログラム最適化をテストするために設計されたフォールトローカライゼーションとテストケース抽出フレームワークである。
我々は、データフロープログラム表現を活用して、完全に再現可能なシステム状態と最適化のエリア・オブ・エフェクトをキャプチャする。
テスト時間を削減するため,テスト入力を最小限に抑えるアルゴリズムを設計し,再計算のためのメモリ交換を行う。
論文 参考訳(メタデータ) (2023-06-28T13:00:17Z) - Linear Temporal Logic Modulo Theories over Finite Traces (Extended
Version) [72.38188258853155]
有限トレース(LTLf)上の線形時間論理について検討する。
命題の文字は任意の理論で解釈された一階述語式に置き換えられる。
Satisfiability Modulo Theories (LTLfMT) と呼ばれる結果の論理は半決定可能である。
論文 参考訳(メタデータ) (2022-04-28T17:57:33Z) - Computing unsatisfiable cores for LTLf specifications [3.251765107970636]
有限トレース上の線形時間時間時間論理(LTLf)は、多くのアプリケーション領域で仕様を作成するためのデファクト標準になりつつある。
満足度チェックのための最先端手法を用いて、不満足なコアを抽出する4つのアルゴリズムを提案する。
結果は、異なるアルゴリズムやツールの実現可能性、有効性、相補性を示している。
論文 参考訳(メタデータ) (2022-03-09T16:08:43Z) - Indexing Context-Sensitive Reachability [16.114012813668932]
textscFlareは、文脈依存型データフロー解析のための従来のグラフ到達可能性問題から従来のグラフ到達性問題への還元である。
我々は,C/C++プログラムの文脈感性エイリアス解析と文脈感性情報フロー解析に適用した。
論文 参考訳(メタデータ) (2021-09-03T05:41:30Z) - Comparative Code Structure Analysis using Deep Learning for Performance
Prediction [18.226950022938954]
本稿では,アプリケーションの静的情報(抽象構文木やASTなど)を用いてコード構造の変化に基づいて性能変化を予測することの実現可能性を評価することを目的とする。
組込み学習手法の評価により,木系長短メモリ(LSTM)モデルでは,ソースコードの階層構造を利用して遅延表現を発見し,最大84%(個人的問題)と73%(複数の問題を含む組み合わせデータセット)の精度で性能変化を予測できることが示された。
論文 参考訳(メタデータ) (2021-02-12T16:59:12Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z) - Synthetic Datasets for Neural Program Synthesis [66.20924952964117]
本稿では,プログラムと仕様の両方で合成データ分布のバイアスを制御し,評価するための新しい手法を提案する。
そこで我々は,Karel DSLと小さなCalculator DSLを用いて,これらの分布上でのディープネットワークのトレーニングにより,分散一般化性能が向上することが実証された。
論文 参考訳(メタデータ) (2019-12-27T21:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。