論文の概要: Agentic Interpretation: Lattice-Structured Evidence for LLM-Based Program Analysis
- arxiv url: http://arxiv.org/abs/2605.12694v1
- Date: Tue, 12 May 2026 19:46:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.652752
- Title: Agentic Interpretation: Lattice-Structured Evidence for LLM-Based Program Analysis
- Title(参考訳): エージェント解釈:LCMに基づくプログラム解析のための格子構造的エビデンス
- Authors: Jacqueline L. Mitchell, Chao Wang,
- Abstract要約: 本稿では,格子に基づく静的解析の原理をプログラム推論に適用するフレームワークであるエージェント解釈を提案する。
ワークリストアルゴリズムは、分析中にクレームとその判断がどのように進化するかを決定する。
- 参考スコア(独自算出の注目度): 2.1833756646187763
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models can consult information that fixed static analyzers cannot, such as documentation, current security advisories, version-specific metadata, and informal API contracts. This makes LLMs a compelling option for program analyses that depend on information beyond the source program, or that are otherwise not amenable to conventional static analyzers. However, directly asking an LLM for a one-shot whole-program analysis is brittle because it compresses many evidence-dependent judgments into a single opaque answer, rather than exposing which conclusions are supported or disputed and using intermediate findings to guide later, more focused searches. In this paper, we propose agentic interpretation, a framework that brings the discipline of lattice-based static analysis to LLM-driven program reasoning. At a high level, agentic interpretation decomposes a high-level analysis goal into localized claims, and tracks the LLM's judgment about each claim in a finite-height lattice. A worklist algorithm governs how claims and their judgments evolve during the analysis. We introduce a formal model of agentic interpretation, explore the design space it opens, and illustrate the approach with a worked example analyzing code that depends on opaque third-party components.
- Abstract(参考訳): 大きな言語モデルは、ドキュメント、現在のセキュリティアドバイザリ、バージョン固有のメタデータ、非公式APIコントラクトなど、固定静的アナライザができない情報を参照することができる。
これにより、LCMは、ソースプログラム以外の情報に依存するプログラム解析や、従来の静的アナライザでは利用できないプログラム解析に魅力的な選択肢となる。
しかし、LLMにワンショットのプログラム解析を依頼するのは、どの結論が支持されるか、議論されるかを明らかにするのではなく、多くの証拠に依存した判断を1つの不透明な回答に圧縮し、その後、より集中した探索をガイドするために中間的な結果を使用するため、脆弱である。
本稿では,格子に基づく静的解析の規律をLCM駆動型プログラム推論に適用するフレームワークであるエージェント解釈を提案する。
高レベルでは、エージェント的解釈は高レベルの分析目標を局所的なクレームに分解し、有限重格子内の各クレームに関するLCMの判断を追跡する。
ワークリストアルゴリズムは、分析中にクレームとその判断がどのように進化するかを決定する。
エージェント解釈の形式モデルを導入し、オープンする設計空間を探索し、不透明なサードパーティコンポーネントに依存したコードを分析する。
関連論文リスト
- IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.32962597618861]
IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文 参考訳(メタデータ) (2025-05-23T09:37:52Z) - Flowco: Rethinking Data Analysis in the Age of LLMs [2.1874189959020427]
大規模言語モデル(LLM)は、単純なルーチン解析のためにそのようなコードを生成することができるようになった。
LLMは、限られたプログラミングの専門知識を持つ者がデータ分析を行うことで、データサイエンスの民主化を約束する。
多くの実世界のアナリストは、特定の分析手順をきめ細かな制御をしなければならない。
本稿では,これらの課題に対処する新たな混合開始システムであるFlowcoを紹介する。
論文 参考訳(メタデータ) (2025-04-18T19:01:27Z) - Understanding Formal Reasoning Failures in LLMs as Abstract Interpreters [5.468061853910803]
大規模言語モデル(LLM)からそのような推論を導き出すための2つの新しいプロンプト戦略を導入する。
ソフトウェア検証に広く用いられているSV-COMPベンチマークスイートから,22のプログラムに対して,最先端のLCMを用いてこれらの戦略を評価する。
論文 参考訳(メタデータ) (2025-03-16T23:05:52Z) - Investigating the Shortcomings of LLMs in Step-by-Step Legal Reasoning [34.427730009102966]
推論誤りを特定し,LLMの性能を評価するための自動評価フレームワークを開発した。
我々の研究は、論理集約的な複雑なタスクに対する推論チェーンの詳細なエラー解析に使用できる評価フレームワークとしても機能する。
論文 参考訳(メタデータ) (2025-02-08T19:49:32Z) - LLMSA: A Compositional Neuro-Symbolic Approach to Compilation-free and Customizable Static Analysis [13.993290878789779]
幻覚を減らしたコンパイル不要でカスタマイズ可能な静的解析のための合成ニューロシンボリックアプローチを提案する。
66.27%の精度と78.57%のリコールで、F1の工業的アプローチを0.20ポイント上回っている。
論文 参考訳(メタデータ) (2024-12-18T23:14:59Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - The Emergence of Large Language Models in Static Analysis: A First Look
through Micro-Benchmarks [3.848607479075651]
我々は,Pythonプログラムのコールグラフ解析と型推論を改善する上で,現在のLarge Language Models (LLM) が果たす役割について検討する。
本研究により, LLMは型推論において有望な結果を示し, 従来の手法よりも高い精度を示したが, コールグラフ解析では限界が認められた。
論文 参考訳(メタデータ) (2024-02-27T16:53:53Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z) - Sentiment Analysis through LLM Negotiations [58.67939611291001]
感情分析の標準的なパラダイムは、単一のLCMに依存して、その決定を1ラウンドで行うことである。
本稿では,感情分析のためのマルチLLMネゴシエーションフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-03T12:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。