論文の概要: Boosting Pointer Analysis With Large Language Model-Enhanced Allocation Function Detection
- arxiv url: http://arxiv.org/abs/2509.22530v1
- Date: Fri, 26 Sep 2025 16:08:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.57391
- Title: Boosting Pointer Analysis With Large Language Model-Enhanced Allocation Function Detection
- Title(参考訳): 大規模言語モデルによるアロケーション関数検出を用いたブースティングポインター解析
- Authors: Baijun Cheng, Kailong Wang, Ling Shi, Haoyu Wang, Peng Di, Yao Guo, Ding Li, Xiangqun Chen,
- Abstract要約: 既存のアプローチは、主にカスタムアロケータを見落とし、粗いエイリアスと分析精度の低下につながる。
AFDは、カスタムアロケーション関数を自動的に識別し、モデル化することにより、ポインタ解析を強化する新しい技術である。
AFDを実世界の15のプロジェクトで評価し,600以上のカスタムAFを同定した。
- 参考スコア(独自算出の注目度): 17.94389997355635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pointer analysis is foundational for many static analysis tasks, yet its effectiveness is often hindered by imprecise modeling of heap allocations, particularly in C/C++ programs where user-defined allocation functions (AFs) are pervasive. Existing approaches largely overlook these custom allocators, leading to coarse aliasing and reduced analysis precision. In this paper, we present AFD, a novel technique that enhances pointer analysis by automatically identifying and modeling custom allocation functions. AFD employs a hybrid approach: it uses value-flow analysis to detect straightforward wrappers and leverages Large Language Models (LLMs) to reason about more complex allocation patterns with side effects. This targeted enhancement enables precise modeling of heap objects at each call site, achieving context-sensitivity-like benefits without the associated overhead. We evaluate AFD on 15 real-world C projects, identifying over 600 custom AFs. Integrating AFD into a baseline pointer analysis yields a 26x increase in modeled heap objects and a 39% reduction in alias set sizes, with only 1.4x runtime overhead. Furthermore, our enhanced analysis improves indirect call resolution and uncovers 17 previously undetected memory bugs. These results demonstrate that precise modeling of custom allocation functions offers a scalable and practical path to improving pointer analysis in large software systems.
- Abstract(参考訳): ポインタ解析は多くの静的解析タスクの基礎となっているが、特にユーザ定義のアロケーション関数(AF)が普及しているC/C++プログラムにおいて、その有効性はヒープ割り当ての不正確なモデリングによって妨げられることが多い。
既存のアプローチは主にこれらのカスタムアロケータを見落とし、粗いエイリアスと分析精度の低下につながる。
本稿では,カスタムアロケーション関数の自動識別とモデリングによりポインタ解析を強化する新しい手法であるAFDを提案する。
AFDは、バリューフロー分析を使って単純なラッパーを検出し、LLM(Large Language Models)を利用して、副作用を伴うより複雑なアロケーションパターンを推論する。
このターゲット拡張により、各コールサイトにおけるヒープオブジェクトの正確なモデリングが可能になり、関連するオーバーヘッドを伴わずに、コンテキスト感度のようなメリットを実現することができる。
AFDを実世界の15のプロジェクトで評価し,600以上のカスタムAFを同定した。
AFDをベースラインポインタ解析に統合すると、モデル化されたヒープオブジェクトが26倍増加し、エイリアスセットのサイズが39%減少し、ランタイムオーバーヘッドは1.4倍になる。
さらに、拡張分析により間接呼び出しの解像度が向上し、これまで検出されていなかった17のメモリバグが明らかになった。
これらの結果は、大規模ソフトウェアシステムにおけるポインタ解析を改善するために、カスタムアロケーション関数の正確なモデリングがスケーラブルで実践的な方法であることを示している。
関連論文リスト
- How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.114899897566964]
マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文 参考訳(メタデータ) (2025-08-28T15:57:33Z) - Flow Sensitivity without Control Flow Graph: An Efficient Andersen-Style Flow-Sensitive Pointer Analysis [4.513381877696149]
フローセンシティブなポインタ分析は、エイリアス解析、テイント分析、プログラム理解、コンパイラ最適化などに広く使われている。
制御フローグラフに基づく既存のフローセンシティブなポインタ解析手法は,ポインタ解析の精度を大幅に向上させた。
制御フローグラフ解析の非効率性を克服するフローセンシティブなポインタ解析であるCG-FSPTAを提案する。
論文 参考訳(メタデータ) (2025-08-04T01:20:54Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Semantic-Enhanced Indirect Call Analysis with Large Language Models [14.517268546437917]
本稿では,間接的呼分析の有効性を高めるためにセマンティック・エンハンスメント・アナリティクス(SEA)を提案する。
一般的なプログラミングのプラクティスでは、間接呼び出しは、しばしば呼び出されたターゲットとセマンティックな類似性を示す。
SEAは、複数の視点から間接呼び出しとターゲット関数の両方の自然言語要約を生成する。
論文 参考訳(メタデータ) (2024-08-08T10:04:50Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - The Hitchhiker's Guide to Program Analysis: A Journey with Large
Language Models [18.026567399243]
大規模言語モデル(LLM)は静的解析に代わる有望な選択肢を提供する。
本稿では,LLM支援静的解析のオープン空間を深く掘り下げる。
LLiftは,静的解析ツールとLLMの両方を併用した,完全に自動化されたフレームワークである。
論文 参考訳(メタデータ) (2023-08-01T02:57:43Z) - Learning Dynamic Compact Memory Embedding for Deformable Visual Object
Tracking [82.34356879078955]
本稿では,セグメント化に基づく変形可能な視覚追跡手法の識別を強化するために,コンパクトなメモリ埋め込みを提案する。
DAVIS 2017ベンチマークでは,D3SやSiamMaskなどのセグメンテーションベースのトラッカーよりも優れている。
論文 参考訳(メタデータ) (2021-11-23T03:07:12Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。