論文の概要: LLM-based Resource-Oriented Intention Inference for Static Resource Leak
Detection
- arxiv url: http://arxiv.org/abs/2311.04448v2
- Date: Fri, 22 Dec 2023 02:33:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 18:11:39.207898
- Title: LLM-based Resource-Oriented Intention Inference for Static Resource Leak
Detection
- Title(参考訳): 静的リーク検出のためのLLMに基づくリソース指向意図推論
- Authors: Chong Wang, Jianan Liu, Xin Peng, Yang Liu, Yiling Lou
- Abstract要約: InferROIは、コード内のリソース指向の意図(取得、リリース、到達可能性検証)を推論する新しいアプローチである。
InferROIをJavaプログラム上で評価し、リソース指向の意図推論とリソースリーク検出の両面での有効性について検討する。
- 参考スコア(独自算出の注目度): 15.860114534748288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Resource leaks, caused by resources not being released after acquisition,
often lead to performance issues and system crashes. Existing static detection
techniques rely on mechanical matching of predefined resource
acquisition/release APIs, posing challenges to their effectiveness, including
completeness of predefined APIs, identification of reachability validation, and
analysis complexity. To overcome these challenges, we propose InferROI, a novel
approach that leverages large language models (LLMs) to directly infer
resource-oriented intentions (acquisition, release, and reachability
validation) in code, based on resource management knowledge and code context
understanding, rather than mechanical API matching. InferROI uses a prompt to
instruct the LLM in inferring involved intentions from a given code snippet,
which are then translated into formal expressions. By aggregating these
inferred intentions, InferROI utilizes a lightweight static-analysis based
algorithm to analyze control-flow paths extracted from the code, thereby
detecting resource leaks.
We evaluate InferROI on Java program and investigate its effectiveness in
both resource-oriented intention inference and resource leak detection.
Experimental results demonstrate that InferROI achieves a precision of 74.6%
and a recall of 81.8% in intention inference on 172 code snippets from the
DroidLeaks dataset. Additionally, InferROI covers a significant portion of
concerned Android resources listed in the dataset. When applied to 86 bugs from
the DroidLeaks dataset, InferROI exhibits a high bug detection rate (53.5%) and
a low false alarm rate (8.1%) compared to eight baseline detectors. Moreover,
we apply InferROI to resource leak detection in 100 methods from real-world
open-source projects, where it identifies 12 unknown resource leak bugs, with 7
of them being confirmed by developers.
- Abstract(参考訳): リソースリークは、買収後にリリースされないリソースによって引き起こされ、しばしばパフォーマンス上の問題やシステムクラッシュにつながる。
既存の静的検出技術は、事前定義されたリソース獲得/リリースapiの機械的マッチング、事前定義されたapiの完全性、到達可能性の検証の特定、分析の複雑さなど、その有効性への挑戦に依存する。
これらの課題を克服するために,我々は,機械的なapiマッチングではなく,リソース管理知識とコードコンテキスト理解に基づいて,コード内のリソース指向の意図(獲得,リリース,到達可能性検証)を直接推論するために,大規模言語モデル(llm)を活用する新しいアプローチであるinferroiを提案する。
InferROI は LLM に与えられたコードスニペットから関連する意図を推論するように指示するプロンプトを使用し、それを形式表現に変換する。
これらの推論された意図を集約することにより、InferROIは軽量な静的解析に基づくアルゴリズムを使用して、コードから抽出された制御-フローパスを分析し、リソースリークを検出する。
InferROIをJavaプログラム上で評価し、リソース指向の意図推論とリソースリーク検出の両面での有効性を検討する。
実験の結果、InferROIは74.6%の精度で、DroidLeaksデータセットから172のコードスニペットを意図的に推論して81.8%のリコールを達成した。
さらに、InferROIは、データセットにリストされているAndroidリソースのかなりの部分をカバーしている。
DroidLeaksデータセットの86のバグに適用すると、InferROIは8つのベースライン検出器と比較して高いバグ検出率(53.5%)と低い偽アラーム率(8.1%)を示す。
さらに,実世界のオープンソースプロジェクトからの100メソッドのリソースリーク検出にinferroiを適用し,未知の12のリソースリークバグを特定し,そのうち7つを開発者が確認した。
関連論文リスト
- On the Effectiveness of LLMs for Manual Test Verifications [1.920300814128832]
本研究の目的は,手動テストの検証にLarge Language Models (LLMs) を用いることである。
オープンソースモデル Mistral-7B と Phi-3-mini-4k は、クローズドソースモデルと同等の有効性と一貫性を示した。
AI幻覚にも懸念があり、検証は期待から著しく逸脱した。
論文 参考訳(メタデータ) (2024-09-19T02:03:04Z) - Exploring Automatic Cryptographic API Misuse Detection in the Era of LLMs [60.32717556756674]
本稿では,暗号誤用の検出において,大規模言語モデルを評価するための体系的評価フレームワークを提案する。
11,940個のLCM生成レポートを詳細に分析したところ、LSMに固有の不安定性は、報告の半数以上が偽陽性になる可能性があることがわかった。
最適化されたアプローチは、従来の手法を超え、確立されたベンチマークでこれまで知られていなかった誤用を明らかにすることで、90%近い顕著な検出率を達成する。
論文 参考訳(メタデータ) (2024-07-23T15:31:26Z) - Collaborative Knowledge Infusion for Low-resource Stance Detection [83.88515573352795]
姿勢検出モデルを支援するために、ターゲット関連の知識がしばしば必要である。
低リソース姿勢検出タスクに対する協調的知識注入手法を提案する。
論文 参考訳(メタデータ) (2024-03-28T08:32:14Z) - A Little Leak Will Sink a Great Ship: Survey of Transparency for Large Language Models from Start to Finish [47.3916421056009]
大規模言語モデル(LLM)は、大規模なウェブクローリングコーパスで訓練されている。
LLMは、トレーニングセットでそのようなデータが少ないにもかかわらず、ほとんどの場合、漏洩した情報を生成する。
自己検出法は既存の検出法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-24T13:21:58Z) - Identification of 4FGL uncertain sources at Higher Resolutions with
Inverse Discrete Wavelet Transform [0.562479170374811]
来るべき大天体データの時代には、地上の望遠鏡や宇宙の望遠鏡からターゲット源を見つけるのが重宝される。
本研究は,AGN候補の発見と4FGL DR3からBL Lac/FSRQ候補を同定することに焦点を当てた。
論文 参考訳(メタデータ) (2024-01-05T01:02:34Z) - "Knowing When You Don't Know": A Multilingual Relevance Assessment Dataset for Robust Retrieval-Augmented Generation [90.09260023184932]
Retrieval-Augmented Generation (RAG) は、外部の知識源を活用して、事実の幻覚を減らすことで、Large Language Model (LLM) を出力する。
NoMIRACLは18言語にまたがるRAGにおけるLDM堅牢性を評価するための人為的アノテーション付きデータセットである。
本研究は,<i>Halucination rate</i>,<i>Halucination rate</i>,<i>Halucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sorucination rate</i>,<i>Sr。
論文 参考訳(メタデータ) (2023-12-18T17:18:04Z) - A New Benchmark and Reverse Validation Method for Passage-level
Hallucination Detection [63.56136319976554]
大きな言語モデル(LLM)は幻覚を発生させ、ミッションクリティカルなタスクにデプロイすると大きなダメージを与える可能性がある。
本稿では,逆検証に基づく自己チェック手法を提案し,ゼロリソース方式で事実誤りを自動的に検出する。
提案手法と既存のゼロリソース検出手法を2つのデータセット上で実証的に評価した。
論文 参考訳(メタデータ) (2023-10-10T10:14:59Z) - Inference of Resource Management Specifications [2.8975089867684436]
リソースリークは、プログラムが必要なくなると、一部の有限リソースを解放できない場合に発生する。
近年の研究では、リソース管理仕様のチェックに基づくリソースリーク防止手法が提案されている。
本稿では,プログラムのリソース管理仕様を自動的に推論する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-21T00:42:42Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Improving Candidate Generation for Low-resource Cross-lingual Entity
Linking [81.41804263432684]
XEL(クロスランガル・エンティティ・リンク)は、ソース言語テキストから抽出された参照をターゲット言語知識ベース(KB)で検索するタスクである。
本稿では,(1)エンティティ参照とKBエントリの切断を減らすこと,(2)低リソースシナリオへのモデルの堅牢性を改善すること,の3つの改良を提案する。
論文 参考訳(メタデータ) (2020-03-03T05:32:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。