論文の概要: AFGNN: API Misuse Detection using Graph Neural Networks and Clustering
- arxiv url: http://arxiv.org/abs/2604.07891v1
- Date: Thu, 09 Apr 2026 07:01:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.753415
- Title: AFGNN: API Misuse Detection using Graph Neural Networks and Clustering
- Title(参考訳): AFGNN: グラフニューラルネットワークとクラスタリングを用いたAPIミス検出
- Authors: Ponnampalam Pirapuraj, Tamal Mondal, Sharanya Gupta, Akash Lal, Somak Aditya, Jyothi Vedurada,
- Abstract要約: AFGNNは、JavaコードのAPI誤用を効率的に検出する新しいグラフニューラルネットワーク(GNN)ベースのフレームワークである。
AFGNNは、新しいAPI Flow Graph(AFG)表現を使用して、コードに存在するAPI実行シーケンス、データ、制御フロー情報をキャプチャして、API使用パターンをモデル化する。
人気のあるAPI使用データセットの実験によると、AFGNNは最先端の小さな言語モデルとAPI誤用検知器を著しく上回っている。
- 参考スコア(独自算出の注目度): 3.727482310060583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Application Programming Interfaces (APIs) are crucial to software development, enabling integration of existing systems with new applications by reusing tried and tested code, saving development time and increasing software safety. In particular, the Java standard library APIs, along with numerous third-party APIs, are extensively utilized in the development of enterprise application software. However, their misuse remains a significant source of bugs and vulnerabilities. Furthermore, due to the limited examples in the official API documentation, developers often rely on online portals and generative AI models to learn unfamiliar APIs, but using such examples may introduce unintentional errors in the software. In this paper, we present AFGNN, a novel Graph Neural Network (GNN)-based framework for efficiently detecting API misuses in Java code. AFGNN uses a novel API Flow Graph (AFG) representation that captures the API execution sequence, data, and control flow information present in the code to model the API usage patterns. AFGNN uses self-supervised pre-training with AFG representation to effectively compute the embeddings for unknown API usage examples and cluster them to identify different usage patterns. Experiments on popular API usage datasets show that AFGNN significantly outperforms state-of-the-art small language models and API misuse detectors.
- Abstract(参考訳): テスト済みのコードを再利用し、開発時間を節約し、ソフトウェア安全性を高めることで、既存のシステムと新しいアプリケーションとの統合を可能にする。
特に、Java標準ライブラリAPIは、多くのサードパーティのAPIとともに、エンタープライズアプリケーションソフトウェアの開発に広く利用されています。
しかし、その誤用は依然として重大なバグや脆弱性の原因となっている。
さらに、公式APIドキュメントの限られた例のため、開発者はよく、未知のAPIを学ぶためにオンラインポータルや生成AIモデルに頼るが、そのような例を使用すると、ソフトウェアに意図しないエラーをもたらす可能性がある。
本稿では,JavaコードのAPI誤用を効率的に検出する新しいグラフニューラルネットワーク(GNN)ベースのフレームワークであるAFGNNを提案する。
AFGNNは、新しいAPI Flow Graph(AFG)表現を使用して、コードに存在するAPI実行シーケンス、データ、制御フロー情報をキャプチャして、API使用パターンをモデル化する。
AFGNNは、AFG表現による自己教師付き事前トレーニングを使用して、未知のAPI使用例の埋め込みを効果的に計算し、それらをクラスタ化し、異なる使用パターンを特定する。
人気のあるAPI使用データセットの実験によると、AFGNNは最先端の小さな言語モデルとAPI誤用検知器を著しく上回っている。
関連論文リスト
- Framework-Aware Code Generation with API Knowledge Graph-Constructed Data: A Study on HarmonyOS [52.483888557864326]
APIKG4SYNはAPI指向の質問コードペアの構築にAPIナレッジグラフを活用するように設計されたフレームワークである。
APIKG4SYNを使ったHarmonyOSコード生成のための最初のベンチマークを構築した。
論文 参考訳(メタデータ) (2025-11-29T08:13:54Z) - Benchmarking Web API Integration Code Generation [3.5669873833301047]
We present WAPIIBench, a dataset and evaluation pipeline designed for the ability of LLMs to generate web API invocation code。
オープンソースのLLMを使った実験では、API呼び出しの生成が大きな課題となることが分かりました。
評価済みのオープンソースモデルはいずれも40%以上のタスクを解決できなかった。
論文 参考訳(メタデータ) (2025-09-24T14:36:44Z) - Your Fix Is My Exploit: Enabling Comprehensive DL Library API Fuzzing with Large Language Models [49.214291813478695]
AIアプリケーションで広く使用されているディープラーニング(DL)ライブラリは、オーバーフローやバッファフリーエラーなどの脆弱性を含むことが多い。
従来のファジィングはDLライブラリの複雑さとAPIの多様性に悩まされている。
DLライブラリのためのLLM駆動ファジィ手法であるDFUZZを提案する。
論文 参考訳(メタデータ) (2025-01-08T07:07:22Z) - ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.26807758443675]
ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-12-06T19:00:15Z) - A Systematic Evaluation of Large Code Models in API Suggestion: When, Which, and How [53.65636914757381]
API提案は、現代のソフトウェア開発において重要なタスクである。
大規模コードモデル(LCM)の最近の進歩は、API提案タスクにおいて有望であることを示している。
論文 参考訳(メタデータ) (2024-09-20T03:12:35Z) - FANTAstic SEquences and Where to Find Them: Faithful and Efficient API Call Generation through State-tracked Constrained Decoding and Reranking [57.53742155914176]
APIコール生成は、大規模言語モデルのツール使用能力の基盤となっている。
既存の教師付きおよびコンテキスト内学習アプローチは、高いトレーニングコスト、低いデータ効率、APIドキュメントとユーザの要求に反する生成APIコールに悩まされる。
本稿では,これらの制約に対処するため,FANTASEと呼ばれる出力側最適化手法を提案する。
論文 参考訳(メタデータ) (2024-07-18T23:44:02Z) - A Classification-by-Retrieval Framework for Few-Shot Anomaly Detection to Detect API Injection Attacks [9.693391036125908]
本稿では,2つの主要部品からなる非教師なし数発の異常検出フレームワークを提案する。
まず、FastTextの埋め込みに基づいたAPI専用の汎用言語モデルをトレーニングする。
次に,近似Nearest Neighborサーチを分類・検索手法として用いた。
論文 参考訳(メタデータ) (2024-05-18T10:15:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。