論文の概要: Exploring Plausible Patches Using Source Code Embeddings in JavaScript
- arxiv url: http://arxiv.org/abs/2103.16846v1
- Date: Wed, 31 Mar 2021 06:57:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 14:26:00.060434
- Title: Exploring Plausible Patches Using Source Code Embeddings in JavaScript
- Title(参考訳): JavaScriptのソースコード埋め込みによる可塑性パッチの探索
- Authors: Viktor Csuvik, D\'aniel Horv\'ath, M\'ark Lajk\'o, L\'aszl\'o Vid\'acs
- Abstract要約: オープンソースJavaScriptプロジェクトでDoc2Vecモデルをトレーニングし、10のバグに対して465のパッチを生成しました。
これらの正当なパッチと開発者修正は、元のプログラムとの類似性に基づいてランク付けされる。
これらの類似性リストを分析し、プレーンな文書埋め込みが誤分類につながる可能性があることを発見した。
- 参考スコア(独自算出の注目度): 1.3327130030147563
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite the immense popularity of the Automated Program Repair (APR) field,
the question of patch validation is still open. Most of the present-day
approaches follow the so-called Generate-and-Validate approach, where first a
candidate solution is being generated and after validated against an oracle.
The latter, however, might not give a reliable result, because of the
imperfections in such oracles; one of which is usually the test suite. Although
(re-) running the test suite is right under one's nose, in real life
applications the problem of over- and underfitting often occurs, resulting in
inadequate patches. Efforts that have been made to tackle with this problem
include patch filtering, test suite expansion, careful patch producing and many
more. Most approaches to date use post-filtering relying either on test
execution traces or make use of some similarity concept measured on the
generated patches. Our goal is to investigate the nature of these
similarity-based approaches. To do so, we trained a Doc2Vec model on an
open-source JavaScript project and generated 465 patches for 10 bugs in it.
These plausible patches alongside with the developer fix are then ranked based
on their similarity to the original program. We analyzed these similarity lists
and found that plain document embeddings may lead to misclassification - it
fails to capture nuanced code semantics. Nevertheless, in some cases it also
provided useful information, thus helping to better understand the area of
Automated Program Repair.
- Abstract(参考訳): 自動プログラム修正(APR)の分野では非常に人気があるにもかかわらず、パッチ検証の問題はまだ未解決である。
現在のアプローチのほとんどは、まずは候補ソリューションが生成され、その後はオラクルに対して検証される、いわゆるGenerate-and-Validateアプローチに従っている。
しかし後者は、このようなオラクルに欠陥があるため、信頼できる結果を与えないかもしれない。
テストスイートの実行(re-)は鼻の真下にあるが、現実のアプリケーションではオーバーフィットとアンダーフィッティングの問題がしばしば発生し、パッチが不十分になる。
この問題に対処するための努力は、パッチフィルタリング、テストスイートの拡張、慎重にパッチを作成することなどだ。
これまでのアプローチでは,テスト実行トレースに依存するか,あるいは生成されたパッチで測定した類似性を利用したポストフィルタを使用する場合が多い。
私たちの目標は、これらの類似性に基づくアプローチの性質を調べることです。
そのため、オープンソースJavaScriptプロジェクトでDoc2Vecモデルをトレーニングし、10のバグに対して465のパッチを生成しました。
これらのパッチと開発者修正は、元のプログラムと類似性に基づいてランク付けされる。
これらの類似度リストを分析し、プレーンなドキュメントの埋め込みが誤分類につながる可能性があることを発見した。
それにもかかわらず、いくつかのケースでは有用な情報を提供し、プログラムの自動修復の領域をよりよく理解するのに役立つ。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - PPT4J: Patch Presence Test for Java Binaries [15.297767260561491]
近年,オープンソースソフトウェアに報告されている脆弱性の数は大幅に増加している。
対象のバイナリにパッチを適用するかどうかをテストする能力、すなわちパッチの存在テストは、実践者にとって不可欠である。
PPT4J(textbfP$atch $textbfP$resence $textbfT$est $textbffor$textbfJ$ava Binaries)という新しいパッチ存在テストフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-18T08:28:13Z) - Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic
Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。
RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。
RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文 参考訳(メタデータ) (2023-09-12T08:52:56Z) - Program Repair by Fuzzing over Patch and Input Space [8.887795868777985]
本稿では,パッチレベルのファジリングとして検索に基づくプログラム修復を提案する。
従来の入力レベルのファザを使って、パッチ候補を除外しながら、パッチスペースの探索にパッチスペースファザを使用します。
両空間の共探索において,パッチレベルのファジィングと入力レベルのファジィングを組み合わせることができることを示す。
論文 参考訳(メタデータ) (2023-08-01T17:02:45Z) - Patch Space Exploration using Static Analysis Feedback [8.13782364161157]
静的解析を利用して、メモリの安全性問題を自動的に修復する方法を示す。
提案したアプローチは、バグを修正するためのパッチの近さを検査することで、望ましいパッチが何であるかを学習する。
我々は,印字ヒープに対する影響に応じて等価パッチのクラスを作成し,そのクラスのパッチ等価度に対してのみ検証オラクルを呼び出すことにより,修復をスケーラブルにする。
論文 参考訳(メタデータ) (2023-08-01T05:22:10Z) - Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。
実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-24T11:49:52Z) - Accelerating Patch Validation for Program Repair with Interception-Based
Execution Scheduling [15.592392495402809]
そこで本研究では,既存の突然変異検査手法を検証し,汎用パッチ検証に適した5種類の加速手法を同定する。
本稿では,オンラインのパッチ間の等価性を検出する実行スケジューリングと,システム状態へのパッチ変更を遮断するインターセプションベースのインスツルメンテーションの2つの新しい手法を提案する。
4つのAPRアプローチによる大規模評価では、ExpressAPRは、プレーンバリデーションの137.1倍、最先端の8.8倍のパッチ検証を高速化する。
論文 参考訳(メタデータ) (2023-05-06T06:45:25Z) - Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each
using ChatGPT [10.071615423169902]
自動プログラム修復(APR)は、バグギープログラムのパッチを自動的に生成することを目的としている。
最近のAPRの研究は、最新のLarge Language Models(LLM)を活用して、APRのパッチを直接生成することに重点を置いている。
最初に完全に自動化された会話駆動型APRアプローチであるChatRepairを提案する。
論文 参考訳(メタデータ) (2023-04-01T20:57:33Z) - D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using
Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。
D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文 参考訳(メタデータ) (2021-02-16T07:46:53Z) - Open-sourced Dataset Protection via Backdoor Watermarking [87.15630326131901]
本稿では,オープンソースの画像分類データセットを保護するために,Emphbackdoor Embeddingベースのデータセット透かし手法を提案する。
疑わしい第三者モデルによって生成される後続確率に基づいて,仮説テストガイド法を用いてデータセット検証を行う。
論文 参考訳(メタデータ) (2020-10-12T16:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。