論文の概要: An Empirical Study of Fault Localization in Python Programs
- arxiv url: http://arxiv.org/abs/2305.19834v2
- Date: Thu, 1 Jun 2023 15:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 04:56:06.104860
- Title: An Empirical Study of Fault Localization in Python Programs
- Title(参考訳): Pythonプログラムにおけるフォールトローカライゼーションに関する実証的研究
- Authors: Mohammad Rezaalipour and Carlo A. Furia
- Abstract要約: 本稿では,実世界のPythonプログラムと障害の局所化に関する大規模な実証的研究である。
我々は,本研究の基盤として,Javaにおける障害局所化に関するZau et al.の最近の大規模な実証研究を使用している。
結果は、PythonのJavaに関するいくつかの成果を再現し、Pythonの特異性が障害ローカライゼーションの能力に影響を及ぼすかどうかを明かした。
- 参考スコア(独自算出の注目度): 5.158004370485019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite its massive popularity as a programming language, especially in novel
domains like data science programs, there is comparatively little research
about fault localization that targets Python. Even though it is plausible that
several findings about programming languages like C/C++ and Java -- the most
common choices for fault localization research -- carry over to other
languages, whether the dynamic nature of Python and how the language is used in
practice affect the capabilities of classic fault localization approaches
remain open questions to investigate.
This paper is the first large-scale empirical study of fault localization on
real-world Python programs and faults. Using Zou et al.'s recent large-scale
empirical study of fault localization in Java as the basis of our study, we
investigated the effectiveness (i.e., localization accuracy), efficiency (i.e.,
runtime performance), and other features (e.g., different entity granularities)
of seven well-known fault-localization techniques in four families
(spectrum-based, mutation-based, predicate switching, and stack-trace based) on
135 faults from 13 open-source Python projects from the BugsInPy curated
collection.
The results replicate for Python several results known about Java, and shed
light on whether Python's peculiarities affect the capabilities of fault
localization. The replication package that accompanies this paper includes
detailed data about our experiments, as well as the tool FauxPy that we
implemented to conduct the study.
- Abstract(参考訳): プログラミング言語としては非常に人気があるが、特にデータサイエンスプログラムのような新しい領域では、Pythonをターゲットにしたフォールトローカライゼーションに関する研究はほとんどない。
C/C++やJavaのようなプログラミング言語に関するいくつかの発見(フォールトローカライゼーション研究の最も一般的な選択)が、Pythonのダイナミックな性質と実際に言語がどのように使われているかが、古典的なフォールトローカライゼーションアプローチの能力に影響を与えているかどうか、他の言語に続いていることは確実である。
本稿は,実世界のpythonプログラムと障害に対するフォールトローカライズに関する,最初の大規模実証研究である。
Using Zou et al.'s recent large-scale empirical study of fault localization in Java as the basis of our study, we investigated the effectiveness (i.e., localization accuracy), efficiency (i.e., runtime performance), and other features (e.g., different entity granularities) of seven well-known fault-localization techniques in four families (spectrum-based, mutation-based, predicate switching, and stack-trace based) on 135 faults from 13 open-source Python projects from the BugsInPy curated collection.
結果は、PythonのJavaに関するいくつかの成果を再現し、Pythonの特異性が障害ローカライゼーションの能力に影響を及ぼすかどうかを明かした。
この論文に付随するレプリケーションパッケージには、実験に関する詳細なデータと、研究を実施するために実装したツールのfauxpyが含まれています。
関連論文リスト
- CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.7413285637879]
CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文 参考訳(メタデータ) (2024-08-23T11:43:00Z) - Code Linting using Language Models [0.7519872646378836]
コードリンタは高品質なソフトウェアシステムの開発において重要な役割を担います。
それらの利点にもかかわらず、コードリンタは言語固有のもので、特定のタイプの問題に焦点を合わせており、偽陽性になりがちである。
本稿では,大規模言語モデルを用いて,より汎用的なコードlinterを開発できるかどうかについて検討する。
論文 参考訳(メタデータ) (2024-06-27T19:59:49Z) - FauxPy: A Fault Localization Tool for Python [4.366130138560774]
FauxPyはPythonプログラムのフォールトローカライズツールである。
本稿は、FauxPyを2つの例に例示し、その主な特徴と機能について、ユーザの視点から論じる。
論文 参考訳(メタデータ) (2024-04-29T11:11:26Z) - Python is Not Always the Best Choice: Embracing Multilingual Program of Thoughts [51.49688654641581]
本稿では,多言語からの強みと多様性を生かしたMultiPoTというタスクとモデル非依存のアプローチを提案する。
実験の結果、Python Self-Consistencyを著しく上回ることがわかった。
特にMultiPoTはChatGPT(gpt-3.5-turbo-0701)で平均4.6%以上の改善を実現している。
論文 参考訳(メタデータ) (2024-02-16T13:48:06Z) - Causal-learn: Causal Discovery in Python [53.17423883919072]
因果発見は、観測データから因果関係を明らかにすることを目的としている。
$textitcausal-learn$は因果発見のためのオープンソースのPythonライブラリである。
論文 参考訳(メタデータ) (2023-07-31T05:00:35Z) - A Static Evaluation of Code Completion by Large Language Models [65.18008807383816]
単純なプログラミング問題に対するモデル生成コードの機能的正当性を評価するために,実行ベースベンチマークが提案されている。
プログラムを実行せずにエラーを検出するlinterのような静的解析ツールは、コード生成モデルを評価するために十分に研究されていない。
抽象構文木を利用して,Pythonのコード補完における静的エラーを定量化する静的評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-05T19:23:34Z) - Measuring The Impact Of Programming Language Distribution [28.96076723773365]
我々は,任意の言語におけるベンチマークの実行ベースの評価を行うためのBabelCodeフレームワークを提案する。
我々は Translating Python Programming Puzzles (TP3) と呼ばれる新しいコード翻訳データセットを提案する。
トレーニングデータセットにおける14の言語分布のバランスをとることで,低リソース言語における大規模言語モデルの性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2023-02-03T19:47:22Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - Python for Smarter Cities: Comparison of Python libraries for static and
interactive visualisations of large vector data [0.0]
Pythonは簡潔で自然な構文を持ち、コンピュータサイエンスの背景を持たない市町村のスタッフにとって参入障壁は低い。
本研究では,大規模ベクトルデータセットの可視化生成に関して,Pythonエコシステムにおける顕著かつ活発に開発された可視化ライブラリを評価する。
短いリストのライブラリはすべて、小さなデータセットと大きなデータセットの両方のサンプルマップ製品を生成することができた。
論文 参考訳(メタデータ) (2022-02-26T10:23:29Z) - OPFython: A Python-Inspired Optimum-Path Forest Classifier [68.8204255655161]
本稿では,OPFythonと表記されるPythonベースのOptimum-Path Forestフレームワークを提案する。
OPFythonはPythonベースのライブラリなので、C言語よりもフレンドリーな環境とプロトタイピングの作業スペースを提供する。
論文 参考訳(メタデータ) (2020-01-28T15:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。