Fugu-MT 論文翻訳(概要): PExReport: Automatic Creation of Pruned Executable Cross-Project Failure Reports

論文の概要: PExReport: Automatic Creation of Pruned Executable Cross-Project Failure Reports

arxiv url: http://arxiv.org/abs/2305.06669v1
Date: Thu, 11 May 2023 09:09:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-24 09:04:18.194828
Title: PExReport: Automatic Creation of Pruned Executable Cross-Project Failure Reports
Title（参考訳）: PExReport: 実行可能なクロスプロジェクト障害レポートの自動作成
Authors: Sunzhou Huang, Xiaoyin Wang
Abstract要約: 我々は,スタンドアロンのCPFレポートを生成するPExReportを開発した。 PExReportは、我々のデータセットで198のテスト障害のうち184の実行可能なCPFレポートを作成することができ、ソースクラスと内部JARのクラスで平均72.97%の削減を実現している。
参考スコア（独自算出の注目度）: 12.174340719791532
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modern software development extensively depends on existing libraries written by other developer teams from the same or a different organization. When a developer executes the software, the execution trace may go across the boundaries of multiple software products and create cross-project failures (CPFs). Existing studies show that a stand-alone executable failure report may enable the most effective communication, but creating such a report is often challenging due to the complicated files and dependencies interactions in the software ecosystems. In this paper, to solve the CPF report trilemma, we developed PExReport, which automatically creates stand-alone executable CPF reports. PExReport leverages build tools to prune source code and dependencies, and further analyzes the build process to create a pruned build environment for reproducing the CPF. We performed an evaluation on 74 software project issues with 198 CPFs, and the evaluation results show that PExReport can create executable CPF reports for 184 out of 198 test failures in our dataset, with an average reduction of 72.97% on source classes and the classes in internal JARs.
Abstract（参考訳）: 現代のソフトウェア開発は、同じまたは別の組織から他の開発チームによって書かれた既存のライブラリに大きく依存します。開発者がソフトウェアを実行すると、実行トレースは複数のソフトウェアプロダクトの境界を越えて、プロジェクト横断障害(CPF)を生成する。既存の研究によると、スタンドアロンの実行可能な障害レポートは最も効果的なコミュニケーションを可能にする可能性があるが、ソフトウェアエコシステムにおける複雑なファイルと依存関係の相互作用のため、そのようなレポートを作成することはしばしば困難である。本稿では,CPFレポートのトリレンマを解決するために,スタンドアローンのCPFレポートを自動生成するPExReportを開発した。 pexreportはビルドツールを利用してソースコードと依存関係をプルインし、さらにビルドプロセスを分析してcpfを再現するprunedビルド環境を作成する。 198のCPFを用いて74のソフトウェアプロジェクト問題の評価を行い、評価結果から、PExReportは、我々のデータセットの198のテスト障害のうち184の実行可能なCPFレポートを作成でき、ソースクラスと内部JARのクラスを平均72.97%削減できることを示した。

関連論文リスト

SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳（メタデータ） (2025-05-29T18:28:02Z)
Computational Reproducibility of R Code Supplements on OSF [0.0]
多くのコードサプリメントは、計算環境を再現するために必要なドキュメントを欠いている。本研究では,StatCodeSearchデータセットを用いて296のRプロジェクトの計算結果を評価する。プロジェクトソースコードから直接計算環境を再構築する自動パイプラインを開発した。
論文参考訳（メタデータ） (2025-05-27T13:06:38Z)
Attestable builds: compiling verifiable binaries on untrusted systems using trusted execution environments [3.207381224848367]
attestableビルドは、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する。私たちは、ソースコードと最終バイナリアーティファクトの間の信頼を切断する不透明なビルドパイプラインの課題に取り組みます。
論文参考訳（メタデータ） (2025-05-05T10:00:04Z)
Large Language Model Critics for Execution-Free Evaluation of Code Changes [5.1973075342632535]
大規模言語モデル(LLM)は、ソフトウェアエンジニアリングタスクを自動化するための有望な方法を提供する。ビルド状況や時折のログ分析などを評価するための既存のメトリクスは、変更の質を評価するのに必要な情報を提供するには不十分で制限されています。本研究では,LLMをベースとした批判者に対して,コード変更の実行可能性に対する厳密で厳密な中間レベル/ステップレベルの,実行不要な評価プロキシを導出する設計を行った。
論文参考訳（メタデータ） (2025-01-28T02:38:56Z)
Does Functional Package Management Enable Reproducible Builds at Scale? Yes [4.492444446637857]
Reproducible Builds (R-B) は、ソフトウェアパッケージをソースから再構築することを保証する。我々は,Nix機能パッケージマネージャのコンテキストにおいて,ビットワイズに関する最初の大規模研究を行う。非常に高いビットワイズ率、69～91%の上昇傾向、さらに高いリビルド可能性率、99%以上を得ています。
論文参考訳（メタデータ） (2025-01-27T10:11:27Z)
DI-BENCH: Benchmarking Large Language Models on Dependency Inference with Testable Repositories at Scale [39.92722886613929]
DI-BENCHは、大規模言語モデルの依存性推論能力を評価するために設計された、大規模なベンチマークおよび評価フレームワークである。ベンチマークでは、Python、C#、Rust、JavaScriptにまたがるテスト環境を備えた581のリポジトリが提供されている。テキストと実行ベースのメトリクスによる大規模な実験により、現在の最高のパフォーマンスモデルは42.9%の実行パス率しか達成していないことが明らかになった。
論文参考訳（メタデータ） (2025-01-23T14:27:11Z)
ExecRepoBench: Multi-level Executable Code Completion Evaluation [45.963424627710765]
本稿では,リポジトリレベルのベンチマークであるExecRepoBenchの作成を通じて,ソフトウェア開発におけるコード補完を強化する新しいフレームワークを紹介する。本稿では,抽象構文木をベースとした多段階文法ベースの補完手法を提案し,様々な論理単位のコードフラグメントをマスキングする。次に,Repo-Instruct の 7B パラメータでオープンソースの LLM を微調整し,強力なコード補完ベースラインモデル Qwen2.5-Coder-Instruct-C を生成する。
論文参考訳（メタデータ） (2024-12-16T17:14:35Z)
You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects [18.129031749321058]
ExecutionAgentは、ソースコードから任意のプロジェクトを構築し、テストケースを実行するためのスクリプトを作成する自動テクニックである。 ExecutionAgentは、14の異なるプログラミング言語と多くの異なるビルドおよびテストツールを使用する50のオープンソースプロジェクトに適用します。
論文参考訳（メタデータ） (2024-12-13T13:30:51Z)
Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。 Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文参考訳（メタデータ） (2024-12-02T18:11:30Z)
Towards Exception Safety Code Generation with Intermediate Representation Agents Framework [54.03528377384397]
大規模言語モデル(LLM)は、しばしば生成されたコードの堅牢な例外処理に苦しむ。中間表現(IR)アプローチにより,LLM生成コードの例外安全性を実現する新しいマルチエージェントフレームワークであるSeekerを提案する。 Seekerは例外処理をScanner, Detector, Predator, Ranker, Handlerの5つの特殊エージェントに分解する。
論文参考訳（メタデータ） (2024-10-09T14:45:45Z)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。 Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳（メタデータ） (2024-10-02T09:11:10Z)
Revisiting Evolutionary Program Repair via Code Language Model [11.711739409758476]
本稿では,多目的進化アルゴリズムをCLMと統合し,Javaプロジェクトのマルチロケーションバグを修正するARJA-CLMを提案する。また,提案手法は,CLMが候補文を生成するための,アクセス可能なフィールドとメソッドに関する追加情報により,プロンプトを充実させる。
論文参考訳（メタデータ） (2024-08-20T01:57:45Z)
Automatic benchmarking of large multimodal models via iterative experiment programming [71.78089106671581]
本稿では,LMMの自動ベンチマークのための最初のフレームワークであるAPExを紹介する。自然言語で表現された研究の質問に対して、APExは大きな言語モデル(LLM)と事前定義されたツールのライブラリを活用して、手元にあるモデルの一連の実験を生成する。調査の現在の状況に基づいて、APExはどの実験を行うか、結果が結論を引き出すのに十分かどうかを選択する。
論文参考訳（メタデータ） (2024-06-18T06:43:46Z)
Detecting Continuous Integration Skip : A Reinforcement Learning-based Approach [0.4297070083645049]
継続的統合(CI)プラクティスは、自動ビルドとテストプロセスを採用することで、コード変更のシームレスな統合を促進する。 Travis CIやGitHub Actionsといった一部のフレームワークは、CIプロセスの簡素化と強化に大きく貢献している。開発者はCI実行に適したコミットやスキップの候補としてコミットを正確にフラグ付けすることの難しさに悩まされ続けている。
論文参考訳（メタデータ） (2024-05-15T18:48:57Z)
DevBench: A Comprehensive Benchmark for Software Development [72.24266814625685]
DevBenchは、ソフトウェア開発ライフサイクルのさまざまな段階にわたる大規模言語モデル(LLM)を評価するベンチマークである。 GPT-4-Turboを含む現在のLLMは、DevBench内での課題の解決に失敗している。本研究は,LLMを現実のプログラミングアプリケーションに展開する上で,現実的な知見を提供するものである。
論文参考訳（メタデータ） (2024-03-13T15:13:44Z)
On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。 Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文参考訳（メタデータ） (2023-06-08T20:14:46Z)
DAppSCAN: Building Large-Scale Datasets for Smart Contract Weaknesses in DApp Projects [28.841564946449463]
DAPPSCAN-SOURCEデータセットは39,904のSolidityファイルで構成される。 DAPPSCAN-BYTECODEデータセットは6,665のコンパイルされたスマートコントラクトで構成され、888のSWC弱点がある。 DAPPSCAN-BYTECODEに基づいて,最先端のスマートコントラクト弱点検出ツールの性能評価実験を行った。
論文参考訳（メタデータ） (2023-05-15T08:56:13Z)
Dataflow graphs as complete causal graphs [17.15640410609126]
我々は、フローベースプログラミング(FBP)というソフトウェア設計の代替手法を考える。ソフトウェアプロジェクトの日々のタスクを改善するために、この接続をどのように活用できるかを示します。
論文参考訳（メタデータ） (2023-03-16T17:59:13Z)
S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。 BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文参考訳（メタデータ） (2021-03-18T21:10:41Z)
A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文参考訳（メタデータ） (2021-03-02T16:19:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。