論文の概要: CppPerf: An Automated Pipeline and Dataset for Performance-Improving C++ Commits
- arxiv url: http://arxiv.org/abs/2605.10890v1
- Date: Mon, 11 May 2026 17:33:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:51.039498
- Title: CppPerf: An Automated Pipeline and Dataset for Performance-Improving C++ Commits
- Title(参考訳): CppPerf: パフォーマンス改善のためのパイプラインとデータセットの自動化
- Authors: Tommy Ho, Khashayar Etemadi, Zhendong Su,
- Abstract要約: CppPerf-Mineは、GitHub上のオープンソースのC++リポジトリから実行時改善パッチをマイニングするパイプラインである。
CppPerf-Mineを使って、42の成熟したC++リポジトリのパッチを手作業で検証した347のベンチマークであるCppPerf-DBを構築します。
OpenHandsはCppPerf-DBのパッチの13.5%しか正しく修正していない。
- 参考スコア(独自算出の注目度): 6.283140995975512
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Recent progress in automated repair of performance bugs demands realistic, executable benchmarks. However, existing C++ performance benchmarks are largely built from competitive programming submissions, and recent real-world benchmarks predominantly target Python and .NET. To fill this gap, we present CppPerf-Mine, a configurable pipeline that mines execution-time-improving patches from open-source C++ repositories on GitHub by combining structural commit filtering, an LLM-based commit classifier, and a containerized build & test stage that produces fully reproducible Docker images for each patch. Using CppPerf-Mine, we build CppPerf-DB, a benchmark comprising 347 manually verified patches from 42 mature C++ repositories, 39% of which are multi-file, enabling the evaluation of repository-level repair tools. In our preliminary study, OpenHands correctly fixes only 13.5% of the patches in CppPerf-DB, confirming that real-world C++ performance repair remains an open challenge. CppPerf-Mine and CppPerf-DB are open-source and publicly available at: https://doi.org/10.5281/zenodo.20097425. In addition, a demonstration video is available at: https://www.youtube.com/watch?v=nixlupIgSdM.
- Abstract(参考訳): パフォーマンスバグの自動修復の最近の進歩は、現実的で実行可能なベンチマークを必要とする。
しかし、既存のC++パフォーマンスベンチマークは、主に競合するプログラミング提案に基づいて構築されており、最近の実世界のベンチマークは、主にPythonと.NETをターゲットにしている。
NET。
このギャップを埋めるために、CppPerf-Mineという、GitHub上のオープンソースのC++リポジトリから実行時改善パッチをマイニングする構成可能なパイプラインを紹介します。
CppPerf-Mineを使って、42の成熟したC++リポジトリのパッチを手作業で検証した347のベンチマークであるCppPerf-DBを構築します。
予備的な調査で、OpenHandsはCppPerf-DBのパッチの13.5%しか正しく修正していない。
CppPerf-MineとCppPerf-DBはオープンソースで、https://doi.org/10.5281/zenodo.20097425で公開されている。
さらにデモビデオは、https://www.youtube.com/watch?
v=nixlupIgSdM。
関連論文リスト
- PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software [2.64399132991614]
プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。
ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。
PhantomRunは、大規模な言語モデル(LLM)を活用してCIコンパイル障害の修正を生成し、検証する自動化フレームワークである。
論文 参考訳(メタデータ) (2026-02-23T19:13:22Z) - VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents [42.56489784841984]
実装の変更が生成され、エージェントが提案する差分として適用される。
アーキテクチャを説明し、システムの生成と検証に使用するワークフローを要約し、アーティファクトを評価する。
論文 参考訳(メタデータ) (2026-01-21T19:29:00Z) - RepoGenesis: Benchmarking End-to-End Microservice Generation from Readme to Repository [52.98970048197381]
RepoGenesisは、リポジトリレベルのエンドツーエンドWebマイクロサービス生成のための、最初の多言語ベンチマークである。
18のドメインと11のフレームワークに106のリポジトリ(60のPython、46のJava)があり、1,258のAPIエンドポイントと2,335のテストケースが検証されている。
その結果、高いAC(最大73.91%)とDSR(最大100%)にもかかわらず、最高のパフォーマンスのシステムはPythonで23.67%のPass@1、Javaで21.45%しか達成していないことが明らかになった。
論文 参考訳(メタデータ) (2026-01-20T13:19:20Z) - KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.20933707301566]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文 参考訳(メタデータ) (2024-07-02T21:44:22Z) - PerfCurator: Curating a large-scale dataset of performance bug-related commits from public repositories [1.382112536681413]
パフォーマンスバグ関連コミットを大規模に収集するリポジトリマイナであるPerfCuratorを提案する。
PerfCuratorは、パフォーマンスバグ関連のコミットを分類するために訓練された125MパラメータBERTモデルであるPcBERT-KDを使用している。
この大規模データセットは,データ駆動型パフォーマンスバグ検出システムの有効性を著しく向上させることを示す。
論文 参考訳(メタデータ) (2024-06-17T16:49:13Z) - Detecting Build Dependency Errors in Incremental Builds [13.823208277774572]
インクリメンタルビルドのコンテキストにおいて、ビルド依存性のエラーを検出するためにECheckerを提案する。
ECheckerは、C/C++プリプロセッサディレクティブと新しいコミットからのMakefile変更を推論することで、実際のビルド依存関係を自動的に更新する。
ECheckerはビルド依存性のエラー検出効率を平均85.14倍に向上させる。
論文 参考訳(メタデータ) (2024-04-20T07:01:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。