論文の概要: What Happened in This Pipeline? Diffing Build Logs with CiDiff
- arxiv url: http://arxiv.org/abs/2504.18182v1
- Date: Fri, 25 Apr 2025 08:56:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.707333
- Title: What Happened in This Pipeline? Diffing Build Logs with CiDiff
- Title(参考訳): このパイプラインで何が起きているのか? CiDiffでビルドログを絞り込む
- Authors: Nicolas Hubner, Jean-Rémy Falleri, Raluca Uricaru, Thomas Degueule, Thomas Durieux,
- Abstract要約: 我々は、CiDiffと呼ばれるログ構築に適した新しいdiffアルゴリズムを導入する。
我々はCiDiffを17,906CIレグレッションの新しいデータセットに基づいていくつかのベースラインに対して評価した。
- 参考スコア(独自算出の注目度): 3.093293209977702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continuous integration (CI) is widely used by developers to ensure the quality and reliability of their software projects. However, diagnosing a CI regression is a tedious process that involves the manual analysis of lengthy build logs. In this paper, we explore how textual differencing can support the debugging of CI regressions. As off-the-shelf diff algorithms produce suboptimal results, in this work we introduce a new diff algorithm specifically tailored to build logs called CiDiff. We evaluate CiDiff against several baselines on a novel dataset of 17 906 CI regressions, performing an accuracy study, a quantitative study and a user-study. Notably, our algorithm reduces the number of lines to inspect by about 60 % in the median case, with reasonable overhead compared to the state-of-practice LCS-diff. Finally, our algorithm is preferred by the majority of participants in 70 % of the regression cases, whereas LCS-diff is preferred in only 5 % of the cases.
- Abstract(参考訳): 継続的インテグレーション(CI)は、ソフトウェアプロジェクトの品質と信頼性を保証するために、開発者に広く利用されている。
しかし、CIレグレッションの診断は、長いビルドログのマニュアル分析を含む面倒なプロセスである。
本稿では,CIレグレッションのデバッグにおいてテキストの相違がいかに有効かを検討する。
既製の差分アルゴリズムが準最適結果を生成するため、本研究では、CiDiffと呼ばれるログ構築に適した新しい差分アルゴリズムを導入する。
我々は,CiDiffを17,906CIレグレッションの新たなデータセットに基づいていくつかのベースラインに対して評価し,精度調査,定量的研究,ユーザスタディを行った。
特に,本アルゴリズムでは,中央値の検査行数を約60%削減する。
最後に, 回帰症例の70パーセントの参加者ではアルゴリズムが好まれるが, LCS-diffは5%に留まる。
関連論文リスト
- Combatting Dimensional Collapse in LLM Pre-Training Data via Diversified File Selection [65.96556073745197]
DiverSified File selection algorithm (DiSF) は特徴空間における最も非相関なテキストファイルを選択するために提案される。
DiSFは590万のトレーニングファイルの98.5%をSlimPajamaに保存し、50Bのトレーニング予算内でのデータ事前トレーニングを上回っている。
論文 参考訳(メタデータ) (2025-04-29T11:13:18Z) - Toward Interactive Optimization of Source Code Differences: An Empirical Study of Its Performance [1.313675711285772]
ソースコードの違い(差分)を最適化するためのインタラクティブなアプローチを提案する。
ユーザは、マッチすべきではなく、マッチすべきでない部分や、マッチすべきでない部分に対するフィードバックを提供することができる。
GitHubの23のプロジェクトの結果は、最適でない差分のうち92%が、理想的なケースでは4つ未満のフィードバックアクションで対処可能であることを確認している。
論文 参考訳(メタデータ) (2024-09-20T15:43:55Z) - A Mirror Descent-Based Algorithm for Corruption-Tolerant Distributed Gradient Descent [57.64826450787237]
本研究では, 分散勾配降下アルゴリズムの挙動を, 敵対的腐敗の有無で解析する方法を示す。
汚職耐性の分散最適化アルゴリズムを設計するために、(怠慢な)ミラー降下からアイデアをどう使うかを示す。
MNISTデータセットの線形回帰、サポートベクトル分類、ソフトマックス分類に基づく実験は、我々の理論的知見を裏付けるものである。
論文 参考訳(メタデータ) (2024-07-19T08:29:12Z) - Learning causal graphs using variable grouping according to ancestral relationship [7.126300090990439]
サンプルサイズが変数数に対して小さい場合には,既存手法を用いた因果グラフの推定精度が低下する。
サンプルサイズが変数の数より小さい場合、いくつかのメソッドは実現不可能である。
これらの問題を回避すべく、ある研究者は分割・対数アプローチを用いた因果構造学習アルゴリズムを提案した。
論文 参考訳(メタデータ) (2024-03-21T04:42:04Z) - Performance Evaluation and Comparison of a New Regression Algorithm [4.125187280299247]
新たに提案した回帰アルゴリズムの性能を,従来の4つの機械学習アルゴリズムと比較した。
GitHubリポジトリにソースコードを提供したので、読者は結果の複製を自由にできます。
論文 参考訳(メタデータ) (2023-06-15T13:01:16Z) - Reinforcement Learning for Branch-and-Bound Optimisation using
Retrospective Trajectories [72.15369769265398]
機械学習は分岐のための有望なパラダイムとして登場した。
分岐のための単純かつ効果的なRLアプローチであるレトロ分岐を提案する。
我々は現在最先端のRL分岐アルゴリズムを3~5倍に上回り、500の制約と1000の変数を持つMILP上での最高のILメソッドの性能の20%以内である。
論文 参考訳(メタデータ) (2022-05-28T06:08:07Z) - Simple Stochastic and Online Gradient DescentAlgorithms for Pairwise
Learning [65.54757265434465]
ペアワイズ学習(Pairwise learning)とは、損失関数がペアインスタンスに依存するタスクをいう。
オンライン降下(OGD)は、ペアワイズ学習でストリーミングデータを処理する一般的なアプローチである。
本稿では,ペアワイズ学習のための手法について,シンプルでオンラインな下降を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:10:48Z) - Streaming Linear System Identification with Reverse Experience Replay [45.17023170054112]
本稿では,線形時間不変(LTI)力学系を,ストリーミングアルゴリズムによる単一軌道から推定する問題を考察する。
強化学習(RL)で遭遇する多くの問題において、勾配オラクルを用いて囲碁上のパラメータを推定することが重要である。
本稿では,RL文学で人気のある経験リプレイ(ER)技術に触発された小説SGD with Reverse Experience Replay (SGD-RER)を提案する。
論文 参考訳(メタデータ) (2021-03-10T06:51:55Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。