論文の概要: Software issues report for bug fixing process: An empirical study of
machine-learning libraries
- arxiv url: http://arxiv.org/abs/2312.06005v1
- Date: Sun, 10 Dec 2023 21:33:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 17:26:33.229478
- Title: Software issues report for bug fixing process: An empirical study of
machine-learning libraries
- Title(参考訳): バグ修正プロセスに関するソフトウェア問題レポート:機械学習ライブラリに関する実証的研究
- Authors: Adekunle Ajibode, Dong Yunwei, Yang Hongji
- Abstract要約: 6つの機械学習ライブラリにおけるバグ修正プロセスにおける課題解決の有効性について検討した。
マシンラーニングライブラリで最も一般的な問題カテゴリは、バグ、ドキュメント、最適化、クラッシュ、拡張、新機能要求、ビルド/CI、サポート、パフォーマンスである。
本研究は,効率的な課題追跡プロセス,効果的なコミュニケーション,コラボレーションが,機械学習ライブラリの課題解決やバグ修正プロセスの効果的な解決に不可欠である,と結論付けている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Issue resolution and bug-fixing processes are essential in the development of
machine-learning libraries, similar to software development, to ensure
well-optimized functions. Understanding the issue resolution and bug-fixing
process of machine-learning libraries can help developers identify areas for
improvement and optimize their strategies for issue resolution and bug-fixing.
However, detailed studies on this topic are lacking. Therefore, we investigated
the effectiveness of issue resolution for bug-fixing processes in six
machine-learning libraries: Tensorflow, Keras, Theano, Pytorch, Caffe, and
Scikit-learn. We addressed seven research questions (RQs) using 16,921 issues
extracted from the GitHub repository via the GitHub Rest API. We employed
several quantitative methods of data analysis, including correlation, OLS
regression, percentage and frequency count, and heatmap to analyze the RQs. We
found the following through our empirical investigation: (1) The most common
categories of issues that arise in machine-learning libraries are bugs,
documentation, optimization, crashes, enhancement, new feature requests,
build/CI, support, and performance. (2) Effective strategies for addressing
these problems include fixing critical bugs, optimizing performance, and
improving documentation. (3) These categorized issues are related to testing
and runtime and are common among all six machine-learning libraries. (4)
Monitoring the total number of comments on issues can provide insights into the
duration of the issues. (5) It is crucial to strike a balance between
prioritizing critical issues and addressing other issues in a timely manner.
Therefore, this study concludes that efficient issue-tracking processes,
effective communication, and collaboration are vital for effective resolution
of issues and bug fixing processes in machine-learning libraries.
- Abstract(参考訳): 問題解決とバグ修正プロセスは、よく最適化された機能を保証するために、ソフトウェア開発と同様の機械学習ライブラリの開発に不可欠である。
機械学習ライブラリのイシュー解決とバグ修正プロセスを理解することで、開発者は改善すべき領域を特定し、イシュー解決とバグ修正のための戦略を最適化することができる。
しかし、この話題に関する詳細な研究は乏しい。
そこで我々は,6つの機械学習ライブラリ,Tensorflow,Keras,Theano,Pytorch,Caffe,Scikit-learnにおけるバグ修正プロセスの課題解決の有効性を検討した。
GitHub Rest APIを通じてGitHubリポジトリから抽出された16,921のイシューを使用して、7つのリサーチ質問(RQ)に対処しました。
rqs分析には相関, ols回帰, パーセンテージと周波数数, ヒートマップなど, データ分析の定量的な方法がいくつか用いられた。
1) マシンラーニングライブラリで発生した問題の最も一般的なカテゴリは、バグ、ドキュメンテーション、最適化、クラッシュ、拡張、新機能要求、ビルド/ci、サポート、パフォーマンスです。
2) 重要なバグの修正、パフォーマンスの最適化、ドキュメントの改善など、これらの問題を解決する効果的な戦略。
3) これらの分類問題はテストとランタイムに関連するもので,6つの機械学習ライブラリすべてに共通している。
(4) 問題に関するコメントの総数を監視することで、問題の期間に関する洞察が得られる。
(5)重要課題の優先順位付けと他の課題へのタイムリーな対処のバランスをとることが不可欠である。
そこで本研究では,効率的な課題追跡プロセス,効果的なコミュニケーション,コラボレーションが,機械学習ライブラリの課題解決とバグフィックスの効果的な解決に不可欠であると結論づける。
関連論文リスト
- Towards Coarse-to-Fine Evaluation of Inference Efficiency for Large Language Models [95.96734086126469]
大規模言語モデル(LLM)は、ユーザが仕事を達成するのを助けるアシスタントとして機能し、高度なアプリケーションの開発をサポートする。
LLMの幅広い応用にとって、推論効率は重要な問題であり、既存の研究で広く研究されている。
各種コードライブラリの推論性能の粗大な解析を行う。
論文 参考訳(メタデータ) (2024-04-17T15:57:50Z) - An Empirical Study of Challenges in Machine Learning Asset Management [15.07444988262748]
既存の研究にもかかわらず、モデルバージョニングやデータトレーサビリティ、コラボレーションといった運用上の課題には、大きな知識ギャップが残っている。
本研究の目的は,開発者フォーラムやプラットフォームから15,065件の投稿を分析し,このギャップに対処することである。
ソフトウェア依存性、モデルデプロイメント、モデルトレーニングが最も議論されている16のマクロトピックにグループ化された、資産管理の課題に関連する133のトピックを明らかにしました。
論文 参考訳(メタデータ) (2024-02-25T05:05:52Z) - Leveraging Print Debugging to Improve Code Generation in Large Language
Models [63.63160583432348]
大規模言語モデル(LLM)はコード生成タスクにおいて大きな進歩を遂げた。
しかし、複雑なデータ構造やアルゴリズムによるプログラミング問題に対処する彼らのパフォーマンスは、依然として準最適である。
そこで本稿では,LLM のデバッグを "print debugging" 手法でガイドする,コンテキスト内学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-10T18:37:59Z) - An Empirical Study on Bugs Inside PyTorch: A Replication Study [10.848682558737494]
私たちは、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けています。
私たちの結果は、PyTorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに近いことを強調しています。
論文 参考訳(メタデータ) (2023-07-25T19:23:55Z) - Automatic Static Bug Detection for Machine Learning Libraries: Are We
There Yet? [14.917820383894124]
Flawfinder、RATS、Cppcheck、Facebook Infer、Clangの5つの人気のある、広く使用されている静的バグ検出を、ソフトウェアバグのキュレートされたデータセットで分析する。
全体として、静的バグ検出装置は、6/410バグ(0.01%)、Flawfinder、RATSといったバグの無視可能な量のバグを検知し、機械学習ライブラリでソフトウェアバグを見つけるのに最も効果的な静的チェッカーであることを示した。
論文 参考訳(メタデータ) (2023-07-09T01:38:52Z) - PyRCA: A Library for Metric-based Root Cause Analysis [66.72542200701807]
PyRCAは、AIOps(AIOps)のためのRoot Cause Analysis(RCA)のオープンソースの機械学習ライブラリである。
複雑なメトリクス因果依存性を明らかにし、インシデントの根本原因を自動的に特定する、包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-06-20T09:55:10Z) - LibAUC: A Deep Learning Library for X-Risk Optimization [43.32145407575245]
本稿では,LibAUC という賞を受賞したディープラーニングライブラリについて紹介する。
LibAUCは、Xリスクと呼ばれるリスク関数のファミリーを最適化するための最先端のアルゴリズムを実装している。
論文 参考訳(メタデータ) (2023-06-05T17:43:46Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - What to Prioritize? Natural Language Processing for the Development of a
Modern Bug Tracking Solution in Hardware Development [0.0]
我々は、異なる教師付き機械学習アルゴリズムを用いて、バグレポートの修正時間、リスク、複雑さを予測するアプローチを提案する。
評価の結果,Universal Sentenceモデルによって生成されたテキスト埋め込みの組み合わせは,他の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-09-28T15:55:10Z) - ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。
メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。
本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文 参考訳(メタデータ) (2021-07-23T22:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。