論文の概要: An Empirical Study on Bugs Inside PyTorch: A Replication Study
- arxiv url: http://arxiv.org/abs/2307.13777v1
- Date: Tue, 25 Jul 2023 19:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 14:25:10.497081
- Title: An Empirical Study on Bugs Inside PyTorch: A Replication Study
- Title(参考訳): PyTorch内部のバグに関する実証的研究
- Authors: Vahid Majdinasab and Sharon Chee Yin Ho and Mohayeminul Islam and
Diego Elias Costa and Emad Shihab and Foutse Khomh and Sarah Nadi and
Muhammad Raza
- Abstract要約: 私たちは、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けています。
私たちの結果は、PyTorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに近いことを強調しています。
- 参考スコア(独自算出の注目度): 10.848682558737494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software systems are increasingly relying on deep learning components, due to
their remarkable capability of identifying complex data patterns and powering
intelligent behaviour. A core enabler of this change in software development is
the availability of easy-to-use deep learning libraries. Libraries like PyTorch
and TensorFlow empower a large variety of intelligent systems, offering a
multitude of algorithms and configuration options, applicable to numerous
domains of systems. However, bugs in those popular deep learning libraries also
may have dire consequences for the quality of systems they enable; thus, it is
important to understand how bugs are identified and fixed in those libraries.
Inspired by a study of Jia et al., which investigates the bug identification
and fixing process at TensorFlow, we characterize bugs in the PyTorch library,
a very popular deep learning framework. We investigate the causes and symptoms
of bugs identified during PyTorch's development, and assess their locality
within the project, and extract patterns of bug fixes. Our results highlight
that PyTorch bugs are more like traditional software projects bugs, than
related to deep learning characteristics. Finally, we also compare our results
with the study on TensorFlow, highlighting similarities and differences across
the bug identification and fixing process.
- Abstract(参考訳): ソフトウェアシステムは、複雑なデータパターンを識別し、インテリジェントな振る舞いをパワーアップする際、ますますディープラーニングコンポーネントに依存している。
ソフトウェア開発におけるこの変更の主要な実現要因は、簡単に使えるディープラーニングライブラリの提供である。
PyTorchやTensorFlowといったライブラリは、さまざまなインテリジェントシステムに権限を与え、さまざまなアルゴリズムと設定オプションを提供し、多数のシステムのドメインに適用できる。
しかし、これらの人気のあるディープラーニングライブラリのバグは、それらを可能にするシステムの品質に希少な結果をもたらす可能性があるため、それらのライブラリでどのようにバグが特定され、修正されるかを理解することが重要である。
TensorFlowのバグ識別と修正プロセスを調査するJiaらの研究に触発されて、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けました。
PyTorchの開発中に発見されたバグの原因と症状を調査し,プロジェクトの局所性を評価し,バグ修正のパターンを抽出する。
結果は、pytorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに似ていることを強調する。
最後に、私たちの結果とTensorFlowの研究を比較し、バグ識別と修正プロセスの類似点と相違点を強調します。
関連論文リスト
- Towards Understanding the Challenges of Bug Localization in Deep
Learning Systems [2.9312156642007294]
我々は、ディープラーニングシステムにおけるバグのローカライズに関する課題をより深く理解するために、大規模な実証的研究を行っている。
まず,ディープラーニングシステムの2,365バグと,従来のソフトウェアによる2,913バグを用いて,既存の4つのテクニックのバグローカライズ性能を判定する。
第2に,ディープラーニングシステムにおけるバグタイプの違いが,バグのローカライゼーションに与える影響を評価する。
論文 参考訳(メタデータ) (2024-02-01T21:17:42Z) - Towards Enhancing the Reproducibility of Deep Learning Bugs: An Empirical Study [13.17302533571231]
本稿では,ディープラーニングのバグを再現する上で重要な課題について検討する。
重要な問題を改善する可能性のある編集動作と有用な情報を特定します。
165件のバグのうち148件を再現しました。
論文 参考訳(メタデータ) (2024-01-05T21:30:13Z) - Software issues report for bug fixing process: An empirical study of
machine-learning libraries [0.0]
6つの機械学習ライブラリにおけるバグ修正プロセスにおける課題解決の有効性について検討した。
マシンラーニングライブラリで最も一般的な問題カテゴリは、バグ、ドキュメント、最適化、クラッシュ、拡張、新機能要求、ビルド/CI、サポート、パフォーマンスである。
本研究は,効率的な課題追跡プロセス,効果的なコミュニケーション,コラボレーションが,機械学習ライブラリの課題解決やバグ修正プロセスの効果的な解決に不可欠である,と結論付けている。
論文 参考訳(メタデータ) (2023-12-10T21:33:19Z) - Less is More? An Empirical Study on Configuration Issues in Python PyPI
Ecosystem [38.44692482370243]
Pythonはオープンソースコミュニティで広く使われている。
サードパーティのライブラリは依存関係の衝突を引き起こす可能性があるため、研究者は依存関係の衝突検知器を開発する必要がある。
依存関係を自動的に推論する試みが実施された。
論文 参考訳(メタデータ) (2023-10-19T09:07:51Z) - Automatic Static Bug Detection for Machine Learning Libraries: Are We
There Yet? [14.917820383894124]
Flawfinder、RATS、Cppcheck、Facebook Infer、Clangの5つの人気のある、広く使用されている静的バグ検出を、ソフトウェアバグのキュレートされたデータセットで分析する。
全体として、静的バグ検出装置は、6/410バグ(0.01%)、Flawfinder、RATSといったバグの無視可能な量のバグを検知し、機械学習ライブラリでソフトウェアバグを見つけるのに最も効果的な静的チェッカーであることを示した。
論文 参考訳(メタデータ) (2023-07-09T01:38:52Z) - PyRCA: A Library for Metric-based Root Cause Analysis [66.72542200701807]
PyRCAは、AIOps(AIOps)のためのRoot Cause Analysis(RCA)のオープンソースの機械学習ライブラリである。
複雑なメトリクス因果依存性を明らかにし、インシデントの根本原因を自動的に特定する、包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-06-20T09:55:10Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文 参考訳(メタデータ) (2022-01-14T00:16:57Z) - LibFewShot: A Comprehensive Library for Few-shot Learning [78.58842209282724]
近年,画像分類に注目が集まり,近年顕著な進歩が見られた。
近年の研究では、データ強化、事前学習、知識蒸留、自己超越といった多くの一般的な手法や技法が、数発の学習法の性能を大幅に向上させる可能性があることが暗黙的に示されている。
そこで本研究では,PyTorchに固有の単一言語を組み込んだ一貫したフレームワークにおいて,17の最先端の複数ショット学習手法を再実装することにより,小ショット学習のための総合ライブラリ(LibFewShot)を提案する。
論文 参考訳(メタデータ) (2021-09-10T14:12:37Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。