論文の概要: Learning From Software Failures: A Case Study at a National Space Research Center
- arxiv url: http://arxiv.org/abs/2509.06301v1
- Date: Mon, 08 Sep 2025 03:02:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.94976
- Title: Learning From Software Failures: A Case Study at a National Space Research Center
- Title(参考訳): ソフトウェア失敗から学ぶ:国立宇宙研究センターにおけるケーススタディ
- Authors: Dharun Anandayuvaraj, Zain Hammadeh, Andreas Lund, Alexandra Holloway, James C. Davis,
- Abstract要約: 我々は,国立宇宙研究センターの研究者に対して,10回の詳細なインタビューを通じて,ケーススタディを実施している。
失敗からどのように学ぶか、どのように収集し、文書化し、共有し、教訓を適用します。
私たちの発見は、エンジニアが実際に失敗から学ぶ方法に関する洞察を与えてくれます。
- 参考スコア(独自算出の注目度): 39.92068920479084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software failures can have significant consequences, making learning from failures a critical aspect of software engineering. While software organizations are recommended to conduct postmortems, the effectiveness and adoption of these practices vary widely. Understanding how engineers gather, document, share, and apply lessons from failures is essential for improving reliability and preventing recurrence. High-reliability organizations (HROs) often develop software systems where failures carry catastrophic risks, requiring continuous learning to ensure reliability. These organizations provide a valuable setting to examine practices and challenges for learning from software failures. Such insight could help develop processes and tools to improve reliability and prevent recurrence. However, we lack in-depth industry perspectives on the practices and challenges of learning from failures. To address this gap, we conducted a case study through 10 in-depth interviews with research software engineers at a national space research center. We examine how they learn from failures: how they gather, document, share, and apply lessons. To assess transferability, we include data from 5 additional interviews at other HROs. Our findings provide insight into how engineers learn from failures in practice. To summarize: (1) failure learning is informal, ad hoc, and inconsistently integrated into SDLC; (2) recurring failures persist due to absence of structured processes; and (3) key challenges, including time constraints, knowledge loss from turnover and fragmented documentation, and weak process enforcement, undermine systematic learning. Our findings deepen understanding of how software engineers learn from failures and offer guidance for improving failure management practices.
- Abstract(参考訳): ソフトウェア失敗は、ソフトウェアエンジニアリングにおいて、失敗から学ぶことが重要な側面となる、重大な結果をもたらす可能性がある。
ソフトウェア組織は反省会を行うよう推奨されているが、これらのプラクティスの有効性と採用は様々である。
エンジニアの収集、文書化、共有、失敗からの教訓の適用の仕方を理解することは、信頼性の向上と再発防止に不可欠である。
信頼性の高い組織(HRO)は、障害が壊滅的なリスクを負い、信頼性を確保するために継続的学習を必要とするソフトウェアシステムを開発することが多い。
これらの組織は、ソフトウェア失敗から学ぶためのプラクティスや課題を調べる上で、貴重な設定を提供します。
このような洞察は、信頼性を改善し、再発を防ぐプロセスやツールの開発に役立つだろう。
しかし、私たちは失敗から学ぶためのプラクティスや課題について、深い業界観を欠いています。
このギャップに対処するため、我々は国立宇宙研究センターで研究ソフトウェアエンジニア10名を対象に、ケーススタディを行った。
失敗からどのように学ぶか、どのように収集し、文書化し、共有し、教訓を適用します。
転送可能性を評価するために、他の5つのHROにおける追加インタビューのデータを含める。
私たちの発見は、エンジニアが実際に失敗から学ぶ方法に関する洞察を与えてくれます。
要約すると、(1)失敗学習は非公式で、アドホックで、SDLCに不整合に統合され、(2)構造化プロセスの欠如による繰り返し失敗は継続し、(3)時間制約、ターンオーバーや断片化ドキュメントからの知識喪失、弱いプロセス実行といった重要な課題は、体系的な学習を損なう。
私たちの調査結果は、ソフトウェアエンジニアが障害からどのように学ぶのかを深く理解し、障害管理のプラクティスを改善するためのガイダンスを提供しています。
関連論文リスト
- "So Am I Dr. Frankenstein? Or Were You a Monster the Whole Time?": Mitigating Software Project Failure With Loss-Aversion-Aware Development Methodologies [0.3626013617212666]
英国と米国における600人のソフトウェアエンジニアの経験について、プロジェクト成功の経験について調査している。
経験的評価では、開発の開始前に明確な要件を保証するようなアプローチは、損失回避率が最低で、プロジェクトの成功率が97%に相関している。
論文 参考訳(メタデータ) (2024-10-28T02:57:17Z) - Learning From Lessons Learned: Preliminary Findings From a Study of
Learning From Failure [3.045851438458641]
組織はシステム障害を分析し、学習する。
学んだことに基づいて、システムの技術的部分と人的部分の両方を共同開発する。
確立されたプロセスとツールのサポートにもかかわらず、失敗から学んだことを取り入れ、社会技術システムの信頼性を向上することは容易ではない。
論文 参考訳(メタデータ) (2024-02-14T19:29:04Z) - Security for Machine Learning-based Software Systems: a survey of
threats, practices and challenges [0.76146285961466]
機械学習ベースのモダンソフトウェアシステム(MLBSS)を安全に開発する方法は、依然として大きな課題である。
潜伏中の脆弱性と、外部のユーザーや攻撃者に暴露されるプライバシー問題は、ほとんど無視され、特定が難しい。
機械学習ベースのソフトウェアシステムのセキュリティは、固有のシステム欠陥や外敵攻撃から生じる可能性があると考えている。
論文 参考訳(メタデータ) (2022-01-12T23:20:25Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z) - Dos and Don'ts of Machine Learning in Computer Security [74.1816306998445]
大きな可能性にもかかわらず、セキュリティにおける機械学習は、パフォーマンスを損なう微妙な落とし穴を引き起こす傾向がある。
我々は,学習ベースのセキュリティシステムの設計,実装,評価において共通の落とし穴を特定する。
我々は,落とし穴の回避や軽減を支援するために,研究者を支援するための実用的な勧告を提案する。
論文 参考訳(メタデータ) (2020-10-19T13:09:31Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z) - Curriculum Learning for Reinforcement Learning Domains: A Framework and
Survey [53.73359052511171]
強化学習(Reinforcement Learning, RL)は、エージェントが限られた環境フィードバックしか持たないシーケンシャルな意思決定タスクに対処するための一般的なパラダイムである。
本稿では、RLにおけるカリキュラム学習(CL)の枠組みを提案し、既存のCLメソッドを仮定、能力、目標の観点から調査・分類する。
論文 参考訳(メタデータ) (2020-03-10T20:41:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。