Fugu-MT 論文翻訳(概要): SURE: A Visualized Failure Indexing Approach using Program Memory Spectrum

論文の概要: SURE: A Visualized Failure Indexing Approach using Program Memory Spectrum

arxiv url: http://arxiv.org/abs/2310.12415v1
Date: Thu, 19 Oct 2023 02:04:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-21 14:51:17.922568
Title: SURE: A Visualized Failure Indexing Approach using Program Memory Spectrum
Title（参考訳）: SURE: プログラムメモリスペクトルを用いた視覚的障害指標化手法
Authors: Yi Song, Xihao Zhang, Xiaoyuan Xie, Songqiang Chen, Quanming Liu, Ruizhi Gao
Abstract要約: 本稿では,プログラムメモリスペクトルを用いたsualized failuRe indExingアプローチであるSUREを提案する。まず、失敗したテストケースの実行中に、事前に設定されたブレークポイントで実行時のメモリ情報を収集する。 2つの障害のプロキシとして機能するPMSイメージの任意のペアは、トレーニングされたシームズ畳み込みニューラルネットワークに供給される。
参考スコア（独自算出の注目度）: 2.4151044161696587
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Failure indexing is a longstanding crux in software testing and debugging, the goal of which is to automatically divide failures (e.g., failed test cases) into distinct groups according to the culprit root causes, as such multiple faults in a faulty program can be handled independently and simultaneously. This community has long been plagued by two challenges: 1) The effectiveness of division is still far from promising. Existing techniques only employ a limited source of run-time data (e.g., code coverage) to be failure proximity, which typically delivers unsatisfactory results. 2) The outcome can be hardly comprehensible. A developer who receives the failure indexing result does not know why all failures should be divided the way they are. This leads to difficulties for developers to be convinced by the result, which in turn affects the adoption of the results. To tackle these challenges, in this paper, we propose SURE, a viSUalized failuRe indExing approach using the program memory spectrum. We first collect the run-time memory information at preset breakpoints during the execution of failed test cases, and transform it into human-friendly images (called program memory spectrum, PMS). Then, any pair of PMS images that serve as proxies for two failures is fed to a trained Siamese convolutional neural network, to predict the likelihood of them being triggered by the same fault. Results demonstrate the effectiveness of SURE: It achieves 101.20% and 41.38% improvements in faults number estimation, as well as 105.20% and 35.53% improvements in clustering, compared with the state-of-the-art technique in this field, in simulated and real-world environments, respectively. Moreover, we carry out a human study to quantitatively evaluate the comprehensibility of PMS, revealing that this novel type of representation can help developers better comprehend failure indexing results.
Abstract（参考訳）: フェールインデクシングは、ソフトウェアのテストとデバッグにおいて長年続く難題であり、障害プログラムにおける複数の障害が独立して同時に処理されるように、失敗(例えば、失敗したテストケース)を原因の根本原因に従って個別のグループに自動的に分割することを目的としている。このコミュニティは長い間、2つの課題に悩まされてきた。 1) 分割の有効性は, まだ有望とは程遠い。既存のテクニックでは、実行時のデータ(例えばコードカバレッジ)の限られたソースしか使用していないため、通常は不満足な結果をもたらす。 2)結果はほとんど理解できない。障害インデックス結果を受信した開発者は、すべての障害を現在の方法で分割すべき理由を知らない。これにより、開発者は結果に納得することが難しくなり、結果として結果の採用に影響を及ぼす。本稿では,これらの課題に対処するため,プログラムメモリスペクトルを用いたsualized failuRe indExingアプローチであるSUREを提案する。まず、テストケースの実行中に予め設定されたブレークポイントで実行時のメモリ情報を収集し、それを人間フレンドリーな画像(プログラムメモリスペクトル、PMS)に変換する。そして、2つの障害のプロキシとなる1対のpms画像がトレーニングされたシアム畳み込みニューラルネットワークに送られ、それらが同じ障害によって引き起こされる可能性を予測する。その結果、101.20%と41.38%の障害数推定の改善と、105.20%と35.53%のクラスタリング改善が得られた。さらに, PMSの理解度を定量的に評価するために人間による研究を行い, この新しい表現は, ディベロッパによる障害指標の理解に有効であることを示した。

関連論文リスト

Causal Graph Recovery in Neuroimaging through Answer Set Programming [2.762303951933521]
制約最適化アプローチ、特に解集合プログラミング(ASP)を用いて、最適な解集合を見つける。 ASPは、最も可能性の高い基盤グラフを識別するだけでなく、専門家の選択のための可能なグラフの同値クラスも提供する。提案手法は,F1スコアを平均12%向上させるため,確立された手法の上にメタアプローチとして適用可能であることを示す。
論文参考訳（メタデータ） (2025-06-10T22:51:30Z)
Machine Learning for Consistency Violation Faults Analysis [0.0]
本研究では,分散システムにおける整合性障害(cvfs)の影響を機械学習で解析する手法を提案する。プログラム遷移ランクとそれに対応する効果を計算し,システム動作に対するcvfsの影響を定量化する。実験の結果、有望な性能を示し、テスト損失は4.39、絶対誤差は1.5である。
論文参考訳（メタデータ） (2025-05-20T22:11:43Z)
On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [53.0667196725616]
ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。 DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文参考訳（メタデータ） (2025-03-28T16:25:06Z)
How Execution Features Relate to Failures: An Empirical Study and Diagnosis Approach [11.857060911501016]
障害のローカライゼーションは、障害の原因となる可能性のあるコード領域を特定することを目的としている。従来のテクニックは主にステートメントの実行と失敗を関連付けています。我々は17の実行特徴を分析し,その相関性を評価した。
論文参考訳（メタデータ） (2025-02-25T22:00:05Z)
BEEM: Boosting Performance of Early Exit DNNs using Multi-Exit Classifiers as Experts [5.402030962296633]
ディープニューラルネットワーク(DNN)における推論遅延を低減する手段として、初期のExitテクニックが登場した。本稿では,出口分類器を専門家のBEEMとして扱い,信頼性スコアを集計する新たな意思決定基準を提案する。提案手法は最先端のEE手法の性能を向上し,1.5倍から2.1倍の高速化を実現している。
論文参考訳（メタデータ） (2025-02-02T10:35:19Z)
Typicalness-Aware Learning for Failure Detection [26.23185979968123]
ディープニューラルネットワーク(DNN)は、しばしば自信過剰な問題に悩まされる。そこで本研究では,本問題に対処し,故障検出性能を向上させるために,S typicalness-Aware Learning (TAL) と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2024-11-04T11:09:47Z)
Can Search-Based Testing with Pareto Optimization Effectively Cover Failure-Revealing Test Inputs? [2.038863628148453]
我々は,検索領域内の障害発生領域をカバーするには,検索ベースソフトウェアテスト(SBST)が不十分であると主張している。本研究では,入力空間におけるフェールリベリングテスト入力のカバレッジを,Coverage Inverted Distance品質指標と呼ぶ指標を用いて測定する。
論文参考訳（メタデータ） (2024-10-15T16:44:40Z)
Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress [31.952925824381325]
本稿では,障害検出を補完する2つのカテゴリに分割するランタイム監視フレームワークを提案する。視覚言語モデル(VLM)を用いて、ポリシーがタスクを解決しないアクションを確実かつ一貫して行うことを検知する。時間的一貫性検出とVLMランタイム監視を統一することにより、Sentinelは2つの検出器のみを使用する場合よりも18%の障害を検出する。
論文参考訳（メタデータ） (2024-10-06T22:13:30Z)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。 BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳（メタデータ） (2024-08-30T15:39:34Z)
Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。実験結果から,EIは性能と試料効率の両立を図った。
論文参考訳（メタデータ） (2022-10-18T05:19:26Z)
Fast and Accurate Error Simulation for CNNs against Soft Errors [64.54260986994163]
本稿では,誤りシミュレーションエンジンを用いて,コナールニューラルネットワーク(CNN)の信頼性解析のためのフレームワークを提案する。これらの誤差モデルは、故障によって誘導されるCNN演算子の出力の破損パターンに基づいて定義される。提案手法は,SASSIFIの欠陥効果の約99%の精度と,限定的なエラーモデルのみを実装した44倍から63倍までのスピードアップを実現する。
論文参考訳（メタデータ） (2022-06-04T19:45:02Z)
GRACE-C: Generalized Rate Agnostic Causal Estimation via Constraints [3.2374399328078285]
時系列データから因果学習アルゴリズムによって推定される図形構造は、生成プロセスの因果時間スケールがデータの測定時間スケールと一致しない場合、誤解を招く因果情報を提供することができる。既存のアルゴリズムは、この課題に対応するための限られたリソースを提供するため、研究者は彼らが知っているモデルを使うか、あるいは完全に因果学習を行う必要がある。既存の方法は、(1)因果差と測定値の違いが知られていること、(2)時間スケールの違いが不明な場合にのみ非常に少数のランダム変数を扱うこと、(3)変数のペアにのみ適用されること、4)変数のペアにしか適用できないこと、など、四つの異なる欠点に直面している。
論文参考訳（メタデータ） (2022-05-18T22:38:57Z)
Intervention Efficient Algorithm for Two-Stage Causal MDPs [15.838256272508357]
本稿では,報酬を生成する因果グラフに対応するマルコフ決定過程(MDP)について検討する。この設定では、学習者の目標は、各状態の変数に介入することで高い報酬をもたらす原子的介入を特定することである。最近の因果関係の枠組みを一般化し、この研究は2段階の因果関係のMDPに対する(単純な)後悔の最小化保証を開発する。
論文参考訳（メタデータ） (2021-11-01T12:22:37Z)
Distributionally Robust Semi-Supervised Learning Over Graphs [68.29280230284712]
グラフ構造化データに対する半教師付き学習(SSL)は、多くのネットワークサイエンスアプリケーションに現れる。グラフ上の学習を効率的に管理するために,近年,グラフニューラルネットワーク(GNN)の変種が開発されている。実際に成功したにも拘わらず、既存の手法のほとんどは、不確実な結節属性を持つグラフを扱うことができない。ノイズ測定によって得られたデータに関連する分布の不確実性によっても問題が発生する。分散ロバストな学習フレームワークを開発し,摂動に対する定量的ロバスト性を示すモデルを訓練する。
論文参考訳（メタデータ） (2021-10-20T14:23:54Z)
Global Optimization of Objective Functions Represented by ReLU Networks [77.55969359556032]
ニューラルネットワークは複雑で非敵対的な関数を学ぶことができ、安全クリティカルな文脈でそれらの正しい振る舞いを保証することは困難である。ネットワーク内の障害を見つけるための多くのアプローチ(例えば、敵の例)があるが、これらは障害の欠如を保証できない。本稿では,最適化プロセスを検証手順に統合し,本手法よりも優れた性能を実現する手法を提案する。
論文参考訳（メタデータ） (2020-10-07T08:19:48Z)
DARTS-: Robustly Stepping out of Performance Collapse Without Indicators [74.21019737169675]
異なるアーキテクチャ検索は、長期にわたるパフォーマンスの不安定さに悩まされる。ヘッセン固有値のような指標は、性能が崩壊する前に探索を止める信号として提案される。本稿では,崩壊を解決するために,より微妙で直接的なアプローチをとる。
論文参考訳（メタデータ） (2020-09-02T12:54:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。