論文の概要: SETBVE: Quality-Diversity Driven Exploration of Software Boundary Behaviors
- arxiv url: http://arxiv.org/abs/2505.19736v1
- Date: Mon, 26 May 2025 09:20:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.318457
- Title: SETBVE: Quality-Diversity Driven Exploration of Software Boundary Behaviors
- Title(参考訳): SETBVE: ソフトウェア境界の振る舞いの多様性駆動による探索
- Authors: Sabinakhon Akbarova, Felix Dobslaw, Francisco Gomes de Oliveira Neto, Robert Feldt,
- Abstract要約: ソフトウェアシステムは入力特性に基づいて異なる振る舞いを示し、しばしば入力ドメイン間の境界で障害が発生する。
従来の境界値分析(BVA)は手動のドメインに依存し、自動化された境界値探索(BVE)メソッドは通常、単一の品質メトリクスを最適化する。
我々は、品質多様性(QD)最適化を利用して、より広い範囲の境界を体系的に発見・洗練する、自動ブラックボックスBVEのためのカスタマイズ可能なモジュラーフレームワークSETBVEを紹介する。
- 参考スコア(独自算出の注目度): 6.736000553666346
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Software systems exhibit distinct behaviors based on input characteristics, and failures often occur at the boundaries between input domains. Traditional Boundary Value Analysis (BVA) relies on manual heuristics, while automated Boundary Value Exploration (BVE) methods typically optimize a single quality metric, risking a narrow and incomplete survey of boundary behaviors. We introduce SETBVE, a customizable, modular framework for automated black-box BVE that leverages Quality-Diversity (QD) optimization to systematically uncover and refine a broader spectrum of boundaries. SETBVE maintains an archive of boundary pairs organized by input- and output-based behavioral descriptors. It steers exploration toward underrepresented regions while preserving high-quality boundary pairs and applies local search to refine candidate boundaries. In experiments with ten integer-based functions, SETBVE outperforms the baseline in diversity, boosting archive coverage by 37 to 82 percentage points. A qualitative analysis reveals that SETBVE identifies boundary candidates the baseline misses. While the baseline method typically plateaus in both diversity and quality after 30 seconds, SETBVE continues to improve in 600-second runs, demonstrating better scalability. Even the simplest SETBVE configurations perform well in identifying diverse boundary behaviors. Our findings indicate that balancing quality with behavioral diversity can help identify more software edge-case behaviors than quality-focused approaches.
- Abstract(参考訳): ソフトウェアシステムは入力特性に基づいて異なる振る舞いを示し、しばしば入力ドメイン間の境界で障害が発生する。
従来の境界値分析(BVA)は手動のヒューリスティックスに依存し、自動化された境界値探索(BVE)手法は一般的に単一の品質指標を最適化し、境界の振舞いを狭く不完全な調査をするリスクを負う。
我々は、品質多様性(QD)最適化を利用して、より広い範囲の境界を体系的に発見・洗練する、自動ブラックボックスBVEのためのカスタマイズ可能なモジュラーフレームワークSETBVEを紹介する。
SETBVEは、入力と出力に基づく振る舞い記述子によって構成された境界対のアーカイブを維持している。
高品質な境界ペアを保持しながら、未表現領域を探索し、候補境界を洗練させるために局所探索を適用する。
10個の整数ベースの関数を用いた実験では、SETBVEは多様性のベースラインよりも優れており、アーカイブのカバレッジは37から82ポイント向上している。
定性的な分析により、SETBVEは境界候補をベースラインミスと同定することが明らかになった。
ベースライン法は通常、多様性と品質の両方を30秒後に高めるが、SETBVEは600秒で改善を続け、スケーラビリティが向上している。
最も単純なSETBVE構成でさえ、多様な境界挙動を識別するのにうまく機能する。
この結果から,品質と振る舞いの多様性のバランスが,品質重視のアプローチよりもソフトウェアエッジケースの振る舞いを識別する上で有効であることが示唆された。
関連論文リスト
- Overlap-Aware Feature Learning for Robust Unsupervised Domain Adaptation for 3D Semantic Segmentation [9.578322021478426]
3Dポイントクラウドセマンティックセグメンテーション(PCSS)は、ロボットシステムと自律運転における環境認識の基礎である。
既存の方法は、現実の摂動(例えば、雪、霧、雨)と敵の歪みに固有の脆弱性を批判的に見落としている。
この研究は、まず、現在のPCSS-UDAロバスト性を損なう2つの本質的な制限を特定する。
1) 強靭性指標による敵攻撃・破壊タイプに対するレジリエンスを定量化する頑健性評価モデル,2) 注意誘導重複抑制による識別構造を維持しつつ,双方向のドメインマッピングを可能にする非可逆的注意アライメントモジュール(IAAM) とからなる三部構成のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-02T12:16:23Z) - BoundMatch: Boundary detection applied to semi-supervised segmentation for urban-driving scenes [6.236890292833387]
半教師付きセマンティックセマンティックセグメンテーション(SS-SS)は、高密度ピクセルラベリングの重いアノテーション負担を軽減することを目的としている。
セマンティック境界検出を一貫性正規化パイプラインに統合する,新しいマルチタスクSS-SSフレームワークであるBoundMatchを提案する。
我々の中核的なメカニズムである境界一貫性規則化マルチタスク学習は、教師と生徒のモデル間の予測合意を強制する。
論文 参考訳(メタデータ) (2025-03-30T17:02:26Z) - Multi-Attribute Constraint Satisfaction via Language Model Rewriting [67.5778646504987]
マルチ属性制約満足度(英: Multi-Attribute Constraint Satisfaction, MACS)は、言語モデルを微調整して、複数の外部実値属性に対するユーザ指定制約を満たす手法である。
我々の研究は、NLPやバイオインフォマティクスにまたがる多様な応用に影響を及ぼす、一般化および実値多属性制御のための新しい道を開く。
論文 参考訳(メタデータ) (2024-12-26T12:36:39Z) - Targeted Deep Learning System Boundary Testing [2.895034191799291]
深層学習システム境界の詳細な探索を目的とした,新しいブラックボックステストジェネレータであるMimicryを紹介する。
Mimicryは、DL出力の確率的性質を活用して境界試験を行い、探索の有望な方向を特定する。
スタイルベースのGANを使用して、入力表現をコンテンツとスタイルコンポーネントに切り離し、制御された機能混合によって決定境界を近似することができる。
論文 参考訳(メタデータ) (2024-08-12T16:14:55Z) - Fine-grained Dynamic Network for Generic Event Boundary Detection [9.17191007695011]
そこで我々は,DyBDetという汎用イベント境界のための新しい動的パイプラインを提案する。
マルチエグジットネットワークアーキテクチャを導入することで、DyBDetは、異なるビデオスニペットへのアロケーションを自動的に学習する。
Kinetics-GEBD と TAPOS のデータセットに挑戦する実験では、動的戦略の採用が GEBD タスクに大きく貢献することを示した。
論文 参考訳(メタデータ) (2024-07-05T06:02:46Z) - ELSA: Evaluating Localization of Social Activities in Urban Streets using Open-Vocabulary Detection [22.420962041487282]
本稿では,社会活動のローカライゼーションを評価するELSAについて紹介する。
重なり合う予測における意味的一貫性を評価するため,新しい信頼度スコア計算手法であるNLSEと,新しい動的ボックス集約(DBA)アルゴリズムを導入する。
我々は,広く使用されているSOTAモデルであるGrounding DINO, Detic, OWL, MDETRについて報告する。
論文 参考訳(メタデータ) (2024-06-03T17:32:23Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。