論文の概要: Software Testing Beyond Closed Worlds: Open-World Games as an Extreme Case
- arxiv url: http://arxiv.org/abs/2604.04047v1
- Date: Sun, 05 Apr 2026 10:24:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.893193
- Title: Software Testing Beyond Closed Worlds: Open-World Games as an Extreme Case
- Title(参考訳): クローズドワールドを超えたソフトウェアテスト - 極端なケースとしてのオープンワールドゲーム
- Authors: Yusaku Kato, Norihiro Yoshida, Erina Makihara, Katsuro Inoue,
- Abstract要約: 本稿では,オープンワールドゲームを用いて,クローズドワールドテストの限界を検討する。
本研究では,不確実な行動空間,非決定的実行結果,妄想的行動境界,不安定なテストオラクルなど,そのようなシステムにおけるテストが複雑になる繰り返し特性を同定する。
- 参考スコア(独自算出の注目度): 0.48414873775965206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software testing research has traditionally relied on closed-world assumptions, such as finite state spaces, reproducible executions, and stable test oracles. However, many modern software systems operate under uncertainty, non-determinism, and evolving conditions, challenging these assumptions. This paper uses open-world games as an extreme case to examine the limitations of closed-world testing. Through a set of observations grounded in prior work, we identify recurring characteristics that complicate testing in such systems, including inexhaustible behavior spaces, non-deterministic execution outcomes, elusive behavioral boundaries, and unstable test oracles. Based on these observations, we articulate a vision of software testing beyond closed-world assumptions, in which testing supports the characterization and interpretation of system behavior under uncertainty. We further discuss research directions for automated test generation, evaluation metrics, and empirical study design. Although open-world games serve as the motivating domain, the challenges and directions discussed in this paper extend to a broader class of software systems operating in dynamic and uncertain environments.
- Abstract(参考訳): ソフトウェアテストの研究は伝統的に、有限状態空間、再現可能な実行、安定したテストオラクルなど、クローズドワールドの仮定に依存してきた。
しかし、多くの現代のソフトウェアシステムは不確実性、非決定性、進化する条件の下で動作し、これらの仮定に挑戦する。
本稿では,オープンワールドゲームを用いて,クローズドワールドテストの限界を検討する。
先行研究に根ざした一連の観察を通して、不確実な行動空間、非決定的実行結果、解答的行動境界、不安定なテストオラクルを含む、そのようなシステムにおけるテストが複雑になる繰り返し特性を同定する。
これらの観察に基づいて,テストが不確実性の下でのシステム動作の特性と解釈をサポートする,クローズドワールドな仮定を超えたソフトウェアテストのビジョンを明確に述べる。
さらに,自動テスト生成,評価指標,実証的研究設計の方向性について論じる。
オープンワールドゲームはモチベーション領域として機能するが,本稿で論じる課題と方向性は,ダイナミックで不確実な環境で動作するソフトウェアシステムのより広範なクラスにまで及んでいる。
関連論文リスト
- WebTestBench: Evaluating Computer-Use Agents towards End-to-End Automated Web Testing [57.7131457251794]
エンドツーエンドの自動Webテストを評価するベンチマークであるWebTestBenchを紹介します。
テストプロセスを2つのカスケードサブタスク、チェックリストの生成と欠陥検出に分解し、WebTesterを提案する。
以上の結果から,現在のコンピュータ利用エージェント能力と産業レベルの展開要求との間に大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2026-03-26T09:27:29Z) - Software Entropy: A Statistical Mechanics Framework for Software Testing [0.0]
統計力学に基づくソフトウェアエントロピーの形式的定義を導入する。
この枠組みの中で、突然変異解析は局所的にアクセス可能なマイクロステート空間の実用的な近似を提供する。
本稿では,テストスイートがプログラム空間をどのように構成するかを定量化する指標を提案する。
論文 参考訳(メタデータ) (2026-03-20T21:55:45Z) - Testing Storage-System Correctness: Challenges, Fuzzing Limitations, and AI-Augmented Opportunities [3.6983656191474767]
システムテストに関する何十年もの研究にもかかわらず、多くのストレージシステム障害は、体系的に公開することが難しいままである。
このサーベイでは、システムテストのストレージ中心のビューを採用し、対象とする実行特性と障害メカニズムに応じて既存のテクニックを整理する。
論文 参考訳(メタデータ) (2026-02-02T11:34:05Z) - Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.1999907891494]
We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文 参考訳(メタデータ) (2025-10-01T07:59:03Z) - Towards Few-Shot Learning in the Open World: A Review and Beyond [52.41344813375177]
少ないショット学習は、人間の知性を模倣し、大きな一般化と伝達性を実現することを目的としている。
本稿では,FSLをオープンワールド環境に適用するための最近の進歩について概説する。
既存の手法は,3つの異なるタイプのオープンワールド・マイクロショット・ラーニングに分類する。
論文 参考訳(メタデータ) (2024-08-19T06:23:21Z) - Open-world machine learning: A review and new outlooks [117.33922838201993]
オープンワールド機械学習の全体像を論じる。
未知の拒絶、新奇な発見、継続的な学習を調査する。
これは研究者がそれぞれの分野でより強力なAIシステムを構築するのを助けることを目的としている。
論文 参考訳(メタデータ) (2024-03-04T06:25:26Z) - A Survey on Scenario-Based Testing for Automated Driving Systems in
High-Fidelity Simulation [26.10081199009559]
道路上でシステムをテストすることは、現実世界と望ましいアプローチに最も近いが、非常にコストがかかる。
一般的な選択肢は、ADSのパフォーマンスを、よく設計されたシナリオ、すなわちシナリオベースのテストで評価することである。
高忠実度シミュレータはこの設定で、何のシナリオかをテストする際の柔軟性と利便性を最大化するために広く使われている。
論文 参考訳(メタデータ) (2021-12-02T03:41:33Z) - Test and Evaluation Framework for Multi-Agent Systems of Autonomous
Intelligent Agents [0.0]
人工知能を組み込んだサイバー物理システムの複雑なアンサンブルのための統一的なテストと評価フレームワークを開発することの課題について考察する。
本稿では,開発ライフサイクルだけでなく,システムが学習し,適応するにつれて,テストと評価を実施できるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-25T21:42:27Z) - From Simulation to Real World Maneuver Execution using Deep
Reinforcement Learning [69.23334811890919]
深層強化学習(Deep Reinforcement Learning)は、さまざまな分野における多くの制御タスクを解決できることが証明されている。
これは主に、シミュレーションデータと実世界のデータ間のドメイン適応の欠如と、トレインデータセットとテストデータセットの区別の欠如による。
本稿では,エージェントが同時に訓練される複数の環境に基づくシステムを提案する。
論文 参考訳(メタデータ) (2020-05-13T14:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。