論文の概要: Automated Statistical Testing and Certification of a Reliable Model-Coupling Server for Scientific Computing
- arxiv url: http://arxiv.org/abs/2505.09769v1
- Date: Wed, 14 May 2025 20:00:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.094719
- Title: Automated Statistical Testing and Certification of a Reliable Model-Coupling Server for Scientific Computing
- Title(参考訳): 科学計算のための信頼性のあるモデル結合サーバの自動統計的テストと認証
- Authors: Seth Wolfgang, Lan Lin, Fengguang Song,
- Abstract要約: シーケンスベースの仕様と使用法駆動の統計テストは、厳密で費用対効果の高いソフトウェア開発のために設計されている。
我々は厳格な仕様とテスト手法を組み合わせることで、より弾力性のあるWebサービスの品質保証に焦点を合わせます。
- 参考スコア(独自算出の注目度): 0.7100520098029439
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Sequence-based specification and usage-driven statistical testing are designed for rigorous and cost-effective software development, offering a semi-formal approach to assessing the behavior of complex systems and interactions between various components. This approach is particularly valuable for scientific computing applications in which comprehensive tests are needed to prevent flawed results or conclusions. As scientific discovery becomes increasingly more complex, domain scientists couple multiple scientific computing models or simulations to solve intricate multiphysics and multiscale problems. These model-coupling applications use a hardwired coupling program or a flexible web service to link and combine different models. In this paper, we focus on the quality assurance of the more elastic web service via a combination of rigorous specification and testing methods. The application of statistical testing exposes problems ignored by pre-written unit tests and highlights areas in the code where failures might occur. We certify the model-coupling server controller with a derived reliability statistic, offering a quantitative measure to support a claim of its robustness.
- Abstract(参考訳): シーケンスベースの仕様と使用法駆動の統計テストは厳密で費用対効果の高いソフトウェア開発のために設計されており、複雑なシステムの振る舞いと様々なコンポーネント間の相互作用を評価するための半形式的なアプローチを提供する。
このアプローチは、欠陥のある結果や結論を防ぐために包括的なテストが必要である科学計算アプリケーションにとって特に有用である。
科学的な発見がますます複雑になるにつれて、ドメイン科学者は複雑な多物理学とマルチスケールの問題を解決するために、複数の科学計算モデルまたはシミュレーションを2つに分けている。
これらのモデル結合アプリケーションは、ハードワイヤ結合プログラムまたはフレキシブルなWebサービスを使用して、異なるモデルをリンクし、結合します。
本稿では、厳密な仕様とテスト手法を組み合わせることで、より弾力的なWebサービスの品質保証に焦点を当てる。
統計的テストの適用は、事前に記述されたユニットテストで無視された問題を明らかにし、障害が発生する可能性のあるコードの領域を強調する。
我々は,モデル結合型サーバコントローラを信頼性統計量で認証し,その堅牢性の主張を支援するための定量的尺度を提供する。
関連論文リスト
- Using Causal Inference to Test Systems with Hidden and Interacting Variables: An Evaluative Case Study [2.1146241717926664]
大規模なパラメータ空間、非決定性、高い計算コストを持つソフトウェアシステムは、テストが困難である。
因果推論に基づく最近のソフトウェアテスト技術は、そのような特性を示すシステムにうまく適用されている。
論文 参考訳(メタデータ) (2025-04-23T08:50:24Z) - AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [45.0447118979891]
AutoKaggleは、コード実行と単体テストを組み合わせた反復的な開発プロセスを実装し、コードの正しさとロジックの整合性を保証する。
データクリーニング、特徴工学、モデリングのための検証済み機能を含む汎用データサイエンスツールキットは、このソリューションの基礎を形成します。
AutoKaggleは、一般的なデータサイエンスパイプラインにおけるバリデーションレート0.85と総合スコア0.82を達成する。
論文 参考訳(メタデータ) (2024-10-27T12:44:25Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - Constrained Adversarial Learning for Automated Software Testing: a literature review [0.0]
この文献レビューは、敵の学習やソフトウェアテストに適用される制約付きデータ生成アプローチの現状に焦点を当てている。
ホワイトボックス,グレイボックス,ブラックボックステストに特化したテストの利点と限界を分析した。
論文 参考訳(メタデータ) (2023-03-14T00:27:33Z) - Testing Causality in Scientific Modelling Software [0.26388783516590225]
Causal Testing Frameworkは、Causal Inferenceテクニックを使用して、既存のデータから因果効果を確立するフレームワークである。
実世界の科学モデルをカバーする3つのケーススタディとして、Causal Testing Frameworkがいかにメタモルフィックテストの結果を推測できるかを示す。
論文 参考訳(メタデータ) (2022-09-01T10:57:54Z) - Learn then Test: Calibrating Predictive Algorithms to Achieve Risk
Control [67.52000805944924]
Learn then Test (LTT)は、機械学習モデルを校正するフレームワークである。
私たちの主な洞察は、リスクコントロール問題を複数の仮説テストとして再設計することです。
我々は、コンピュータビジョンの詳細な実例を用いて、コア機械学習タスクの新しいキャリブレーション手法を提供するために、我々のフレームワークを使用します。
論文 参考訳(メタデータ) (2021-10-03T17:42:03Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - A New Score for Adaptive Tests in Bayesian and Credal Networks [64.80185026979883]
テストは、そのシークエンスと質問数とが、テイカーの推定スキルに基づいて動的に調整されるときに適応する。
後部確率のモードに基づいて、別のスコアの族を提示するので、説明し易い。
論文 参考訳(メタデータ) (2021-05-25T20:35:42Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Data Driven Testing of Cyber Physical Systems [12.93632948681342]
そこで本研究では,CPSの故障防止テストケースを自動生成する手法を提案する。
スマートな建物を管理するアプリケーションから収集されたデータは、環境のモデルを学ぶために使われてきた。
論文 参考訳(メタデータ) (2021-02-23T04:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。