論文の概要: ISTQB Certifications Under the Lens: Their Contributions to the Software-Testing Profession; and AI-assisted Synthesis of Practitioners' Endorsements and Criticisms
- arxiv url: http://arxiv.org/abs/2603.14572v1
- Date: Sun, 15 Mar 2026 19:51:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.890146
- Title: ISTQB Certifications Under the Lens: Their Contributions to the Software-Testing Profession; and AI-assisted Synthesis of Practitioners' Endorsements and Criticisms
- Title(参考訳): レンズ下での ISTQB 認定:ソフトウェアテストの専門職への貢献,そしてAI による実践者の支持と批判の合成
- Authors: Vehid Geruslu, Alper Buğra Keleş, Sevde Değirmenci, Zafar Jafarov, Aytan Mövsümova, Atif Namazov,
- Abstract要約: 我々は,AI支援型多言語文学レビュー(MLR)を実施し,実践者の支持と批判を総合した。
我々は、4人の独立した専門家のパネルに、支持の正確さと批判の公正さを評価するよう依頼した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: This study investigates the perceived value and critique of ISTQB certifications, the most widely recognized testing qualifications worldwide. While the certifications aim to standardize the software testing body of knowledge, debates persist about their practical relevance and impact. Our objective was to systematically capture practitioner perspectives and assess the precision of endorsements and fairness of criticisms through expert review. Method: We conducted an AI-assisted Multivocal Literature Review (MLR), combining academic and grey literature to synthesize practitioner endorsements (RQ1) and criticisms (RQ2). ChatGPT's deep research capability was employed under continuous human oversight, with QA strategies ensuring transparency and reliability. As another analysis, we asked a panel of four independent experts to evaluate the precision of endorsements and fairness of criticisms. Results: Practitioner endorsements emphasized career benefits, improved communication, and a shared vocabulary as the main values of ISTQB certifications. Criticisms focused on excessive theoretical content, limited relevance in agile and automation-intensive contexts, and weak support for real testing skills. Expert review confirmed that while many endorsements were precise, several criticisms reflected broader tensions in the discipline, including contrasting schools of thought in testing practice. Conclusions: ISTQB certifications provide recognizable career and communication value but remain contested in terms of practical utility. By triangulating practitioner voices with expert validation, this study delivers an evidence-based reflection on the strengths and weaknesses of ISTQB in shaping the software testing body of knowledge. The AI-assisted MLR also demonstrates how GenAI tools can support systematic evidence synthesis when coupled with rigorous human oversight.
- Abstract(参考訳): 目的: 本研究は, 世界で最も広く認められた試験資格である ISTQB 認定の認知的価値と批判について検討する。
認定は、ソフトウェアテストの知識体系の標準化を目標としているが、実践的妥当性と影響については議論が続いている。
我々の目的は、専門家の視点を体系的に捉え、専門家のレビューを通じて、評価の正確さと批判の公正さを評価することである。
方法:AI支援多言語文学レビュー(MLR)を行い,学術文献と灰色文学を組み合わせて実践者支援(RQ1)と批判(RQ2)を合成した。
ChatGPTの深い研究能力は、透明性と信頼性を保証するQA戦略によって、継続的な人間の監視の下で採用された。
別の分析として、我々は4人の独立した専門家のパネルに、支持の正確さと批判の公平さを評価するよう依頼した。
結果: 専門家の支持は, キャリアのメリット, コミュニケーションの向上, ISTQB認定の主な価値としての共通語彙を強調した。
批判は、過剰な理論的内容、アジャイルと自動化集約的なコンテキストにおける限定的な関連性、実際のテストスキルに対する弱いサポートに焦点を当てた。
専門家のレビューは、多くの支持が正確である一方で、いくつかの批判は、テスト実践における思考の流派との対比を含む、規律のより広い緊張を反映していると確認した。
結論: ISTQB認定は認識可能なキャリアとコミュニケーションの価値を提供するが、実用性の観点からは論争は残る。
専門家の検証で実践者の声を三角測量することにより、本研究では、ソフトウェアテストの知識体系を形成する上でのISTQBの強みと弱みに関するエビデンスベースの考察を提供する。
AI支援のMLRは、厳格な人間の監視と組み合わせることで、GenAIツールが体系的なエビデンス合成をサポートする方法も示している。
関連論文リスト
- Mirror: A Multi-Agent System for AI-Assisted Ethics Review [104.3684024153469]
MirrorはAIによる倫理的レビューのためのエージェントフレームワークである。
倫理的推論、構造化された規則解釈、統合されたアーキテクチャ内でのマルチエージェントの議論を統合する。
論文 参考訳(メタデータ) (2026-02-09T03:38:55Z) - Responsible Evaluation of AI for Mental Health [72.85175110624736]
メンタルヘルスケアにおけるAIツールの評価に対する現在のアプローチは、断片化されており、臨床実践、社会的コンテキスト、ファーストハンドのユーザエクスペリエンスと不整合である。
本稿では,臨床の健全性,社会的文脈,公平性を統合した学際的枠組みを導入することにより,責任ある評価を再考する。
論文 参考訳(メタデータ) (2026-01-20T12:55:10Z) - Escaping the Verifier: Learning to Reason via Demonstrations [0.4679031868857941]
RAROは、逆強化学習(Inverse Reinforcement Learning)を通じて、専門家によるデモンストレーションのみから、強力な推論能力を学ぶ。
本手法は,政策(ジェネレータ)と相対論的批判(差別者)の対立的相互作用を設定する。
論文 参考訳(メタデータ) (2025-11-26T18:42:52Z) - Expert Preference-based Evaluation of Automated Related Work Generation [54.29459509574242]
本稿では,従来の作業評価基準と専門家固有の嗜好を統合したマルチターン評価フレームワークGREPを提案する。
より優れたアクセシビリティを実現するため、我々はGREPの2つの変種を設計する: プロプライエタリなLLMを評価対象とするより正確な変種と、オープンウェイトなLLMをより安価な代替品である。
論文 参考訳(メタデータ) (2025-08-11T13:08:07Z) - The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.87236114682497]
AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文 参考訳(メタデータ) (2025-06-09T18:37:14Z) - Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.55408229639344]
我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。
私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文 参考訳(メタデータ) (2025-05-13T20:36:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。