論文の概要: Early Requirements Traceability with Domain-Specific Taxonomies -- A
Pilot Experiment
- arxiv url: http://arxiv.org/abs/2311.12146v1
- Date: Mon, 20 Nov 2023 19:50:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 03:10:31.404740
- Title: Early Requirements Traceability with Domain-Specific Taxonomies -- A
Pilot Experiment
- Title(参考訳): ドメイン特化分類による早期要求トレーサビリティ - 実験的検討
- Authors: Michael Unterkalmsteiner
- Abstract要約: 我々は,要求からドメイン固有の分類へのトレーサリンクを提案するレコメンデータシステムを開発した。
業界実践者の効率性、正確性、一貫性、信頼性を、推奨者の支持なしに比較します。
- 参考スコア(独自算出の注目度): 1.6055823478216908
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Background: Establishing traceability from requirements documents to
downstream artifacts early can be beneficial as it allows engineers to reason
about requirements quality (e.g. completeness, consistency, redundancy).
However, creating such early traces is difficult if downstream artifacts do not
exist yet. Objective: We propose to use domain-specific taxonomies to establish
early traceability, raising the value and perceived benefits of trace links so
that they are also available at later development phases, e.g. in design,
testing or maintenance. Method: We developed a recommender system that suggests
trace links from requirements to a domain-specific taxonomy based on a series
of heuristics. We designed a controlled experiment to compare industry
practitioners' efficiency, accuracy, consistency and confidence with and
without support from the recommender. Results: We have piloted the experimental
material with seven practitioners. The analysis of self-reported confidence
suggests that the trace task itself is very challenging as both control and
treatment group report low confidence on correctness and completeness.
Conclusions: As a pilot, the experiment was successful since it provided
initial feedback on the performance of the recommender, insight on the
experimental material and illustrated that the collected data can be
meaningfully analysed.
- Abstract(参考訳): 背景: 要求文書から下流のアーティファクトに早期にトレーサビリティを確立することは、エンジニアが要求品質(例えば、完全性、一貫性、冗長性)を推論できるという点で有益である。
しかし、下流のアーティファクトがいなければ、このような早期トレースの作成は困難である。
目的:我々は、初期のトレーサビリティを確立するためにドメイン固有の分類を用いることを提案し、トレースリンクの価値と認識されるメリットを高め、設計、テスト、メンテナンスなど、後の開発フェーズでも利用可能にする。
方法: 一連のヒューリスティックスに基づいて, 要件からドメイン固有の分類へのトレースリンクを提案するレコメンデータシステムを開発した。
我々は,業界の実践者の効率,正確性,一貫性,信頼性を,推奨者の支持なしに比較する制御実験を設計した。
結果: 実験材料を7人の実践者で試験した。
自己報告された自信の分析は、制御群と治療群の両方が正確性と完全性に対する自信が低いと報告するため、トレースタスク自体が非常に困難であることを示唆している。
結論: パイロットとしてこの実験は,レコメンダのパフォーマンスに関する最初のフィードバックを提供し,実験資料に対する洞察を提供し,収集したデータを有意義に分析できることを示したため,成功した。
関連論文リスト
- Thinking Racial Bias in Fair Forgery Detection: Models, Datasets and Evaluations [63.52709761339949]
最初に、Fair Forgery Detection(FairFD)データセットと呼ばれる専用のデータセットをコントリビュートし、SOTA(Public State-of-the-art)メソッドの人種的偏見を証明する。
我々は、偽りの結果を避けることができる平均的メトリクスと実用正規化メトリクスを含む新しいメトリクスを設計する。
また,有効で堅牢な後処理技術であるBias Pruning with Fair Activations (BPFA)も提案する。
論文 参考訳(メタデータ) (2024-07-19T14:53:18Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - When is an Embedding Model More Promising than Another? [33.540506562970776]
埋め込みは機械学習において中心的な役割を担い、あらゆるオブジェクトを数値表現に投影し、様々な下流タスクを実行するために利用することができる。
埋め込みモデルの評価は一般にドメイン固有の経験的アプローチに依存する。
本稿では, 組込み器の評価を統一的に行い, 充足性と情報性の概念を考察する。
論文 参考訳(メタデータ) (2024-06-11T18:13:46Z) - Toward Unified Practices in Trajectory Prediction Research on Drone Datasets [3.1406146587437904]
高品質なデータセットの可用性は、自動運転車の行動予測アルゴリズムの開発に不可欠である。
本稿では,動き予測研究における特定のデータセットの利用の標準化の必要性を強調した。
これを実現するためのツールとプラクティスのセットを提案します。
論文 参考訳(メタデータ) (2024-05-01T16:17:39Z) - Analyzing Dataset Annotation Quality Management in the Wild [63.07224587146207]
最先端モデルのトレーニングと評価に使用される一般的なデータセットでさえ、誤ったアノテーションやバイアス、アーティファクトの量は無視できない。
データセット作成プロジェクトに関するプラクティスやガイドラインは存在するが、品質管理の実施方法に関する大規模な分析はまだ行われていない。
論文 参考訳(メタデータ) (2023-07-16T21:22:40Z) - Data AUDIT: Identifying Attribute Utility- and Detectability-Induced
Bias in Task Models [8.420252576694583]
医用画像データセットの厳密で定量的なスクリーニングのための第1の手法を提案する。
提案手法は,データセット属性に関連するリスクを,検出性と実用性の観点から分解する。
本手法を用いて, ほぼ知覚不能なバイアス誘発アーティファクトを確実に同定するスクリーニング手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T16:50:15Z) - A Sentiment Analysis Dataset for Trustworthiness Evaluation [22.734197353027632]
深層学習モデルはブラックボックス問題のために信頼できないとしばしば批判される。
我々は、頑健さと解釈可能性を評価するために、新しくよく注釈付けされた感情分析データセットをリリースする。
論文 参考訳(メタデータ) (2021-08-30T11:58:16Z) - Manual Evaluation Matters: Reviewing Test Protocols of Distantly
Supervised Relation Extraction [61.48964753725744]
2つのDS-REデータセット(NYT10とWiki20)に対して手動でアノテートしたテストセットを構築し、いくつかの競合モデルを徹底的に評価する。
その結果,手動による評価は,自動的な評価とは全く異なる結論を示すことがわかった。
論文 参考訳(メタデータ) (2021-05-20T06:55:40Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。