論文の概要: From Machine Learning Documentation to Requirements: Bridging Processes with Requirements Languages
- arxiv url: http://arxiv.org/abs/2511.15340v1
- Date: Wed, 19 Nov 2025 10:59:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.775004
- Title: From Machine Learning Documentation to Requirements: Bridging Processes with Requirements Languages
- Title(参考訳): 機械学習ドキュメンテーションから要件へ - 要求言語によるブリッジプロセス
- Authors: Yi Peng, Hans-Martin Heyn, Jennifer Horkoff,
- Abstract要約: 本研究ではまず,一般公開されている20のModelCardsとDataSheetsにおけるRE関連情報の量と性質について検討する。
次に、3つの確立されたRE表現(EARS, Ruppのテンプレート, Volere)が、この知識をいかに効果的に要求に構造化できるかを評価する。
- 参考スコア(独自算出の注目度): 2.2012529546432633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In software engineering processes for machine learning (ML)-enabled systems, integrating and verifying ML components is a major challenge. A prerequisite is the specification of ML component requirements, including models and data, an area where traditional requirements engineering (RE) processes face new obstacles. An underexplored source of RE-relevant information in this context is ML documentation such as ModelCards and DataSheets. However, it is uncertain to what extent RE-relevant information can be extracted from these documents. This study first investigates the amount and nature of RE-relevant information in 20 publicly available ModelCards and DataSheets. We show that these documents contain a significant amount of potentially RE-relevant information. Next, we evaluate how effectively three established RE representations (EARS, Rupp's template, and Volere) can structure this knowledge into requirements. Our results demonstrate that there is a pathway to transform ML-specific knowledge into structured requirements, incorporating ML documentation in software engineering processes for ML systems.
- Abstract(参考訳): 機械学習(ML)対応システムのためのソフトウェアエンジニアリングプロセスでは、MLコンポーネントの統合と検証が大きな課題である。
前提条件は、従来の要件エンジニアリング(RE)プロセスが新たな障害に直面する領域であるモデルやデータを含む、MLコンポーネント要件の仕様である。
このコンテキストにおけるRE関連情報の未調査のソースは、ModelCardsやDataSheetsといったMLドキュメントである。
しかし、これらの文書からどの程度再関連情報を抽出できるかは定かではない。
本研究ではまず,一般公開されている20のModelCardsとDataSheetsにおけるRE関連情報の量と性質について検討する。
これらの文書には、相当量のRE関連情報が含まれていることを示す。
次に、3つの確立されたRE表現(EARS, Ruppのテンプレート, Volere)が、この知識をいかに効果的に要求に構造化できるかを評価する。
この結果から,MLシステムのためのソフトウェア工学プロセスにMLドキュメンテーションを取り入れ,ML固有の知識を構造化された要件に変換する経路があることが示唆された。
関連論文リスト
- Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - Causal Models in Requirement Specifications for Machine Learning: A vision [4.348086726793516]
本稿では,要求工学(RE)活動としての因果モデリングについて考察する。
本稿では,低レベルの事前知識から低レベルのモデルとデータ要求を抽出するワークフローを提案する。
この手法は産業用故障検出システムで実証されている。
論文 参考訳(メタデータ) (2025-02-17T10:20:17Z) - Digital requirements engineering with an INCOSE-derived SysML meta-model [0.0]
我々は、モデルベース構造化要求SysMLプロファイルを拡張して、要求書作成のためのINCOSEガイドに準拠します。
結果のSysMLプロファイルはNASAジェット推進研究所の2つのシステムアーキテクチャモデルに適用された。
論文 参考訳(メタデータ) (2024-10-12T03:06:13Z) - DOCBENCH: A Benchmark for Evaluating LLM-based Document Reading Systems [99.17123445211115]
本稿では,大規模言語モデル(LLM)に基づく文書読解システムを評価するベンチマークであるDocBenchを紹介する。
我々のベンチマークには、人間のアノテーションの募集と、合成質問の生成が含まれる。
実際の文書は229件、質問は1,102件で、5つのドメインにまたがって4種類の質問がある。
論文 参考訳(メタデータ) (2024-07-15T13:17:42Z) - Enhancing Architecture Frameworks by Including Modern Stakeholders and their Views/Viewpoints [48.87872564630711]
データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文 参考訳(メタデータ) (2023-08-09T21:54:34Z) - Machine Learning Systems: A Survey from a Data-Oriented Perspective [6.933671804969495]
データ指向アーキテクチャ(DOA、Data-oriented Architecture)は、MLモデルを統合する上で、システムにより良いものを提供する新しいスタイルである。
本稿では、MLベースのシステムの実装とデプロイに実践者がDOAを採用した理由、方法、そしてその程度について調査する。
論文 参考訳(メタデータ) (2023-02-09T17:57:02Z) - Self-Prompting Large Language Models for Zero-Shot Open-Domain QA [67.08732962244301]
Open-Domain Question Answering (ODQA)は、背景文書を明示的に提供せずに質問に答えることを目的としている。
このタスクは、調整済みの検索リーダーモデルをトレーニングするデータがないゼロショット設定で顕著に困難になる。
本稿では,大規模言語モデルのパラメータに符号化された膨大な知識を明示的に活用するセルフプロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T18:23:43Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z) - Ensuring Dataset Quality for Machine Learning Certification [0.6927055673104934]
機械学習のコンテキストの特異性は適切に把握されず、ccountにも適用されないことを示す。
本稿では,鉄道領域からの信号認識システムに適用し,データセットの仕様と検証プロセスを提案する。
論文 参考訳(メタデータ) (2020-11-03T15:45:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。