論文の概要: Multi-Modal Requirements Data-based Acceptance Criteria Generation using LLMs
- arxiv url: http://arxiv.org/abs/2508.06888v1
- Date: Sat, 09 Aug 2025 08:35:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.599527
- Title: Multi-Modal Requirements Data-based Acceptance Criteria Generation using LLMs
- Title(参考訳): LLMを用いたマルチモーダルデータベースアクセプタンス基準生成
- Authors: Fanyu Wang, Chetan Arora, Yonghui Liu, Kaicheng Huang, Chakkrit Tantithamthavorn, Aldeida Aleti, Dishan Sambathkumar, David Lo,
- Abstract要約: マルチモーダル要求データから受け入れ基準を生成する新しい手法であるRAGcceptance M2REを提案する。
提案手法は,手作業の労力を効果的に削減し,未払いの利害関係者の意図を捉え,貴重な基準を提供する。
本研究は,ソフトウェア検証プロセスの合理化と開発効率の向上におけるマルチモーダルRAG技術の可能性を明らかにする。
- 参考スコア(独自算出の注目度): 17.373348983049176
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Acceptance criteria (ACs) play a critical role in software development by clearly defining the conditions under which a software feature satisfies stakeholder expectations. However, manually creating accurate, comprehensive, and unambiguous acceptance criteria is challenging, particularly in user interface-intensive applications, due to the reliance on domain-specific knowledge and visual context that is not always captured by textual requirements alone. To address these challenges, we propose RAGcceptance M2RE, a novel approach that leverages Retrieval-Augmented Generation (RAG) to generate acceptance criteria from multi-modal requirements data, including both textual documentation and visual UI information. We systematically evaluated our approach in an industrial case study involving an education-focused software system used by approximately 100,000 users. The results indicate that integrating multi-modal information significantly enhances the relevance, correctness, and comprehensibility of the generated ACs. Moreover, practitioner evaluations confirm that our approach effectively reduces manual effort, captures nuanced stakeholder intent, and provides valuable criteria that domain experts may overlook, demonstrating practical utility and significant potential for industry adoption. This research underscores the potential of multi-modal RAG techniques in streamlining software validation processes and improving development efficiency. We also make our implementation and a dataset available.
- Abstract(参考訳): 受け入れ基準(AC)は、ソフトウェア機能がステークホルダーの期待を満たす条件を明確に定義することで、ソフトウェア開発において重要な役割を果たす。
しかし、特にユーザインターフェースに強く依存するアプリケーションでは、ドメイン固有の知識や視覚的コンテキストに依存しているため、手動で正確で包括的で曖昧な受け入れ基準を作成することは困難である。
これらの課題に対処するため,RAGcceptance M2REを提案する。RAGcceptance M2REはRetrieval-Augmented Generation(RAG)を利用して,テキストドキュメンテーションとビジュアルUI情報の両方を含むマルチモーダル要求データから受け入れ基準を生成する。
我々は,約10万人のユーザが使用する教育用ソフトウェアシステムの産業ケーススタディにおいて,我々のアプローチを体系的に評価した。
その結果, マルチモーダル情報の統合は, 生成した交流の関連性, 正確性, 理解性を著しく向上させることがわかった。
さらに,本手法が手作業を効果的に削減し,未熟な利害関係者の意図を捉え,ドメインの専門家が見過ごせる貴重な基準を提供し,実用性を示し,産業導入に有意義な可能性を実証する。
本研究は,ソフトウェア検証プロセスの合理化と開発効率の向上におけるマルチモーダルRAG技術の可能性を明らかにする。
実装とデータセットも利用可能です。
関連論文リスト
- Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation [4.448709087838503]
大規模言語モデル(LLM)を外部知識に基盤付けるための重要なアプローチとして,検索-拡張生成(RAG)システムが登場している。
本稿では,ガバナンス,サイバーセキュリティ,農業,産業研究,医療診断の5つの領域固有のRAGアプリケーションについて述べる。
論文 参考訳(メタデータ) (2025-06-25T22:40:00Z) - A Practical Guide for Evaluating LLMs and LLM-Reliant Systems [1.1715858161748576]
本稿では,代表的なデータセットを積極的にキュレートし,有意義な評価指標を選択するための実践的評価フレームワークを提案する。
我々は,現実の要求に順応し,ユーザニーズに応えなければならないシステムの実践的開発と展開をうまく統合する有意義な評価手法を採用する。
論文 参考訳(メタデータ) (2025-06-16T01:18:16Z) - EIFBENCH: Extremely Complex Instruction Following Benchmark for Large Language Models [65.48902212293903]
大規模言語モデル(LLM)を評価するためのEIFBENCH(Extremely Complex Instruction following Benchmark)を提案する。
EIFBENCHにはマルチタスクシナリオが含まれており、多様なタスクタイプを同時に総合的に評価することができる。
また,LLMのマルチタスクワークフローを正確に満たす能力を高めるために,セグメントポリシー最適化(SegPO)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-10T02:39:55Z) - Rethinking Machine Unlearning in Image Generation Models [59.697750585491264]
CatIGMUは、新しい階層的なタスク分類フレームワークである。
EvalIGMUは包括的な評価フレームワークである。
高品質な未学習データセットであるDataIGMを構築した。
論文 参考訳(メタデータ) (2025-06-03T11:25:14Z) - A Practical Approach for Building Production-Grade Conversational Agents with Workflow Graphs [2.7905014064567344]
大きな言語モデル(LLM)は、さまざまなサービスドメインで大幅に改善されました。
産業環境でのSOTA(State-of-the-art)研究の適用は課題を提起する。
論文 参考訳(メタデータ) (2025-05-29T02:30:27Z) - Composed Multi-modal Retrieval: A Survey of Approaches and Applications [81.54640206021757]
複合マルチモーダル検索(CMR)は次世代技術として誕生する。
CMRは、参照視覚入力とテキスト修正を統合することで、画像やビデオをクエリすることを可能にする。
本稿では,CMRの基礎的課題,技術的進歩,応用について概説する。
論文 参考訳(メタデータ) (2025-03-03T09:18:43Z) - Leveraging Graph-RAG and Prompt Engineering to Enhance LLM-Based Automated Requirement Traceability and Compliance Checks [8.354305051472735]
本研究は,頑健なグラフ-RAGフレームワークを,思考の連鎖や思考の樹木といった先進的な技術と統合することにより,性能を著しく向上させることを実証する。
さまざまなコンテキストにまたがって実装するのはコストが高く、複雑で、特定のシナリオに慎重に適応する必要がある。
論文 参考訳(メタデータ) (2024-12-11T18:11:39Z) - Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.667202878390526]
長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。
実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。
以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文 参考訳(メタデータ) (2024-06-19T00:28:58Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。