Fugu-MT 論文翻訳(概要): Towards Generating Executable Metamorphic Relations Using Large Language Models

論文の概要: Towards Generating Executable Metamorphic Relations Using Large Language Models

arxiv url: http://arxiv.org/abs/2401.17019v1
Date: Tue, 30 Jan 2024 13:52:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-31 14:54:08.717648
Title: Towards Generating Executable Metamorphic Relations Using Large Language Models
Title（参考訳）: 大規模言語モデルを用いた実行可能変成関係の生成に向けて
Authors: Seung Yeob Shin and Fabrizio Pastore and Domenico Bianculli and Alexandra Baicoianu
Abstract要約: 大規模言語モデル(LLM)を用いた要件から実行可能なMRを自動的に抽出する手法を提案する。提案手法の有効性を評価するため,シーメンス・インダストリー・ソフトウェアと共同で質問紙調査を行った。
参考スコア（独自算出の注目度）: 49.632090604977364
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Metamorphic testing (MT) has proven to be a successful solution to automating testing and addressing the oracle problem. However, it entails manually deriving metamorphic relations (MRs) and converting them into an executable form; these steps are time-consuming and may prevent the adoption of MT. In this paper, we propose an approach for automatically deriving executable MRs (EMRs) from requirements using large language models (LLMs). Instead of merely asking the LLM to produce EMRs, our approach relies on a few-shot prompting strategy to instruct the LLM to perform activities in the MT process, by providing requirements and API specifications, as one would do with software engineers. To assess the feasibility of our approach, we conducted a questionnaire-based survey in collaboration with Siemens Industry Software, focusing on four of their software applications. Additionally, we evaluated the accuracy of the generated EMRs for a web application. The outcomes of our study are highly promising, as they demonstrate the capability of our approach to generate MRs and EMRs that are both comprehensible and pertinent for testing purposes.
Abstract（参考訳）: メタモルフィックテスト(mt)は、テストの自動化とoracleの問題への対処に成功している。しかし,手動でメタモルフィック関係(MR)を導出し,それを実行可能な形式に変換することが必要であり,これらのステップは時間を要するため,MTの採用を阻害する可能性があり,本稿では,大規模言語モデル(LLM)を用いた要件から,実行可能なMR(EMR)を自動的に導出するアプローチを提案する。私たちのアプローチは、単にLLMにEMRの生成を依頼するのではなく、要件とAPI仕様を提供することで、MTプロセスでLLMにアクティビティを実行するように指示する、数発のプロンプト戦略に依存しています。提案手法の有効性を評価するため,Siemens Industry Softwareと共同で質問紙調査を行い,その4つのソフトウェアアプリケーションに焦点を当てた。さらに、Webアプリケーションの生成したEMRの精度を評価した。本研究の結果は,テスト目的において理解可能かつ関連性の高いMRとEMRを生成するためのアプローチの能力を実証する上で,極めて有望なものである。

関連論文リスト

AutoEDA: Enabling EDA Flow Automation through Microservice-Based LLM Agents [15.41283323575065]
AutoEDAは、標準化されたスケーラブルな自然言語エクスペリエンスに特化したモデルコンテキストプロトコル(MCP)を通じて並列学習を活用する、EDA自動化のためのフレームワークである。実験の結果、既存の手法と比較して、自動化の精度と効率が向上し、スクリプトの品質も向上した。
論文参考訳（メタデータ） (2025-08-01T18:23:57Z)
Querying Large Automotive Software Models: Agentic vs. Direct LLM Approaches [3.549427092296418]
大規模言語モデル(LLM)は、自然言語を通じてソフトウェアモデルのような複雑なソフトウェアアーチファクトと対話する新たな機会を提供する。本稿では,LLMを利用してソフトウェアモデルに対する疑問に答えるための2つのアプローチについて検討する。自動車分野におけるタイミング解析とソフトウェア最適化のために設計されたEcoreメタモデルを用いて,これらの手法を評価する。
論文参考訳（メタデータ） (2025-06-16T07:34:28Z)
Beyond Formal Semantics for Capabilities and Skills: Model Context Protocol in Manufacturing [0.12289361708127876]
最近導入されたモデルコンテキストプロトコル(MCP)に基づく代替手法を提案する。 MCPは、LLMベースのエージェントによって直接消費可能な標準化されたインタフェースを通じて機能を公開できる。
論文参考訳（メタデータ） (2025-06-12T13:02:16Z)
Self-Steering Language Models [113.96916935955842]
DisCIPLは、"セルフステアリング(self-steering)"言語モデルのメソッドである。 DisCIPLはPlannerモデルを使用してタスク固有の推論プログラムを生成する。我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文参考訳（メタデータ） (2025-04-09T17:54:22Z)
Agentic Mixture-of-Workflows for Multi-Modal Chemical Search [0.0]
大規模言語モデル(LLM)は、様々な領域にわたる有望な推論と自動化機能を示している。 CRAG-MoWは、異なるCRAG戦略を用いて複数のエージェントを編成する新しいパラダイムである。我々は、小型分子、高分子、化学反応、およびマルチモーダル核磁気共鳴(NMR)スペクトル検索のCRAG-MoWをベンチマークした。
論文参考訳（メタデータ） (2025-02-26T23:48:02Z)
Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-17T18:49:25Z)
The Potential of LLMs in Automating Software Testing: From Generation to Reporting [0.0]
手動テストは効果的だが、時間とコストがかかり、自動化メソッドの需要が増大する。大規模言語モデル(LLM)の最近の進歩は、ソフトウェア工学に大きな影響を与えている。本稿では,人間の介入を減らし,テスト効率を向上させるため,LSMを用いた自動ソフトウェアテストに対するエージェント指向アプローチについて検討する。
論文参考訳（メタデータ） (2024-12-31T02:06:46Z)
Creation and Evaluation of a Food Product Image Dataset for Product Property Extraction [39.58317527488534]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。 CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文参考訳（メタデータ） (2024-11-15T21:29:05Z)
AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文参考訳（メタデータ） (2024-11-02T13:24:30Z)
AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文参考訳（メタデータ） (2024-10-03T20:01:09Z)
Re-Thinking Process Mining in the AI-Based Agents Era [39.58317527488534]
大規模言語モデル(LLM)は強力な対話インタフェースとして登場し、プロセスマイニング(PM)タスクにおけるその応用は有望な結果を示している。本稿では,LLMにおけるPMの有効性を高めるために,AIベースのエージェント(AgWf)パラダイムを活用することを提案する。我々はAgWfの様々な実装とAIベースのタスクの種類について検討する。
論文参考訳（メタデータ） (2024-08-14T10:14:18Z)
RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents [27.807695570974644]
LLMエージェントに与えられたプロンプトのステップバイステップ命令を最適化するために、段階的な降下を行う新しい方法、textscRePromptを提案する。中間的なフィードバックを活用することで、 textscRePromptは最終的なソリューションチェッカーを必要とせずにプロンプトを最適化できる。
論文参考訳（メタデータ） (2024-06-17T01:23:11Z)
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.67321902882617]
本稿では,オープンソースのLLMをトレーニングし,モデリングやソルバコードの開発を最適化する実行可能なパスを提案する。この研究は、実用的なOR問題の解決においてLLMを評価するための最初の産業ベンチマークであるIndustrialORも導入した。
論文参考訳（メタデータ） (2024-05-28T01:55:35Z)
Using Large Language Models to Understand Telecom Standards [35.343893798039765]
大きな言語モデル(LLM)は、関連する情報へのより高速なアクセスを提供する。質問応答(QA)アシスタントとして使用される最先端のLCMの性能を評価する。その結果,LLMはテレコム技術文書の信頼できる参照ツールとして利用できることがわかった。
論文参考訳（メタデータ） (2024-04-02T09:54:51Z)
TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文参考訳（メタデータ） (2023-11-30T18:02:44Z)
Benchmarking Automated Machine Learning Methods for Price Forecasting Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。 CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文参考訳（メタデータ） (2023-04-28T10:27:38Z)
Just Tell Me: Prompt Engineering in Business Process Management [63.08166397142146]
GPT-3や他の言語モデル(LM)は、様々な自然言語処理(NLP)タスクに効果的に対処できる。私たちは、迅速なエンジニアリングは、BPM研究にLMの能力をもたらすことができると論じています。
論文参考訳（メタデータ） (2023-04-14T14:55:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。