論文の概要: Towards Agentic Test-Driven Quality Assurance for 6G Networks
- arxiv url: http://arxiv.org/abs/2604.23285v1
- Date: Sat, 25 Apr 2026 12:58:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.25314
- Title: Towards Agentic Test-Driven Quality Assurance for 6G Networks
- Title(参考訳): 6Gネットワークのエージェントテスト駆動品質保証に向けて
- Authors: Christos Tranoris, Besiana Agko, Kostis Trantzas, Irene Denazi,
- Abstract要約: テスト駆動品質保証パラダイムとインテントコクリエーションを統合したエージェント型、インテント駆動のエンドツーエンド(E2E)オーケストレーションフレームワークを提案する。
このアーキテクチャは、TMフォーラムの情報モデルとカタログを使用して、標準に準拠した知識表現に基づいている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work proposes an agentic, intent-driven end-to-end (E2E) orchestration framework that integrates intent co-creation with a Test-Driven Quality Assurance paradigm. In this framework, autonomous agents iteratively refine a user's initial intent into a confirmed, auditable specification. Furthermore, the system automatically derives validation tests from these intents before provisioning, directly mirroring the Test-Driven Development workflow in software engineering to ensure proactive Service Level Agreement (SLA) compliance. The architecture is grounded in a standards-aligned knowledge representation using TM Forum (TMF) information models and catalogs. This enables deterministic graph traversal from high-level Product Offerings down to granular Service/Resource and Test specifications. We prototyped this architecture by extending OpenSlice with a message-driven, multi-agent pattern and integrating MCP-enabled (Model Context Protocol) tool access for real-time knowledge retrieval. Currently, our evaluation of the agents targets the intent co-creation phase as a baseline toward full-scale orchestration. Building on experiments with multiple open-source Large Language Model (LLM) backends integrated with the TMF-based knowledge base, we observe substantial variability in tool-use reliability and hallucination patterns, underscoring the critical importance of robust knowledge integration in agentic 6G systems.
- Abstract(参考訳): テスト駆動品質保証パラダイムとインテントコクリエーションを統合したエージェント型、インテント駆動のエンドツーエンド(E2E)オーケストレーションフレームワークを提案する。
このフレームワークでは、自律的なエージェントがユーザの初期意図を、確認可能な監査可能な仕様に反復的に洗練する。
さらに、システムはプロビジョニング前にこれらの意図から検証テストを自動的に導き、ソフトウェアエンジニアリングにおけるテスト駆動開発ワークフローを直接反映して、積極的なサービスレベルアグリーメント(SLA)のコンプライアンスを保証する。
このアーキテクチャは、TMフォーラム(TM Forum)情報モデルとカタログを使用して、標準に準拠した知識表現に基づいている。
これにより、高レベルの製品提供からサービス/リソース/テスト仕様まで決定論的なグラフトラバーサルが可能になります。
我々は,OpenSliceをメッセージ駆動型マルチエージェントパターンで拡張し,リアルタイム知識検索のためのMPP対応(Model Context Protocol)ツールアクセスを統合することで,このアーキテクチャをプロトタイプ化した。
現在,本エージェントの評価は,本格的なオーケストレーションに向けたベースラインとして意図共創フェーズを目標としている。
複数のオープンソースのLarge Language Model(LLM)バックエンドをTMFベースの知識ベースに統合した実験に基づいて、エージェント6Gシステムにおける堅牢な知識統合の重要性を強調し、ツール使用の信頼性と幻覚パターンのかなりの変動を観察する。
関連論文リスト
- ROSE: Retrieval-Oriented Segmentation Enhancement [79.7370065070812]
既存のマルチモーダル大言語モデル(MLLM)に基づくセグメンテーションモデルは、最新の知識を組み込むことができないため、しばしば新しいまたは新しいエンティティと競合する。
本論文では,学習データがないためMLLMが認識できない新規なエンティティのセグメンテーションと,モデルの知識の中に存在するが,正確な認識のために最新の情報を要求する新興エンティティのセグメンテーションに焦点を当てた,NEST(Novel Emerging Task)を紹介した。
Rose: Retrieval-Oriented Enhancementは、MLLMベースのセグメンテーションモデルを拡張するために設計されたプラグインとプレイのフレームワークです。
論文 参考訳(メタデータ) (2026-04-15T17:59:35Z) - IDP Accelerator: Agentic Document Intelligence from Extraction to Compliance Validation [3.539467892338473]
IDP(Intelligent Document Processing) Acceleratorは、エンドツーエンドのドキュメントインテリジェンスのためのエージェントAIを実現するフレームワークである。
インタラクティブなデモでは、ユーザはドキュメントのパケットをアップロードし、分類結果を視覚化し、抽出したデータを探索することができる。
論文 参考訳(メタデータ) (2026-02-26T20:20:38Z) - The Agentic Automation Canvas: a structured framework for agentic AI project design [0.0]
本稿ではエージェントシステム設計のための構造化フレームワークであるエージェント自動化Canvas(AAC)について述べる。
AACは自動化プロジェクトの6つの側面を捉えている。定義とスコープ、定量化された利益指標によるユーザ期待、開発者の実現可能性評価、ガバナンスのステージングである。
リアルタイムのバリデーションを備えたクライアントサイドのWebアプリケーションを通じてアクセスすることができる。
論文 参考訳(メタデータ) (2026-02-16T16:46:04Z) - A Lightweight Modular Framework for Constructing Autonomous Agents Driven by Large Language Models: Design, Implementation, and Applications in AgentForge [1.932555230783329]
LLM駆動の自律エージェントの構築を民主化するために設計された軽量でオープンソースのPythonフレームワーク。
AgentForgeは、(1)正式に定義された入出力契約できめ細かいタスク分解を可能にする構成可能なスキル抽象化、(2)クラウドベースのAPIとローカル推論エンジンのシームレスな切り替えをサポートする統一されたバックエンドインターフェース、(3)エージェントロジックと実装の詳細を分離する宣言型YAMLベースの構成システムである。
論文 参考訳(メタデータ) (2026-01-19T20:33:26Z) - BarrierBench : Evaluating Large Language Models for Safety Verification in Dynamical Systems [4.530582224312311]
バリア証明書合成のための LLM ベースのエージェントフレームワークを提案する。
このフレームワークは自然言語推論を使用して、候補証明書を提案し、洗練し、検証する。
BarrierBenchは、線形、非線形、離散時間、連続時間設定にまたがる100の動的システムのベンチマークである。
論文 参考訳(メタデータ) (2025-11-12T14:23:49Z) - Transparent, Evaluable, and Accessible Data Agents: A Proof-of-Concept Framework [0.0]
本稿では、AIエージェントの開発と評価のためのモジュール型コンポーネントベースのアーキテクチャについて述べる。
このシステムは、技術的でないユーザが複雑なデータウェアハウスと対話できるようにすることによって、データアクセシビリティにおける中核的な課題に対処する。
設計の要点は、多層推論フレームワークを通じて達成される透明な意思決定へのコミットメントである。
論文 参考訳(メタデータ) (2025-09-28T23:54:41Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation [51.297873393639456]
ArtifactsBenchは自動ビジュアルコード生成評価のためのフレームワークである。
我々のフレームワークは、生成した各アーティファクトをレンダリングし、時間的スクリーンショットを通してその動的な振る舞いをキャプチャする。
我々は1,825の多様なタスクの新しいベンチマークを構築し、30以上の主要な大規模言語モデルを評価する。
論文 参考訳(メタデータ) (2025-07-07T12:53:00Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。