論文の概要: Can an LLM Detect Instances of Microservice Infrastructure Patterns?
- arxiv url: http://arxiv.org/abs/2603.23073v1
- Date: Tue, 24 Mar 2026 11:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.44942
- Title: Can an LLM Detect Instances of Microservice Infrastructure Patterns?
- Title(参考訳): LLMはマイクロサービスインフラストラクチャパターンのインスタンスを検出できるか?
- Authors: Carlos Eduardo Duarte, Neil B. Harrison, Filipe Figueiredo Correia, Ademar Aguiar, Pavlína Gonçalves,
- Abstract要約: MicroPADは、あらゆる言語で書かれたソフトウェアアーチファクトのアーキテクチャパターンを特定するツールである。
複数の言語やアーティファクトタイプにわたるパターンインスタンスを検出することができる。
認識可能な支配的なアーティファクトに関連するパターンが、より確実に検出された。
- 参考スコア(独自算出の注目度): 0.8318686824572802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Architectural patterns are frequently found in various software artifacts. The wide variety of patterns and their implementations makes detection challenging with current tools, especially since they often only support detecting patterns in artifacts written in a single language. Large Language Models (LLMs), trained on a diverse range of software artifacts and knowledge, might overcome the limitations of existing approaches. However, their true effectiveness and the factors influencing their performance have not yet been thoroughly examined. To better understand this, we developed MicroPAD. This tool utilizes GPT 5 nano to identify architectural patterns in software artifacts written in any language, based on natural-language pattern descriptions. We used MicroPAD to evaluate an LLM's ability to detect instances of architectural patterns, particularly infrastructure-related microservice patterns. To accomplish this, we selected a set of GitHub repositories and contacted their top contributors to create a new, human-annotated dataset of 190 repositories containing microservice architectural patterns. The results show that MicroPAD was capable of detecting pattern instances across multiple languages and artifact types. The detection performance varied across patterns (F1 scores ranging from 0.09 to 0.70), specifically in relation to their prevalence and the distinctiveness of the artifacts through which they manifest. We also found that patterns associated with recognizable, dominant artifacts were detected more reliably. Whether these findings generalize to other LLMs and tools is a promising direction for future research.
- Abstract(参考訳): アーキテクチャパターンは、様々なソフトウェアアーティファクトによく見られる。
特に、単一の言語で書かれたアーティファクトのパターンを検出することしかサポートしていないため、さまざまなパターンとその実装は、現在のツールで検出を困難にしている。
多様なソフトウェアアーチファクトや知識に基づいてトレーニングされた大規模言語モデル(LLM)は、既存のアプローチの限界を克服する可能性がある。
しかし、その真の有効性とパフォーマンスに影響を与える要因については、まだ十分に検討されていない。
これをよりよく理解するために、MicroPADを開発した。
このツールはGPT 5 nanoを使用して、自然言語のパターン記述に基づいて、任意の言語で書かれたソフトウェアアーティファクトのアーキテクチャパターンを識別する。
MicroPADを使用して、アーキテクチャパターン、特にインフラストラクチャ関連のマイクロサービスパターンのインスタンスを検出するLLMの機能を評価しました。
これを実現するために、GitHubリポジトリのセットを選択し、彼らのトップコントリビュータにコンタクトを取り、マイクロサービスアーキテクチャパターンを含む190のリポジトリの新しい、人間による注釈付きデータセットを作成しました。
その結果、MicroPADは複数の言語やアーティファクトタイプにまたがるパターンインスタンスを検出できた。
検出性能はパターンによって異なる(F1スコアは0.09から0.70まで)。
また、認識可能な、支配的なアーティファクトに関連するパターンがより確実に検出された。
これらの発見が他のLSMやツールに一般化されるかどうかは、将来の研究にとって有望な方向である。
関連論文リスト
- Compressed Sensing for Capability Localization in Large Language Models [58.574245030744834]
大規模言語モデル(LLM)は、数学的推論、コード生成、言語行動など幅広い機能を示す。
トランスフォーマーアーキテクチャでは,多くの機能が注目の小さなサブセットに高度にローカライズされていることを示す。
論文 参考訳(メタデータ) (2026-02-11T16:06:59Z) - ArtifactLens: Hundreds of Labels Are Enough for Artifact Detection with VLMs [43.85474845650244]
ArtifactLensは、5つの人間のアーティファクトベンチマークで最先端を達成する。
事前訓練されたVLMは、すでにアーティファクトを検出するのに必要な知識をコード化している。
本手法は他のアーティファクトタイプ – 対象形態学,動物解剖学,実体的相互作用 – に一般化する。
論文 参考訳(メタデータ) (2026-02-10T07:16:22Z) - IAD-GPT: Advancing Visual Knowledge in Multimodal Large Language Model for Industrial Anomaly Detection [70.02774285130238]
本稿では,リッチテキストセマンティクスと画像レベルの情報と画素レベルの情報の組み合わせについて検討する。
産業異常検出のためのMLLMに基づく新しいパラダイムであるIAD-GPTを提案する。
MVTec-ADとVisAデータセットの実験は、私たちの最先端のパフォーマンスを示しています。
論文 参考訳(メタデータ) (2025-10-16T02:48:05Z) - DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - DoorDet: Semi-Automated Multi-Class Door Detection Dataset via Object Detection and Large Language Models [26.43839593818403]
最小限の手作業でマルチクラスドア検出データセットを構築するための半自動パイプラインを提案する。
提案手法は,フロアプラン解析におけるニューラルネットワークのベンチマークに適したデータセットを作成しながら,アノテーションのコストを大幅に削減する。
この研究は、複雑な実世界の領域における効率的なデータセット構築のために、ディープラーニングとマルチモーダル推論を組み合わせる可能性を示す。
論文 参考訳(メタデータ) (2025-08-11T07:41:09Z) - Automated Microservice Pattern Instance Detection Using Infrastructure-as-Code Artifacts and Large Language Models [0.0]
この記事では、現在進行中のPhD研究、初期の実験、マイクロサービスパターンインスタンスの自動検出のためのMicroPADと呼ばれるツールのプロトタイプについて紹介します。
プロトタイプでは、Large Language Models(LLM)を使用して、インフラストラクチャ・アズ・コード(IaC)アーティファクトを分析して検出を支援し、コストを低く抑え、検出可能なパターンの範囲を最大化することを目的としている。
論文 参考訳(メタデータ) (2025-02-06T16:22:14Z) - LLMs for Generation of Architectural Components: An Exploratory Empirical Study in the Serverless World [0.0]
本稿では,関数・アズ・ア・サービス(F)のためのアーキテクチャコンポーネントを生成するための大規模言語モデルの有用性について検討する。
アーキテクチャコンポーネントの小さなサイズは、このアーキテクチャスタイルを現在のLLMを使って生成可能にする。
我々は、リポジトリに存在する既存のテストを通じて正確性を評価し、ソフトウェア工学(SE)と自然言語処理(NLP)ドメインのメトリクスを使用する。
論文 参考訳(メタデータ) (2025-02-04T18:06:04Z) - Enhancing LLM's Ability to Generate More Repository-Aware Unit Tests Through Precise Contextual Information Injection [4.367526927436771]
プロンプトエンジニアリングによって導かれる大規模言語モデル(LLM)は、幅広いタスクを扱う能力に注目を集めている。
LLMは、プロジェクトのグローバルな文脈に対する認識の欠如により、焦点メソッドや関数の単体テストを生成する際に幻覚を示す可能性がある。
我々は,レポジトリ対応の単体テストを生成するLLMの能力を向上するRATesterを提案する。
論文 参考訳(メタデータ) (2025-01-13T15:43:36Z) - Do Membership Inference Attacks Work on Large Language Models? [141.2019867466968]
メンバーシップ推論攻撃(MIA)は、特定のデータポイントがターゲットモデルのトレーニングデータのメンバーであるかどうかを予測しようとする。
我々は、Pileで訓練された言語モデルに対して、MIAの大規模評価を行い、そのパラメータは160Mから12Bまでである。
様々な LLM サイズや領域にまたがるほとんどの設定において,MIA はランダムな推測よりもほとんど優れていないことがわかった。
論文 参考訳(メタデータ) (2024-02-12T17:52:05Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。