論文の概要: Automated Test Data Generation for Enterprise Protobuf Systems: A Metaclass-Enhanced Statistical Approach
- arxiv url: http://arxiv.org/abs/2507.22070v1
- Date: Wed, 16 Jul 2025 09:49:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-03 20:19:02.916108
- Title: Automated Test Data Generation for Enterprise Protobuf Systems: A Metaclass-Enhanced Statistical Approach
- Title(参考訳): エンタープライズプロトタイプシステムのための自動テストデータ生成:メタクラス強化統計的アプローチ
- Authors: Y. Du,
- Abstract要約: Protocol Buffers(protobuf)を使用した大規模エンタープライズシステムは、パフォーマンステストにおいて重要な課題を提示する。
従来のテストデータ生成アプローチは、protobufスキーマ固有の複雑な階層構造やグラフのような構造を扱うには不十分である。
本稿では,Pythonのメタクラスシステムを利用して動的型拡張と実運用ログの統計解析を行う新しいテストデータ生成フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale enterprise systems utilizing Protocol Buffers (protobuf) present significant challenges for performance testing, particularly when targeting intermediate business interfaces with complex nested data structures. Traditional test data generation approaches are inadequate for handling the intricate hierarchical and graph-like structures inherent in enterprise protobuf schemas. This paper presents a novel test data generation framework that leverages Python's metaclass system for dynamic type enhancement and statistical analysis of production logs for realistic value domain extraction. Our approach combines automatic schema introspection, statistical value distribution analysis, and recursive descent algorithms for handling deeply nested structures. Experimental evaluation on three real-world enterprise systems demonstrates up to 95\% reduction in test data preparation time and 80\% improvement in test coverage compared to existing approaches. The framework successfully handles protobuf structures with up to 15 levels of nesting and generates comprehensive test suites containing over 100,000 test cases within seconds.
- Abstract(参考訳): Protocol Buffers(protobuf)を使用した大規模エンタープライズシステムは、特に複雑なネストされたデータ構造を持つ中間ビジネスインターフェースをターゲットとする場合、パフォーマンステストにおいて重要な課題を提示する。
従来のテストデータ生成アプローチは、エンタープライズプロトバフスキーマに固有の複雑な階層構造やグラフのような構造を扱うには不十分である。
本稿では,Pythonのメタクラスシステムを動的型拡張と実測値領域抽出のための実運用ログの統計解析に活用する新しいテストデータ生成フレームワークを提案する。
提案手法は, 自動スキーマイントロスペクション, 統計的値分布解析, および深いネスト構造を扱うための再帰降下アルゴリズムを組み合わせる。
実世界の3つの企業システムに対する実験的な評価は、テストデータ作成時間の最大95%削減と、既存のアプローチと比較してテストカバレッジの80パーセント改善を実証している。
このフレームワークは、最大15レベルのネストでprotobuf構造をうまく処理し、数秒で10万を超えるテストケースを含む包括的なテストスイートを生成する。
関連論文リスト
- Synthetic Code Surgery: Repairing Bugs and Vulnerabilities with LLMs and Synthetic Data [0.0]
本稿では,Large Language Models(LLMs)を用いた合成データ生成によるAPR(Automated Program repair)の向上手法を提案する。
提案手法は, 合成試料生成と厳密な品質評価という2段階のプロセスを通じて, この制限に対処する。
VulRepairテストセットデータセットの実験評価では、完全予測率の統計的に有意な改善が見られた。
論文 参考訳(メタデータ) (2025-05-12T09:14:20Z) - AnomalyGen: An Automated Semantic Log Sequence Generation Framework with LLM for Anomaly Detection [25.83270938475311]
AnomalyGenは、異常検出用に特別に設計された最初の自動ログ合成フレームワークである。
本フレームワークは,プログラム解析とChain-of-Thought推論(CoT推論)を統合し,反復的なログ生成と異常アノテーションを実現する。
合成ログでベンチマークデータセットを増大させると、最大F1スコアの3.7%の改善が観測される。
論文 参考訳(メタデータ) (2025-04-16T16:54:38Z) - BIASINSPECTOR: Detecting Bias in Structured Data through LLM Agents [27.159150467166732]
本稿では,構造化データの自動バイアス検出のための,エンド・ツー・エンドのマルチエージェント・シナジー・フレームワークBIASINSPECTORを紹介する。
まず、ユーザが特定した偏見検出タスクを分析し、多種多様なツールセットで実装する多段階計画を開発した。
構造化データのバイアス検出において、例外的な全体的なパフォーマンスを実現し、より公平なデータアプリケーションのための新しいマイルストーンを設定します。
論文 参考訳(メタデータ) (2025-04-07T09:12:00Z) - LLM Test Generation via Iterative Hybrid Program Analysis [7.121002367542988]
Pantaは、コードを分析し、テストケースを構築する際に、人間が従う反復的なプロセスをエミュレートするテクニックである。
オープンソースプロジェクトのサイクロマティックな複雑性の高いクラスで実施した経験的評価は,Pantaが26%,ブランチカバレッジが23%向上したことを示す。
論文 参考訳(メタデータ) (2025-03-17T16:10:38Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models [81.27391252152199]
大規模言語モデル(LLM)は、さまざまな自然言語ベンチマークで素晴らしいパフォーマンスを実現している。
本稿では、データセットの自動更新と、その有効性に関する体系的な分析を提案する。
1) 類似したサンプルを生成するための戦略を模倣すること,2) 既存のサンプルをさらに拡張する戦略を拡張すること,である。
論文 参考訳(メタデータ) (2024-02-19T07:15:59Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。