論文の概要: Trace Sampling 2.0: Code Knowledge Enhanced Span-level Sampling for Distributed Tracing
- arxiv url: http://arxiv.org/abs/2509.13852v1
- Date: Wed, 17 Sep 2025 09:37:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.801963
- Title: Trace Sampling 2.0: Code Knowledge Enhanced Span-level Sampling for Distributed Tracing
- Title(参考訳): トレースサンプリング 2.0: コードの知識が分散トレースのためのスパンレベルのサンプリングを強化
- Authors: Yulun Wu, Guangba Yu, Zhihan Jiang, Yichen Li, Michael R. Lyu,
- Abstract要約: Smpling 2.0を導入します。これはトレース構造の一貫性を維持しながら、スパンレベルで動作します。
我々は、98.1%の障害範囲をカバーしながら、トレースサイズを81.2%削減することを示した。
根本原因分析において有効性を示し,平均8.3%の改善を達成した。
- 参考スコア(独自算出の注目度): 41.23073783376032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributed tracing is an essential diagnostic tool in microservice systems, but the sheer volume of traces places a significant burden on backend storage. A common approach to mitigating this issue is trace sampling, which selectively retains traces based on specific criteria, often preserving only anomalous ones. However, this method frequently discards valuable information, including normal traces that are essential for comparative analysis. To address this limitation, we introduce Trace Sampling 2.0, which operates at the span level while maintaining trace structure consistency. This approach allows for the retention of all traces while significantly reducing storage overhead. Based on this concept, we design and implement Autoscope, a span-level sampling method that leverages static analysis to extract execution logic, ensuring that critical spans are preserved without compromising structural integrity. We evaluated Autoscope on two open-source microservices. Our results show that it reduces trace size by 81.2% while maintaining 98.1% faulty span coverage, outperforming existing trace-level sampling methods. Furthermore, we demonstrate its effectiveness in root cause analysis, achieving an average improvement of 8.3%. These findings indicate that Autoscope can significantly enhance observability and storage efficiency in microservices, offering a robust solution for performance monitoring.
- Abstract(参考訳): 分散トレースはマイクロサービスシステムでは必須の診断ツールだが、大量のトレースがバックエンドストレージに重大な負担を与える。
この問題を緩和するための一般的なアプローチは、特定の基準に基づいてトレースを選択的に保持し、しばしば異常なもののみを保存するトレースサンプリングである。
しかし、この手法は、比較分析に不可欠な通常のトレースを含む、貴重な情報を頻繁に破棄する。
この制限に対処するため、トレース構造一貫性を維持しながら、スパンレベルで動作するトレースサンプリング2.0を導入します。
このアプローチにより、すべてのトレースを保持できると同時に、ストレージオーバーヘッドを大幅に削減できる。
この概念に基づいて,静的解析を利用して実行ロジックを抽出し,構造的整合性を損なうことなく重要なスパンが保存されることを保証するスパンレベルのサンプリング手法であるAutoscopeを設計・実装する。
2つのオープンソースマイクロサービス上でAutoscopeを評価しました。
その結果,98.1%の障害範囲をカバーしながら,トレースサイズを81.2%削減し,既存のトレースレベルサンプリング法よりも優れた結果を得た。
さらに,根本原因分析において有効性を示し,平均8.3%の改善を実現した。
これらの結果は、Autoscopeがマイクロサービスの可観測性とストレージ効率を大幅に向上し、パフォーマンス監視のための堅牢なソリューションを提供することを示している。
関連論文リスト
- Early Detection of Network Service Degradation: An Intra-Flow Approach [0.0]
本研究では,早期のフロー特性を利用して,コンピュータネットワークにおけるサービス劣化(SD)を予測する新しい手法を提案する。
我々のアプローチは、ネットワークフローの観測可能な(O)セグメント、特にパケット間時間(PIAT)の分析に焦点を当てている。
我々は,10個の遅延サンプルの最適O/NO分割閾値を推定し,予測精度と資源利用量のバランスをとる。
論文 参考訳(メタデータ) (2024-07-09T08:05:14Z) - TraceMesh: Scalable and Streaming Sampling for Distributed Traces [51.08892669409318]
TraceMeshは、分散トレースのためのスケーラブルでストリーミングなサンプリングツールである。
以前は見つからなかったトレース機能を、統一的で合理化された方法で扱える。
TraceMeshは、サンプリング精度と効率の両方において、最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-06-11T06:13:58Z) - RTracker: Recoverable Tracking via PN Tree Structured Memory [71.05904715104411]
本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文 参考訳(メタデータ) (2024-03-28T08:54:40Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Feature Engineering for Scalable Application-Level Post-Silicon
Debugging [0.456877715768796]
シリコン後のシステム・オン・チップ(SoCs)検証における可観測性向上と根本原因診断の両方法を提案する。
メッセージ選択のための典型的なアプリケーションにおける対話フローの仕様をモデル化する。
我々は、診断問題を、バグのトレースを外れ値として、バグのないトレースを異常値/正常値として識別するものとして定義する。
論文 参考訳(メタデータ) (2021-02-08T22:11:59Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。