論文の概要: Gleaner: A Semantically-Rich and Efficient Online Sampler for Microservice Diagnostics
- arxiv url: http://arxiv.org/abs/2604.16810v1
- Date: Sat, 18 Apr 2026 03:43:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 13:58:09.786321
- Title: Gleaner: A Semantically-Rich and Efficient Online Sampler for Microservice Diagnostics
- Title(参考訳): Gleaner: マイクロサービス診断のためのセマンティックにリッチで効率的なオンラインサンプリング
- Authors: Yifan Yang, Aoyang FANG, Songhan Zhang, Pinjia He,
- Abstract要約: State-of-the-the-art tail-based samplersは、グラフとしてモデリングすることで、完全な(あるいはログに富んだ)トレースを分析する。
私たちは、このトレードオフを破るオンラインのテールサンプリングフレームワークであるGleanerを提案します。
Gleaner氏は各トレースを,ログセマンティクスを付加した“最先端のバグ”として表現している。
- 参考スコア(独自算出の注目度): 14.792065799390897
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Distributed tracing in microservices is critical for diagnostics but generates overwhelming data volumes, necessitating intelligent sampling. To maximize fidelity, state-of-the-art (SOTA) tail-based samplers analyze complete (or even log-enriched) traces by modeling them as graphs. However, this reliance on computationally expensive graph analysis creates a performance bottleneck that prohibits their use in online settings. To this end, we propose Gleaner, an online tail-sampling framework that breaks this trade-off. It is founded on the key insight that explicit graph structures are unnecessary for high-fidelity trace grouping. Instead, Gleaner represents each trace as a "bag-of-edges" augmented with log semantics, replacing slow graph algorithms with highly efficient set-based operations. It also employs an alarm-driven quota and a diversity-preserving strategy to prioritize anomalous and rare traces for downstream Root Cause Analysis (RCA). Experimentally, Gleaner processes traces at 0.74ms each, improving Trace Pattern Coverage by up to 128.7% and Shannon Entropy by up to 32.9% over baselines. At just a 1% sampling rate, Gleaner improves RCA accuracy by 42%-107% over the next-best sampler. Moreover, RCA on Gleaner's sampled data is more accurate than with the entire, unsampled dataset. This result reframes intelligent sampling from a data reduction technique to a powerful signal enhancement paradigm for automated operations.
- Abstract(参考訳): マイクロサービスの分散トレースは診断には不可欠だが、圧倒的なデータボリュームを生成し、インテリジェントなサンプリングを必要とする。
忠実度を最大化するために、SOTA(State-of-the-arttail-based samplers)は、完全な(あるいはログに富んだ)トレースをグラフとしてモデル化することで分析する。
しかし、この計算コストのかかるグラフ解析への依存は、オンライン設定での使用を禁じるパフォーマンスボトルネックを生み出します。
この目的のために、私たちは、このトレードオフを断ち切るオンラインのテールサンプリングフレームワークであるGleanerを提案します。
高忠実性トレースグルーピングには明示的なグラフ構造が不要であるというキーインサイトに基づいている。
代わりに、Gleaner氏は各トレースをログセマンティクスを付加した"最先端のバグ"として表現し、遅いグラフアルゴリズムを高効率なセットベース操作に置き換えた。
また、アラーム駆動のクォータと多様性保存戦略を用いて、下流のルート原因分析(RCA)に異常や稀な痕跡を優先順位付けしている。
実験的に、グリーナープロセスはそれぞれの0.74msでトレースし、トレースパターン被覆を最大128.7%改善し、シャノンエントロピーを最大32.9%改善した。
わずか1%のサンプリングレートで、Gleanerは次のベストサンプリングよりもRCAの精度を42%-107%向上させる。
さらに、Gleaner氏のサンプルデータのRCAは、サンプリングされていないデータセット全体よりも正確である。
これにより、データリダクション技術からインテリジェントサンプリングを、自動操作のための強力な信号拡張パラダイムに再構成する。
関連論文リスト
- UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices [17.78777718374266]
分析後のパラダイムを用いてトレースとログの両方をサンプリングする最初の統合フレームワークであるUniSageを紹介する。
2.5%のサンプリングレートで、臨界トレースの56.5%、関連するログの96.25%を捕捉し、下流の根本原因分析の精度(AC@1)を42.45%向上させる。
論文 参考訳(メタデータ) (2025-09-30T14:44:56Z) - Trace Sampling 2.0: Code Knowledge Enhanced Span-level Sampling for Distributed Tracing [41.23073783376032]
Smpling 2.0を導入します。これはトレース構造の一貫性を維持しながら、スパンレベルで動作します。
我々は、98.1%の障害範囲をカバーしながら、トレースサイズを81.2%削減することを示した。
根本原因分析において有効性を示し,平均8.3%の改善を達成した。
論文 参考訳(メタデータ) (2025-09-17T09:37:35Z) - Hierarchical Graph Neural Network for Compressed Speech Steganalysis [1.0310729286080484]
本稿では,圧縮音声のVoIP音声ストリームのステガナリシスのためのグラフニューラルネットワーク(GNN)の最初の応用について述べる。
この方法ではVoIPストリームからのグラフ構築が簡単で、階層的ステガナリシス情報を取得するのにGraphSAGEを使用する。
0.5秒の短いサンプルであっても検出精度は98%を超え、埋め込み率の低い困難な条件下では95.17パーセントの精度が得られる。
論文 参考訳(メタデータ) (2025-07-29T08:46:54Z) - Subsampling Graphs with GNN Performance Guarantees [34.32848091746629]
グラフデータセットに対する新しいサブサンプリング手法を提案する。
サブサンプルデータ上でのGNNのトレーニングは、完全なデータセットでのトレーニングと比較して、損失のバウンド増加をもたらすことを証明している。
論文 参考訳(メタデータ) (2025-02-23T20:21:16Z) - TraceMesh: Scalable and Streaming Sampling for Distributed Traces [51.08892669409318]
TraceMeshは、分散トレースのためのスケーラブルでストリーミングなサンプリングツールである。
以前は見つからなかったトレース機能を、統一的で合理化された方法で扱える。
TraceMeshは、サンプリング精度と効率の両方において、最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-06-11T06:13:58Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Graph Signal Sampling for Inductive One-Bit Matrix Completion: a
Closed-form Solution [112.3443939502313]
グラフ信号解析と処理の利点を享受する統合グラフ信号サンプリングフレームワークを提案する。
キーとなる考え方は、各ユーザのアイテムのレーティングをアイテムイットグラフの頂点上の関数(信号)に変換することである。
オンライン設定では、グラフフーリエ領域における連続ランダムガウス雑音を考慮したベイズ拡張(BGS-IMC)を開発する。
論文 参考訳(メタデータ) (2023-02-08T08:17:43Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。