論文の概要: UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices
- arxiv url: http://arxiv.org/abs/2509.26336v1
- Date: Tue, 30 Sep 2025 14:44:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.583988
- Title: UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices
- Title(参考訳): UniSage: マイクロサービスのための統一的で分析後のサンプリング
- Authors: Zhouruixing Zhu, Zhihan Jiang, Tianyi Yang, Pinjia He,
- Abstract要約: 分析後のパラダイムを用いてトレースとログの両方をサンプリングする最初の統合フレームワークであるUniSageを紹介する。
2.5%のサンプリングレートで、臨界トレースの56.5%、関連するログの96.25%を捕捉し、下流の根本原因分析の精度(AC@1)を42.45%向上させる。
- 参考スコア(独自算出の注目度): 17.78777718374266
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traces and logs are essential for observability and fault diagnosis in modern distributed systems. However, their ever-growing volume introduces substantial storage overhead and complicates troubleshooting. Existing approaches typically adopt a sample-before-analysis paradigm: even when guided by data heuristics, they inevitably discard failure-related information and hinder transparency in diagnosing system behavior. To address this, we introduce UniSage, the first unified framework to sample both traces and logs using a post-analysis-aware paradigm. Instead of discarding data upfront, UniSagefirst performs lightweight and multi-modal anomaly detection and root cause analysis (RCA) on the complete data stream. This process yields fine-grained, service-level diagnostic insights that guide a dual-pillar sampling strategy for handling both normal and anomalous scenarios: an analysis-guided sampler prioritizes data implicated by RCA, while an edge-case-based sampler ensures rare but critical behaviors are captured. Together, these pillars ensure comprehensive coverage of critical signals without excessive redundancy. Extensive experiments demonstrate that UniSage significantly outperforms state-of-the-art baselines. At a 2.5% sampling rate, it captures 56.5% of critical traces and 96.25% of relevant logs, while improving the accuracy (AC@1) of downstream root cause analysis by 42.45%. Furthermore, its efficient pipeline processes 10 minutes of telemetry data in under 5 seconds, demonstrating its practicality for production environments.
- Abstract(参考訳): トレースとログは、現代の分散システムにおける可観測性と障害診断に不可欠である。
しかし、その増え続けるボリュームは、かなりのストレージオーバーヘッドをもたらし、トラブルシューティングを複雑にする。
既存のアプローチでは、サンプル前分析のパラダイムが一般的である。データヒューリスティックスによってガイドされたとしても、障害関連情報を必然的に破棄し、システムの振る舞いを診断する透明性を妨げる。
この問題に対処するため、我々は、トレースとログの両方をポストアナリシス・アウェア・パラダイムを用いてサンプリングする最初の統一フレームワークUniSageを紹介した。
データを事前に破棄する代わりに、UniSagefirstは、完全なデータストリーム上で軽量でマルチモーダルな異常検出と根本原因分析(RCA)を実行する。
このプロセスは、正常なシナリオと異常なシナリオの両方を扱うためのデュアルピラーサンプリング戦略をガイドする、きめ細かいサービスレベルの診断洞察をもたらす。
これらの柱は、過剰な冗長性のない臨界信号の包括的カバレッジを保証する。
大規模な実験により、UniSageは最先端のベースラインを大きく上回っていることが示された。
2.5%のサンプリングレートで、臨界トレースの56.5%、関連するログの96.25%を捕捉し、下流の根本原因分析の精度(AC@1)を42.45%向上させる。
さらに、効率の良いパイプラインはテレメトリデータの10分を5秒以内で処理し、プロダクション環境での実用性を実証している。
関連論文リスト
- Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.30276778807068]
サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。
Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文 参考訳(メタデータ) (2025-09-28T13:27:38Z) - Trace Sampling 2.0: Code Knowledge Enhanced Span-level Sampling for Distributed Tracing [41.23073783376032]
Smpling 2.0を導入します。これはトレース構造の一貫性を維持しながら、スパンレベルで動作します。
我々は、98.1%の障害範囲をカバーしながら、トレースサイズを81.2%削減することを示した。
根本原因分析において有効性を示し,平均8.3%の改善を達成した。
論文 参考訳(メタデータ) (2025-09-17T09:37:35Z) - Semi-Supervised Defect Detection via Conditional Diffusion and CLIP-Guided Noise Filtering [8.132909775584395]
本稿では条件拡散(DSYM)に基づく半教師付き欠陥検出フレームワークを提案する。
条件拡散モデルでは,複数スケールの擬似欠陥サンプルを合成し,CLIPクロスモーダル特徴量に基づくノイズフィルタリング機構によりラベル汚染を緩和する。
本研究は,工業品質検査シナリオにおける欠陥検出のための高精度で低ラベル依存のソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-08T01:53:34Z) - Outlier-Robust Linear System Identification Under Heavy-tailed Noise [2.07180164747172]
線形時間不変系の状態遷移行列を推定する問題を考察する。
我々は、複数の弱集中型推定器の構築に依存する、新しいロバストなシステム同定アルゴリズムを開発した。
提案手法は, 敵が収集したトラジェクトリデータのごく一部を任意に破壊できるシナリオを考慮し, 容易に拡張可能であることを示す。
論文 参考訳(メタデータ) (2024-12-31T12:53:02Z) - Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-04T14:28:52Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。