論文の概要: Bridging Temporal and Textual Modalities: A Multimodal Framework for Automated Cloud Failure Root Cause Analysis
- arxiv url: http://arxiv.org/abs/2601.04709v1
- Date: Thu, 08 Jan 2026 08:20:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.107027
- Title: Bridging Temporal and Textual Modalities: A Multimodal Framework for Automated Cloud Failure Root Cause Analysis
- Title(参考訳): ブリッジング・テンポラル・テキストモダリティ:クラウド障害自動原因分析のためのマルチモーダルフレームワーク
- Authors: Gijun Park,
- Abstract要約: 本稿では,事前学習した言語モデル埋め込み空間と時系列表現を調和させる診断フレームワークを提案する。
本フレームワークは,複合障害モードを含むシナリオにおいて,48.75%の精度で診断精度を向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Root cause analysis in modern cloud infrastructure demands sophisticated understanding of heterogeneous data sources, particularly time-series performance metrics that involve core failure signatures. While large language models demonstrate remarkable capabilities in textual reasoning, their discrete token-based architecture creates fundamental incompatibilities with continuous numerical sequences exhibiting temporal dependencies. Current methodologies inadequately address this modality mismatch, constraining the potential of language model-driven automation in incident management workflows. This paper presents a multimodal diagnostic framework that harmonizes time-series representations with pretrained language model embedding spaces. Our approach contributes three technical advances: (1) a semantic compression technique that distills temporal segments into single-token abstractions while preserving pattern semantics, (2) an alignment encoder utilizing gated cross-attention to project time-series features into language model latent space, and (3) a retrieval-augmented diagnostic pipeline that synthesizes aligned embeddings with historical incident knowledge for expert-level failure attribution. Comprehensive evaluation across six cloud system benchmarks demonstrates that our framework achieves leading performance, reaching 48.75% diagnostic accuracy with notable improvements on scenarios involving compound failure modes. The results validate embedding-space alignment as an effective strategy for enabling language models to reason over multimodal telemetry data in production incident response contexts.
- Abstract(参考訳): 現代的なクラウドインフラストラクチャにおけるルート原因分析は、不均一なデータソース、特にコア障害シグネチャを含む時系列パフォーマンスメトリクスの高度な理解を必要とする。
大規模言語モデルはテキスト推論において顕著な能力を示すが、その離散トークンベースのアーキテクチャは、時間的依存関係を示す連続的な数値列と根本的な不整合を生み出す。
現在の方法論は、インシデント管理ワークフローにおける言語モデル駆動の自動化の可能性を制限するため、このモダリティのミスマッチに不適切に対処している。
本稿では,事前訓練された言語モデル埋め込み空間と時系列表現を調和させるマルチモーダル診断フレームワークを提案する。
提案手法は,(1)パターンのセマンティクスを保存しながら時間セグメントを単一トークンの抽象化に蒸留するセマンティクス圧縮手法,(2)プロジェクト時系列の特徴を言語モデルラテント空間に有意に表現したアライメントエンコーダ,(3)アライメントとアライメントのインシデント知識を専門家レベルの障害属性として合成する検索強化診断パイプライン,の3つの技術進歩に寄与する。
6つのクラウドシステムベンチマークの総合的な評価は、我々のフレームワークが主要なパフォーマンスを達成し、48.75%の診断精度に達し、複合障害モードを含むシナリオを顕著に改善していることを示している。
その結果,実運用環境におけるマルチモーダルテレメトリデータに対する言語モデルの推論を可能にする効果的な手法として,埋め込み空間アライメントの有効性が検証された。
関連論文リスト
- Context-level Language Modeling by Learning Predictive Context Embeddings [79.00607069677393]
textbfContextLMは、固有のtextbfnext-context予測目標で標準事前学習を強化するフレームワークである。
このメカニズムは、将来のトークンチャンクから派生したエラー信号を利用して、マルチトークンコンテキストの予測表現を学ぶようモデルを訓練する。
GPT2およびPythiaモデルファミリーの実験では、1.5ドルBのパラメータまでスケールし、ContextLMがパープレキシティとダウンストリームのタスクパフォーマンスの両方で一貫した改善を提供することを示した。
論文 参考訳(メタデータ) (2025-10-23T07:09:45Z) - RHINO: Guided Reasoning for Mapping Network Logs to Adversarial Tactics and Techniques with Large Language Models [9.065322387043546]
人間の推論を反映した3つの解釈可能なフェーズに大言語モデルを分解するフレームワークであるRHINOを紹介する。
RHINOは、構造的推論による出力信頼性を改善しながら、低レベルの観測と反対方向のセマンティックギャップを橋渡しする。
以上の結果から,RHINOは脅威解析の解釈可能性やスケーラビリティを著しく向上させ,LLMを運用上のセキュリティ設定にデプロイするための青写真を提供することが示された。
論文 参考訳(メタデータ) (2025-10-16T02:25:46Z) - T3former: Temporal Graph Classification with Topological Machine Learning [4.4924444466378555]
時間グラフ分類は、サイバーセキュリティ、脳接続分析、トラフィック監視などのアプリケーションにおいて重要な役割を果たす。
我々は、スライドウィンドウトポロジカルおよびスペクトルディスクリプタを1級トークンとして活用し、特殊なディスクリプタ・アテンション機構によって統合された新しいトポロジカル・テンポロジカル・トランスフォーマーT3formerを紹介する。
T3formerは、動的ソーシャルネットワーク、脳機能接続データセット、トラフィックネットワークなど、複数のベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-15T17:46:32Z) - RationAnomaly: Log Anomaly Detection with Rationality via Chain-of-Thought and Reinforcement Learning [27.235259453535537]
RationAnomalyは、Chain-of-Thoughtファインチューニングと強化学習を相乗化することにより、ログの異常検出を強化する新しいフレームワークである。
コードとデータセットを含む、対応するリソースをリリースしました。
論文 参考訳(メタデータ) (2025-09-18T07:35:58Z) - When Does Multimodality Lead to Better Time Series Forecasting? [96.26052272121615]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文 参考訳(メタデータ) (2025-06-20T23:55:56Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Model Criticism for Long-Form Text Generation [113.13900836015122]
我々は,テキストの高レベル構造を評価するために,潜在空間におけるモデル批判という統計ツールを適用した。
我々は,コヒーレンス,コア,トピックスという,ハイレベルな談話の3つの代表的な側面について実験を行った。
トランスフォーマーベースの言語モデルでは、トピック構造をキャプチャできるが、構造コヒーレンスやモデリングコアスを維持するのが難しくなる。
論文 参考訳(メタデータ) (2022-10-16T04:35:58Z) - A Causal-based Framework for Multimodal Multivariate Time Series
Validation Enhanced by Unsupervised Deep Learning as an Enabler for Industry
4.0 [0.0]
マルチレベルコンテキスト異常検出のための概念検証フレームワークを開発した。
長期記憶オートエンコーダの評価を成功させ、高炉の複数の資産に関連する文脈の学習された表現を検証する。
プロセス産業に適用された非教師なし根本原因分析の実現手段として、因果発見と表現学習を組み合わせた研究ロードマップが特定されている。
論文 参考訳(メタデータ) (2020-08-05T14:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。