論文の概要: OpenDerisk: An Industrial Framework for AI-Driven SRE, with Design, Implementation, and Case Studies
- arxiv url: http://arxiv.org/abs/2510.13561v2
- Date: Thu, 16 Oct 2025 11:18:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 14:17:28.105779
- Title: OpenDerisk: An Industrial Framework for AI-Driven SRE, with Design, Implementation, and Case Studies
- Title(参考訳): OpenDerisk: 設計、実装、ケーススタディを備えたAI駆動SREの産業フレームワーク
- Authors: Peng Di, Faqiang Chen, Xiao Bai, Hongjun Yang, Qingfeng Li, Ganglin Wei, Jian Mou, Feng Shi, Keting Chen, Peng Tang, Zhitao Shen, Zheng Li, Wenhui Shi, Junwei Guo, Hang Yu,
- Abstract要約: OpenDeriskは、SRE(Site Reliability Engineering)チーム向けに設計された、オープンソースのマルチエージェントフレームワークです。
OpenDeriskは、診断ネイティブなコラボレーションモデル、プラグイン可能な推論エンジン、知識エンジン、標準化されたプロトコルを統合している。
評価の結果,OpenDeriskは精度と効率の両方で最先端のベースラインを著しく上回っていることがわかった。
- 参考スコア(独自算出の注目度): 27.85475708587983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The escalating complexity of modern software imposes an unsustainable operational burden on Site Reliability Engineering (SRE) teams, demanding AI-driven automation that can emulate expert diagnostic reasoning. Existing solutions, from traditional AI methods to general-purpose multi-agent systems, fall short: they either lack deep causal reasoning or are not tailored for the specialized, investigative workflows unique to SRE. To address this gap, we present OpenDerisk, a specialized, open-source multi-agent framework architected for SRE. OpenDerisk integrates a diagnostic-native collaboration model, a pluggable reasoning engine, a knowledge engine, and a standardized protocol (MCP) to enable specialist agents to collectively solve complex, multi-domain problems. Our comprehensive evaluation demonstrates that OpenDerisk significantly outperforms state-of-the-art baselines in both accuracy and efficiency. This effectiveness is validated by its large-scale production deployment at Ant Group, where it serves over 3,000 daily users across diverse scenarios, confirming its industrial-grade scalability and practical impact. OpenDerisk is open source and available at https://github.com/derisk-ai/OpenDerisk/
- Abstract(参考訳): 現代のソフトウェアのエスカレートする複雑さは、SRE(Site Reliability Engineering)チームに持続不可能な運用負担を課し、専門家の診断推論をエミュレート可能なAI駆動の自動化を要求する。
従来のAIメソッドから汎用マルチエージェントシステムに至るまで、既存のソリューションは不足している。
このギャップに対処するため、SRE用に設計されたオープンソースマルチエージェントフレームワークであるOpenDeriskを紹介します。
OpenDeriskは、診断ネイティブなコラボレーションモデル、プラグイン可能な推論エンジン、知識エンジン、標準化されたプロトコル(MCP)を統合し、専門家エージェントが複雑なマルチドメインの問題を一括して解決できるようにする。
包括的評価は,OpenDeriskが最先端のベースラインを精度と効率の両方で著しく上回っていることを示している。
この効果は、Ant Groupの大規模プロダクションデプロイメントによって検証され、様々なシナリオで1日3000人以上のユーザに提供され、産業レベルのスケーラビリティと実践的な影響を確認している。
OpenDeriskはオープンソースで、https://github.com/derisk-ai/OpenDerisk/で入手できる。
関連論文リスト
- SHERLOCK: Towards Dynamic Knowledge Adaptation in LLM-enhanced E-commerce Risk Management [10.255396179168974]
電子商取引会社は、不審な事件のリスク調査を行い、発覚した詐欺パターンを特定している。
ケース分析の膨大な量は、リスク管理アナリストにかなりの負荷を課します。
本稿では,大規模言語モデル(LLM)の推論機能を活用し,リスク調査におけるアナリストの支援を行うSHERLOCKフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-10T02:57:58Z) - Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.895981259683]
汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文 参考訳(メタデータ) (2025-08-01T08:11:31Z) - RiOSWorld: Benchmarking the Risk of Multimodal Computer-Use Agents [20.512782598312555]
実世界のコンピュータ操作におけるMLLMエージェントの潜在的なリスクを評価するためのベンチマークである textbfRiOSWorld を紹介する。
私たちのベンチマークには、Web、ソーシャルメディア、マルチメディア、os、Eメール、オフィスソフトウェアを含む、さまざまなコンピュータアプリケーションにまたがる492の危険タスクが含まれています。
評価には,リスク目標意図とリスク目標達成の2つの視点から安全リスクを評価する。
論文 参考訳(メタデータ) (2025-05-31T16:04:59Z) - Engineering Risk-Aware, Security-by-Design Frameworks for Assurance of Large-Scale Autonomous AI Models [0.0]
本稿では,大規模自律型AIシステムを対象とした企業レベルのリスク認識型セキュリティ・バイ・デザイン手法を提案する。
敵的および運用的ストレス下でのモデル動作の証明可能な保証を提供する統一パイプラインについて詳述する。
国家安全保障、オープンソースモデルガバナンス、産業自動化におけるケーススタディは、脆弱性とコンプライアンスのオーバーヘッドの計測可能な削減を実証している。
論文 参考訳(メタデータ) (2025-05-09T20:14:53Z) - Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。
生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。
本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文 参考訳(メタデータ) (2024-08-24T19:34:04Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - Risks and Opportunities of Open-Source Generative AI [64.86989162783648]
Generative AI(Gen AI)の応用は、科学や医学、教育など、さまざまな分野に革命をもたらすことが期待されている。
こうした地震の変化の可能性は、この技術の潜在的なリスクについて活発に議論を巻き起こし、より厳格な規制を要求した。
この規制は、オープンソースの生成AIの誕生する分野を危険にさらす可能性がある。
論文 参考訳(メタデータ) (2024-05-14T13:37:36Z) - On STPA for Distributed Development of Safe Autonomous Driving: An Interview Study [0.7851536646859475]
System-Theoretic Process Analysis (STPA)は、防衛や航空宇宙といった安全関連分野に適用される新しい手法である。
STPAは、分散システム開発とマルチアトラクション設計レベルを備えた自動車システム工学において、完全には有効でない前提条件を前提としている。
これは継続的開発とデプロイメントにおける保守性の問題と見なすことができる。
論文 参考訳(メタデータ) (2024-03-14T15:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。