論文の概要: SecMate: Multi-Agent Adaptive Cybersecurity Troubleshooting with Tri-Context Personalization
- arxiv url: http://arxiv.org/abs/2604.26394v1
- Date: Wed, 29 Apr 2026 08:04:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.306959
- Title: SecMate: Multi-Agent Adaptive Cybersecurity Troubleshooting with Tri-Context Personalization
- Title(参考訳): SecMate:Tri-Contextパーソナライゼーションによるマルチエージェント適応型サイバーセキュリティトラブルシューティング
- Authors: Yair Meidan, Omri Haller, Yulia Moshan, Shahaf David, Dudu Mimran, Yuval Elovici, Asaf Shabtai,
- Abstract要約: サイバーセキュリティトラブルシューティングのためのマルチエージェントVCAであるSecMateを紹介する。
144名, 会話711名を対象に, SecMateの評価を行った。
- 参考スコア(独自算出の注目度): 20.018728840933715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in large language models and agentic frameworks have enabled virtual customer assistants (VCAs) for complex support. We present SecMate, a multi-agent VCA for cybersecurity troubleshooting that integrates device, user, and service specificity from conversational and device-level signals. Device specificity is provided by a lightweight local diagnostic utility, while user specificity relies on implicit proficiency inference and profile-aware troubleshooting. Service specificity is achieved through a proactive, context-aware recommender. We evaluate SecMate in a controlled study with 144 participants and 711 conversations. Device-level evidence increased correct resolutions from about 50% to over 90% relative to an LLM-only baseline, while step-by-step guidance improved pleasantness and reduced user burden. The recommender achieved high relevance (MRR@1=0.75), and participants showed strong willingness to substitute human IT support at costs well below human benchmarks. We release the full code base and a richly annotated dataset to support reproducible research on adaptive VCAs.
- Abstract(参考訳): 大規模言語モデルとエージェントフレームワークの最近の進歩は、複雑なサポートのために仮想顧客アシスタント(VCA)を可能にしている。
SecMateは、デバイス、ユーザ、サービスの詳細を対話型およびデバイスレベルの信号から統合する、サイバーセキュリティトラブルシューティングのためのマルチエージェントVCAである。
デバイス特異性は軽量な局所診断ユーティリティによって提供され、ユーザの特異性は暗黙の熟練度推論とプロファイル対応のトラブルシューティングに依存している。
サービスの特異性は、積極的にコンテキスト対応のレコメンデータを通じて達成されます。
144名, 会話711名を対象に, SecMateの評価を行った。
デバイスレベルの証拠は、LLMのみのベースラインに比べて50%程度から90%以上まで正解率を高め、ステップバイステップのガイダンスは快適性を改善し、ユーザの負担を軽減した。
推薦者は高い関連性(MRR@1=0.75)を達成し、参加者はヒトのベンチマークよりはるかに低いコストで人間のITサポートを置き換える意志を示した。
適応VCAに関する再現可能な研究をサポートするために、コードベースと豊富な注釈付きデータセットをリリースします。
関連論文リスト
- HippoCamp: Benchmarking Contextual Agents on Personal Computers [71.97629614361549]
HippoCampは、マルチモーダルファイル管理におけるエージェントの能力を評価するために設計された新しいベンチマークである。
本ベンチマークでは,2K以上の実世界のファイルにまたがる42.4GBのデータを含む,多種多様なモダリティにまたがる実世界のプロファイルに対して,デバイススケールのファイルシステムをインスタンス化する。
論文 参考訳(メタデータ) (2026-04-01T17:58:33Z) - CounselReflect: A Toolkit for Auditing Mental-Health Dialogues [7.795471844983525]
CounselReflectは、メンタルヘルスサポートの対話を監査するためのエンドツーエンドツールキットである。
セッションレベルの要約、ターンレベルのスコア、エビデンスリンクされた抜粋を備えた構造化された多次元レポートを提供する。
論文 参考訳(メタデータ) (2026-03-31T08:35:43Z) - Ask or Assume? Uncertainty-Aware Clarification-Seeking in Coding Agents [4.301199871195023]
大規模言語モデル(LLM)エージェントは、ソフトウェア工学のようなオープンなドメインにますますデプロイされています。
我々は, SWE-bench Verified の未特定変種に対する LLM エージェントの解明と探索能力を評価する。
コード実行から不特定性検出を明示的に分離する不確実性認識型マルチエージェントスキャフォールドを提案する。
論文 参考訳(メタデータ) (2026-03-27T09:56:26Z) - VIGIL: Towards Edge-Extended Agentic AI for Enterprise IT Support [7.77807923684412]
VIGILはエッジ拡張型エージェントAIシステムで、デスクトップ常駐エージェントを配置して、位置診断、企業知識の検索、およびポリシーを優先した修復を、明示的な同意とエンドツーエンドの可観測性を持って、ユーザデバイス上で直接行う。
VIGILの100のリソース制約されたエンドポイント上での運用ループを10週間のパイロットテストで、VIGILはインタラクションラウンドを39%削減し、少なくとも4倍高速な診断を実現し、マッチしたケースの82%でセルフサービス解決をサポートする。
利用者は、4つの検証済み機器にまたがる優れたユーザビリティ、高い信頼、低認知負荷を報告し、質的なフィードバックは透明性を強調している。
論文 参考訳(メタデータ) (2026-03-17T04:24:19Z) - RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation [63.74915464611075]
RecThinkerはツール拡張推論を推奨するエージェントフレームワークである。
我々はRecThinker専用のツール群を開発し、モデルがユーザアイテム側および協調的な情報を取得することを可能にする。
論文 参考訳(メタデータ) (2026-03-10T16:07:17Z) - GISA: A Benchmark for General Information-Seeking Assistant [102.30831921333755]
GISAは汎用情報検索アシスタントのベンチマークであり、373の人為的なクエリで構成されている。
深い推論と広範囲な情報集約を統合タスクに統合し、暗記に抵抗するために定期的に更新された回答を含むライブサブセットを含む。
主要なLCMと商用検索製品の実験では、最高のパフォーマンスモデルでさえ19.30%の正確なマッチスコアしか達成していないことが示されている。
論文 参考訳(メタデータ) (2026-02-09T11:44:15Z) - Toward Training Superintelligent Software Agents through Self-Play SWE-RL [66.11447353341926]
セルフプレイSWE-RLは、超知能ソフトウェアエージェントのトレーニングパラダイムに向けた第一歩である。
当社のアプローチでは,ソースコードとインストール済みの依存関係を備えたサンドボックスリポジトリへのアクセスのみを必要としています。
我々の成果は、早い段階で、エージェントが現実世界のソフトウェアリポジトリから広範囲にわたる学習経験を自律的に収集する道のりを示唆している。
論文 参考訳(メタデータ) (2025-12-21T00:49:40Z) - Benchmarking Contextual Understanding for In-Car Conversational Systems [0.9437812993238097]
In-car Conversational Question Answering (ConvQA) システムは,シームレスな音声対話を実現することでユーザエクスペリエンスを著しく向上させる。
本稿では,Large Language Models (LLMs) と高度なプロンプト技術およびエージェントベース手法を用いて,ConvQAシステム応答がユーザの発話に適合する程度を評価する。
論文 参考訳(メタデータ) (2025-12-12T21:15:49Z) - AVTrustBench: Assessing and Enhancing Reliability and Robustness in Audio-Visual LLMs [70.4578433679737]
我々は9つの細工されたタスクにまたがる600万のサンプルからなるAudio-Visual Trustworthiness Assessment Benchmark (AVTrustBench)を紹介する。
ベンチマークを用いて、13の最先端AVLLMを広範囲に評価した。
その結果、既存のモデルのほとんどは、人間のような理解を達成できないことが判明した。
論文 参考訳(メタデータ) (2025-01-03T23:03:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。