論文の概要: Information-Dense Reasoning for Efficient and Auditable Security Alert Triage
- arxiv url: http://arxiv.org/abs/2512.08169v1
- Date: Tue, 09 Dec 2025 01:57:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.782031
- Title: Information-Dense Reasoning for Efficient and Auditable Security Alert Triage
- Title(参考訳): 効果的なセキュリティアラートトリアージのための情報密度推論
- Authors: Guangze Zhao, Yongzheng Zhang, Changbo Tian, Dan Xie, Hongri Liu, Bailing Wang,
- Abstract要約: セキュリティオペレーションセンターは、分単位のサービスウィンドウの下で、巨大で異質なアラートストリームに直面します。
既存のソリューションは失敗する:シグネチャシステムは不安定で、異常なメソッドには動作性がなく、完全にクラウドでホストされたLLMはレイテンシ、コスト、プライバシの懸念を高める。
制約のある情報特化最適化を通じて、このトレードオフに対処するハイブリッドクラウドオンプレミスフレームワークであるAIDRを提案する。
- 参考スコア(独自算出の注目度): 5.3761282240937796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Security Operations Centers face massive, heterogeneous alert streams under minute-level service windows, creating the Alert Triage Latency Paradox: verbose reasoning chains ensure accuracy and compliance but incur prohibitive latency and token costs, while minimal chains sacrifice transparency and auditability. Existing solutions fail: signature systems are brittle, anomaly methods lack actionability, and fully cloud-hosted LLMs raise latency, cost, and privacy concerns. We propose AIDR, a hybrid cloud-edge framework that addresses this trade-off through constrained information-density optimization. The core innovation is gradient-based compression of reasoning chains to retain only decision-critical steps--minimal evidence sufficient to justify predictions while respecting token and latency budgets. We demonstrate that this approach preserves decision-relevant information while minimizing complexity. We construct compact datasets by distilling alerts into 3-5 high-information bullets (68% token reduction), train domain-specialized experts via LoRA, and deploy a cloud-edge architecture: a cloud LLM routes alerts to on-premises experts generating SOAR-ready JSON. Experiments demonstrate AIDR achieves higher accuracy and 40.6% latency reduction versus Chain-of-Thought, with robustness to data corruption and out-of-distribution generalization, enabling auditable and efficient SOC triage with full data residency compliance.
- Abstract(参考訳): 冗長な推論チェーンは正確性とコンプライアンスを保証するが、禁止されたレイテンシとトークンコストを発生させる一方で、最小限のチェーンは透明性と監査性を犠牲にする。
既存のソリューションは失敗する:シグネチャシステムは不安定で、異常なメソッドには動作性がなく、完全にクラウドでホストされたLLMはレイテンシ、コスト、プライバシの懸念を高める。
制約のある情報密度最適化を通じて、このトレードオフに対処するハイブリッドクラウドエッジフレームワークであるAIDRを提案する。
中心となるイノベーションは、決定クリティカルなステップのみを保持するための推論チェーンの勾配に基づく圧縮であり、トークンと遅延予算を尊重しながら予測を正当化するのに十分な最小限の証拠である。
本手法は,複雑性を最小化しながら,意思決定関連情報を保存できることを実証する。
アラートを3~5個の高情報弾丸(トークン還元率68%)に蒸留し、LoRAを通じてドメインの専門家を訓練し、クラウドエッジアーキテクチャをデプロイすることで、コンパクトなデータセットを構築します。
実験では、AIDRはより正確で、Chain-of-Thoughtに比べて40.6%のレイテンシ低減を実現し、データの破損とアウト・オブ・ディストリビューションの一般化に頑健で、完全なデータ常駐コンプライアンスを備えた監査可能で効率的なSOCトリアージを実現している。
関連論文リスト
- CoSense-LLM: Semantics at the Edge with Cost- and Uncertainty-Aware Cloud-Edge Cooperation [0.0]
CoSense-LLMは、連続したマルチモーダルセンサストリームをコンパクトなセマンティックトークンに変換するエッジファーストフレームワークである。
システムは、ページ化またはストリーミングKVキャッシュ、Flashスタイルのカーネル、投機的復号化、量子化されたLoRAアダプタなど、モダンなサービス最適化で動作する。
論文 参考訳(メタデータ) (2025-10-22T15:16:56Z) - Intra-request branch orchestration for efficient LLM reasoning [52.68946975865865]
大規模言語モデル(LLM)は、複雑なタスクの正確性を改善するために、推論時推論アルゴリズムにますます依存している。
それまでの作業は、トークンの使用を減らすことを中心に、多くの場合、正確さを犠牲にしつつ、他のレイテンシ要因を見越すことに重点を置いていた。
本稿では,LLMサービスシステムであるDUCHESSについて,予測によって導かれるリクエスト内ブランチオーケストレーションにより,精度を犠牲にすることなく,コストとレイテンシを低減できるシステムを提案する。
論文 参考訳(メタデータ) (2025-09-29T15:52:08Z) - Dynamic Speculative Agent Planning [57.630218933994534]
大規模な言語モデルベースのエージェントは、遅延の禁止と推論コストのために、重要なデプロイメント課題に直面している。
本稿では,オンライン強化学習フレームワークである動的投機計画(Dynamic Speculative Planning, DSP)を紹介する。
2つの標準エージェントベンチマークの実験では、DSPは高速加速法に匹敵する効率を達成し、総コストを30%削減し、不要コストを60%まで削減している。
論文 参考訳(メタデータ) (2025-09-02T03:34:36Z) - How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [13.453033795109155]
協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の難しさを評価するための確立された基準はない。
本稿では、CIにおけるMIAの難易度を評価するための最初の理論的基準を提案し、相互情報、エントロピー、有効情報量などを重要な要因として同定する。
論文 参考訳(メタデータ) (2025-01-01T13:00:01Z) - Privacy-Preserving Distributed Learning for Residential Short-Term Load
Forecasting [11.185176107646956]
電力システムの負荷データは、住宅ユーザの日常のルーチンを不注意に明らかにし、彼らの財産のセキュリティにリスクを及ぼす可能性がある。
我々はマルコフスイッチ方式の分散学習フレームワークを導入し、その収束は厳密な理論的解析によって実証される。
実世界の電力系統負荷データを用いたケーススタディにより,提案アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2024-02-02T16:39:08Z) - TeD-SPAD: Temporal Distinctiveness for Self-supervised
Privacy-preservation for video Anomaly Detection [59.04634695294402]
人間の監視のないビデオ異常検出(VAD)は複雑なコンピュータビジョンタスクである。
VADのプライバシー漏洩により、モデルは人々の個人情報に関連する不必要なバイアスを拾い上げ、増幅することができる。
本稿では,視覚的プライベート情報を自己管理的に破壊する,プライバシーに配慮したビデオ異常検出フレームワークTeD-SPADを提案する。
論文 参考訳(メタデータ) (2023-08-21T22:42:55Z) - Over-the-Air Federated Learning with Privacy Protection via Correlated
Additive Perturbations [57.20885629270732]
我々は、複数のユーザ/エージェントからエッジサーバへの勾配更新をOtA(Over-the-Air)で送信することで、無線フェデレーション学習のプライバシー面を考察する。
従来の摂動に基づく手法は、トレーニングの精度を犠牲にしてプライバシー保護を提供する。
本研究では,エッジサーバにおけるプライバシリークの最小化とモデル精度の低下を目標とする。
論文 参考訳(メタデータ) (2022-10-05T13:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。