論文の概要: SIA: Symbolic Interpretability for Anticipatory Deep Reinforcement Learning in Network Control
- arxiv url: http://arxiv.org/abs/2601.22044v1
- Date: Thu, 29 Jan 2026 17:46:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:50.058006
- Title: SIA: Symbolic Interpretability for Anticipatory Deep Reinforcement Learning in Network Control
- Title(参考訳): SIA:ネットワーク制御における予測的深層強化学習のための記号的解釈可能性
- Authors: MohammadErfan Jabbari, Abhishek Duttagupta, Claudio Fiandrino, Leonardo Bonati, Salvatore D'Oro, Michele Polese, Marco Fiore, Tommaso Melodia,
- Abstract要約: 予測によるエージェントの増強は、時間的近視を克服することができるが、ネットワークの獲得は少ない。
予測拡張DRLエージェントの動作をリアルタイムに公開する最初のインタプリタであるSIAを提案する。
SIAは、既存のXAI法よりも200倍以上高速なミリ秒以下の速度を達成する。
- 参考スコア(独自算出の注目度): 28.5196024757636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning (DRL) promises adaptive control for future mobile networks but conventional agents remain reactive: they act on past and current measurements and cannot leverage short-term forecasts of exogenous KPIs such as bandwidth. Augmenting agents with predictions can overcome this temporal myopia, yet uptake in networking is scarce because forecast-aware agents act as closed-boxes; operators cannot tell whether predictions guide decisions or justify the added complexity. We propose SIA, the first interpreter that exposes in real time how forecast-augmented DRL agents operate. SIA fuses Symbolic AI abstractions with per-KPI Knowledge Graphs to produce explanations, and includes a new Influence Score metric. SIA achieves sub-millisecond speed, over 200x faster than existing XAI methods. We evaluate SIA on three diverse networking use cases, uncovering hidden issues, including temporal misalignment in forecast integration and reward-design biases that trigger counter-productive policies. These insights enable targeted fixes: a redesigned agent achieves a 9% higher average bitrate in video streaming, and SIA's online Action-Refinement module improves RAN-slicing reward by 25% without retraining. By making anticipatory DRL transparent and tunable, SIA lowers the barrier to proactive control in next-generation mobile networks.
- Abstract(参考訳): 深層強化学習(DRL)は、将来のモバイルネットワークに対して適応的な制御を約束するが、従来のエージェントは、過去の測定と現在の測定に反応し、帯域幅などの外因性KPIの短期的な予測を活用できない。
予測エージェントがクローズドボックスとして機能するため、予測エージェントは、この時間的ミオピアを克服することができるが、ネットワークの獲得は少なく、予測エージェントが予測を導くか、追加の複雑さを正当化するかはオペレーターが判断できない。
予測拡張DRLエージェントの動作をリアルタイムに公開する最初のインタプリタであるSIAを提案する。
SIAは、シンボリックAI抽象化とKPI単位の知識グラフを融合して説明を生成し、新しいインフルエンススコアメトリックを含んでいる。
SIAは、既存のXAI法よりも200倍以上高速なミリ秒以下の速度を達成する。
我々は、予測統合における時間的ミスアライメントや、反生産的政策の引き金となる報酬-デザインバイアスなど、隠れた問題を明らかにする3つのネットワークユースケースについて、SIAを評価した。
再設計されたエージェントは、ビデオストリーミングにおける平均ビットレートを9%向上させ、SIAのオンラインAction-Refinementモジュールは、再トレーニングせずにRANスライシング報酬を25%改善する。
予測DRLを透明で調整可能なものにすることで、次世代モバイルネットワークにおけるアクティブ制御の障壁を低くする。
関連論文リスト
- Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - Impatient Users Confuse AI Agents: High-fidelity Simulations of Human Traits for Testing Agents [58.00130492861884]
TraitBasisは、AIエージェントを体系的にストレステストするための軽量でモデルに依存しない方法である。
TraitBasisは、ステアブルなユーザ特性に対応するアクティベーション空間で方向を学習する。
We observed on average a 2%-30% performance degradation on $tau$-Trait across frontier model。
論文 参考訳(メタデータ) (2025-10-06T05:03:57Z) - Interpretable Anomaly-Based DDoS Detection in AI-RAN with XAI and LLMs [19.265893691825234]
次世代無線アクセスネットワーク(RAN)は、インテリジェントコントローラを通じてプログラム可能性、インテリジェンス、およびほぼリアルタイム制御を導入する。
本稿では,Large Language Models (LLMs) による将来のRAN環境に対する XAI 侵入検知(IDS) の機会,課題,研究ギャップを概説する。
論文 参考訳(メタデータ) (2025-07-27T22:16:09Z) - Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-07T02:24:44Z) - BARTPredict: Empowering IoT Security with LLM-Driven Cyber Threat Prediction [4.836070911511429]
IoT(Internet of Things)テクノロジの統合は運用上の進歩につながったが、サイバーセキュリティの脅威に対する新たな脆弱性も導入した。
侵入検知システムは、しばしば反応し、ネットワーク内で観察される特定のパターンや異常によって引き起こされる。
本稿では,事前学習型大規模言語モデル(LLM)を応用した,革新的な侵入予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-03T06:37:39Z) - Beyond Detection: Leveraging Large Language Models for Cyber Attack Prediction in IoT Networks [4.836070911511429]
本稿では,Long Short Term Memory(LSTM)ネットワークとLarge Language Models(LLM)を組み合わせた新しいネットワーク侵入予測フレームワークを提案する。
我々のフレームワークは、CICIoT2023 IoT攻撃データセットに基づいて評価され、予測能力の大幅な改善を示し、全体的な精度は98%である。
論文 参考訳(メタデータ) (2024-08-26T06:57:22Z) - A New Deep Boosted CNN and Ensemble Learning based IoT Malware Detection [0.0]
セキュリティ問題は、特にIoT(Internet of Things)環境で、さまざまなタイプのネットワークで脅かされている。
我々は,新しいマルウェア検出フレームワークであるDeep Squeezed-Boosted and Ensemble Learning (DSBEL)を開発し,Squeezed-Boosted Boundary-Region Split-Transform-Merge (SB-BR-STM) CNNとアンサンブル学習を行った。
論文 参考訳(メタデータ) (2022-12-15T18:14:51Z) - Adversarial Refinement Network for Human Motion Prediction [61.50462663314644]
リカレントニューラルネットワークとフィードフォワードディープネットワークという2つの一般的な手法は、粗い動きの傾向を予測することができる。
本稿では,新たな逆誤差増大を伴う簡易かつ効果的な粗大きめ機構に従えば,ARNet(Adversarial Refinement Network)を提案する。
論文 参考訳(メタデータ) (2020-11-23T05:42:20Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z) - Learn2Perturb: an End-to-end Feature Perturbation Learning to Improve
Adversarial Robustness [79.47619798416194]
Learn2Perturbは、ディープニューラルネットワークの対角的堅牢性を改善するために、エンドツーエンドの機能摂動学習アプローチである。
予測最大化にインスパイアされ、ネットワークと雑音パラメータを連続的にトレーニングするために、交互にバックプロパゲーショントレーニングアルゴリズムが導入された。
論文 参考訳(メタデータ) (2020-03-02T18:27:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。