論文の概要: ReGAIN: Retrieval-Grounded AI Framework for Network Traffic Analysis
- arxiv url: http://arxiv.org/abs/2512.22223v1
- Date: Tue, 23 Dec 2025 00:16:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:29.905972
- Title: ReGAIN: Retrieval-Grounded AI Framework for Network Traffic Analysis
- Title(参考訳): ReGAIN: Retrieval-Grounded AI Framework for Network Traffic Analysis
- Authors: Shaghayegh Shajarian, Kennedy Marsh, James Benson, Sajad Khorsandroo, Mahmoud Abdelsalam,
- Abstract要約: ReGAINは、トラフィックの要約、検索拡張生成(RAG)、および透過的かつ正確なネットワークトラフィック分析のための大規模言語モデル(LLM)を組み合わせたフレームワークである。
実世界のトラフィックデータセットからICMP ping flood と TCP Syn flood のトレースを評価した。
- 参考スコア(独自算出の注目度): 5.887997322139195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern networks generate vast, heterogeneous traffic that must be continuously analyzed for security and performance. Traditional network traffic analysis systems, whether rule-based or machine learning-driven, often suffer from high false positives and lack interpretability, limiting analyst trust. In this paper, we present ReGAIN, a multi-stage framework that combines traffic summarization, retrieval-augmented generation (RAG), and Large Language Model (LLM) reasoning for transparent and accurate network traffic analysis. ReGAIN creates natural-language summaries from network traffic, embeds them into a multi-collection vector database, and utilizes a hierarchical retrieval pipeline to ground LLM responses with evidence citations. The pipeline features metadata-based filtering, MMR sampling, a two-stage cross-encoder reranking mechanism, and an abstention mechanism to reduce hallucinations and ensure grounded reasoning. Evaluated on ICMP ping flood and TCP SYN flood traces from the real-world traffic dataset, it demonstrates robust performance, achieving accuracy between 95.95% and 98.82% across different attack types and evaluation benchmarks. These results are validated against two complementary sources: dataset ground truth and human expert assessments. ReGAIN also outperforms rule-based, classical ML, and deep learning baselines while providing unique explainability through trustworthy, verifiable responses.
- Abstract(参考訳): 現代のネットワークは、セキュリティとパフォーマンスのために継続的に分析されなければならない膨大な異種トラフィックを生成する。
ルールベースであれ機械学習駆動であれ、従来のネットワークトラフィック分析システムは、しばしば高い偽陽性と解釈可能性の欠如に悩まされ、アナリストの信頼が制限される。
本稿では,トラフィックの要約,検索拡張生成(RAG),および透過的かつ正確なネットワークトラフィック解析のための大規模言語モデル(LLM)を組み合わせた多段階フレームワークであるReGAINを提案する。
ReGAINは、ネットワークトラフィックから自然言語の要約を作成し、それらを多列ベクトルデータベースに埋め込み、階層的検索パイプラインを使用してLCM応答をエビデンス引用でグラウンドする。
このパイプラインは、メタデータベースのフィルタリング、MMRサンプリング、2段階のクロスエンコーダリグレード機構、幻覚を低減し、根拠となる推論を保証するための停止機構を備えている。
ICMP ping flood と TCP Syn flood flood を実世界のトラフィックデータセットから評価し、様々な攻撃タイプと評価ベンチマークで95.95%から98.82%の精度で、堅牢なパフォーマンスを示す。
これらの結果は、データセット基底真理と人間の専門家評価の2つの相補的な情報源に対して検証される。
ReGAINはまた、ルールベース、古典的ML、ディープラーニングベースラインを上回り、信頼できる検証可能な応答を通じて、ユニークな説明可能性を提供する。
関連論文リスト
- An LLM-Powered AI Agent Framework for Holistic IoT Traffic Interpretation [1.3832473221638348]
この研究は、LLMを利用したAIエージェントフレームワークで、生のパケットキャプチャをインタラクティブ分析のための構造化および意味豊かな表現に変換する。
大規模言語モデルでガイドされたAIエージェントは、インデックス化されたトラフィックアーティファクトを推論し、証拠を組み立てて正確で可読な解釈を生成する。
論文 参考訳(メタデータ) (2025-10-15T12:30:01Z) - FlowXpert: Context-Aware Flow Embedding for Enhanced Traffic Detection in IoT Network [7.30584204219718]
IoT(Internet of Things)環境では、多数のデバイス間の継続的なインタラクションによって複雑な動的ネットワークトラフィックが生成される。
機械学習(ML)ベースのトラフィック検出技術は、ネットワークセキュリティを確保する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2025-09-25T07:52:58Z) - MAWIFlow Benchmark: Realistic Flow-Based Evaluation for Network Intrusion Detection [47.86433139298671]
本稿では,MAWILAB v1.1データセットから得られたフローベースベンチマークであるMAWIFlowを紹介する。
得られたデータセットは、2011年1月、2016年、2021年に太平洋横断のバックボーンのトラフィックから引き出された、時間的に異なるサンプルで構成されている。
決定木、ランダムフォレスト、XGBoost、ロジスティック回帰を含む伝統的な機械学習手法は、CNN-BiLSTMアーキテクチャに基づいたディープラーニングモデルと比較される。
論文 参考訳(メタデータ) (2025-06-20T14:51:35Z) - Diffusion Models Meet Network Management: Improving Traffic Matrix Analysis with Diffusion-based Approach [12.549916064729313]
本稿では拡散型トラフィック行列解析フレームワークDiffusion-TMを提案する。
我々は,データセットに5%の既知値が残されている場合でも,我々のフレームワークが有望な結果を得ることができることを示す。
論文 参考訳(メタデータ) (2024-11-29T06:20:34Z) - RACH Traffic Prediction in Massive Machine Type Communications [5.416701003120508]
本稿では,ALOHAネットワークにおけるバーストトラフィック予測に適した機械学習ベースのフレームワークを提案する。
我々は,mMTCネットワークから頻繁に収集されたデータを活用することでLSTMネットワークの状態を更新する,新しい低複雑さオンライン予測アルゴリズムを開発した。
本研究では,単一基地局と数千のデバイスを異なるトラフィック発生特性を持つグループに編成したネットワーク上でのフレームワークの性能を評価する。
論文 参考訳(メタデータ) (2024-05-08T17:28:07Z) - Inferring Dynamic Networks from Marginals with Iterative Proportional Fitting [57.487936697747024]
実世界のデータ制約から生じる一般的なネットワーク推論問題は、その時間集約された隣接行列から動的ネットワークを推論する方法である。
本稿では,ネットワーク構造に対する最小限の変更の下でIPFの収束を保証するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-28T20:24:56Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Self-Ensembling GAN for Cross-Domain Semantic Segmentation [107.27377745720243]
本稿では,セマンティックセグメンテーションのためのクロスドメインデータを利用した自己理解型生成逆数ネットワーク(SE-GAN)を提案する。
SE-GANでは、教師ネットワークと学生ネットワークは、意味分節マップを生成するための自己組織化モデルを構成する。
その単純さにもかかわらず、SE-GANは敵の訓練性能を大幅に向上させ、モデルの安定性を高めることができる。
論文 参考訳(メタデータ) (2021-12-15T09:50:25Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Understanding Self-supervised Learning with Dual Deep Networks [74.92916579635336]
本稿では,2組の深層ReLUネットワークを用いたコントラスト型自己教師学習(SSL)手法を理解するための新しい枠組みを提案する。
種々の損失関数を持つSimCLRの各SGD更新において、各層の重みは共分散演算子によって更新されることを示す。
共分散演算子の役割と、そのようなプロセスでどのような特徴が学習されるかをさらに研究するために、我々は、階層的潜在木モデル(HLTM)を用いて、データ生成および増大過程をモデル化する。
論文 参考訳(メタデータ) (2020-10-01T17:51:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。