論文の概要: Large Language Models for Real-World IoT Device Identification
- arxiv url: http://arxiv.org/abs/2510.13817v1
- Date: Wed, 24 Sep 2025 05:33:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 05:23:07.165332
- Title: Large Language Models for Real-World IoT Device Identification
- Title(参考訳): リアルタイムIoTデバイス識別のための大規模言語モデル
- Authors: Rameen Mahmood, Tousif Ahmed, Sai Teja Peddinti, Danny Yuxing Huang,
- Abstract要約: 異種ネットワークメタデータ上での言語モデリングタスクとしてデバイス識別を再構成するセマンティック推論パイプラインを導入する。
信頼性の高い監視を構築するために、IoT Inspectorデータセット用の高忠実度ベンダーラベルを生成します。
次に,LLaMA3.18Bの量子化モデルとカリキュラム学習を併用し,疎性および長期ベンダー分布下での一般化を支援する。
- 参考スコア(独自算出の注目度): 5.841950328636518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid expansion of IoT devices has outpaced current identification methods, creating significant risks for security, privacy, and network accountability. These challenges are heightened in open-world environments, where traffic metadata is often incomplete, noisy, or intentionally obfuscated. We introduce a semantic inference pipeline that reframes device identification as a language modeling task over heterogeneous network metadata. To construct reliable supervision, we generate high-fidelity vendor labels for the IoT Inspector dataset, the largest real-world IoT traffic corpus, using an ensemble of large language models guided by mutual-information and entropy-based stability scores. We then instruction-tune a quantized LLaMA3.18B model with curriculum learning to support generalization under sparsity and long-tail vendor distributions. Our model achieves 98.25% top-1 accuracy and 90.73% macro accuracy across 2,015 vendors while maintaining resilience to missing fields, protocol drift, and adversarial manipulation. Evaluation on an independent IoT testbed, coupled with explanation quality and adversarial stress tests, demonstrates that instruction-tuned LLMs provide a scalable and interpretable foundation for real-world device identification at scale.
- Abstract(参考訳): IoTデバイスの急速な拡張は、現在の識別方法を上回っ、セキュリティ、プライバシ、ネットワークアカウンタビリティの重大なリスクを生み出している。
これらの課題は、交通メタデータが不完全、騒々しく、意図的に難読化されるような、オープンな環境において高まっています。
異種ネットワークメタデータ上での言語モデリングタスクとしてデバイス識別を再構成するセマンティック推論パイプラインを導入する。
信頼性の高い監視を構築するために,相互情報とエントロピーに基づく安定性スコアでガイドされた,大規模な言語モデルのアンサンブルを用いて,IoTインスペクタデータセット用の高忠実度ベンダラベルを生成する。
次に,LLaMA3.18Bの量子化モデルとカリキュラム学習を併用し,疎性および長期ベンダー分布下での一般化を支援する。
我々のモデルは、2,015ベンダーで98.25%のトップ1の精度と90.73%のマクロ精度を実現し、不足するフィールドへの回復力、プロトコルのドリフト、敵の操作を維持できる。
独立したIoTテストベッドの評価と、説明品質と逆ストレステストを組み合わせることで、命令チューニングされたLLMが、大規模な実世界のデバイス識別のためのスケーラブルで解釈可能な基盤を提供することを示した。
関連論文リスト
- DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - GeMID: Generalizable Models for IoT Device Identification [4.029017464832905]
デバイス識別(DI)は、そのトラフィックパターンに基づいてIoTデバイスを識別する。
機械学習モデルを構築する既存のDIアプローチは、様々なネットワーク環境におけるモデル一般化可能性の課題を見落としていることが多い。
本稿では、この制限に対処し、異なるネットワーク環境において収集されたデータセット間でのDIモデルの一般化性を評価するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T17:09:43Z) - Efficient Federated Intrusion Detection in 5G ecosystem using optimized BERT-based model [0.7100520098029439]
5Gは高度なサービスを提供し、IoT(Internet of Things)内のインテリジェントトランスポート、コネクテッドヘルスケア、スマートシティなどのアプリケーションをサポートする。
これらの進歩は、ますます高度なサイバー攻撃を伴う、重大なセキュリティ上の課題をもたらす。
本稿では,連合学習と大規模言語モデル(LLM)を用いた頑健な侵入検知システム(IDS)を提案する。
論文 参考訳(メタデータ) (2024-09-28T15:56:28Z) - Effective Intrusion Detection in Heterogeneous Internet-of-Things Networks via Ensemble Knowledge Distillation-based Federated Learning [52.6706505729803]
我々は、分散化された侵入検知システムの共有モデル(IDS)を協調訓練するために、フェデレートラーニング(FL)を導入する。
FLEKDは従来のモデル融合法よりも柔軟な凝集法を実現する。
実験の結果,提案手法は,速度と性能の両面で,局所訓練と従来のFLよりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T14:16:37Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - A Novel IoT Trust Model Leveraging Fully Distributed Behavioral
Fingerprinting and Secure Delegation [3.10770247120758]
IoT(Internet of Things)ソリューションは、データ収集と処理を容易にするために、急激な需要を実験している。
自律的な方法で提供される新機能やサービスの数が増えるほど、ユーザをデータハッキングや損失に晒す攻撃面が大きくなる。
そこで本稿では, スマートなものの装備に関する非自明な問題に対処し, 隣人を通じて, ネットワーク内のオブジェクトの信頼性を, 対話前に評価する戦略を提示する。
論文 参考訳(メタデータ) (2023-10-02T07:45:49Z) - MMRNet: Improving Reliability for Multimodal Object Detection and
Segmentation for Bin Picking via Multimodal Redundancy [68.7563053122698]
マルチモーダル冗長性(MMRNet)を用いた信頼度の高いオブジェクト検出・分割システムを提案する。
これは、マルチモーダル冗長の概念を導入し、デプロイ中のセンサ障害問題に対処する最初のシステムである。
システム全体の出力信頼性と不確実性を測定するために,すべてのモダリティからの出力を利用する新しいラベルフリーマルチモーダル整合性(MC)スコアを提案する。
論文 参考訳(メタデータ) (2022-10-19T19:15:07Z) - The Case for Retraining of ML Models for IoT Device Identification at
the Edge [0.026215338446228163]
ネットワークのエッジで利用可能なリソースを用いて、ネットワークの振る舞いに基づいてIoTデバイスを識別する方法を示す。
エッジにおいて、デバイス識別と分類をそれぞれ80%以上と90%以上精度で達成することができる。
論文 参考訳(メタデータ) (2020-11-17T13:01:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。