論文の概要: Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning
- arxiv url: http://arxiv.org/abs/2505.00918v1
- Date: Thu, 01 May 2025 23:34:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.866787
- Title: Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning
- Title(参考訳): 多目的Q-Learningに基づくIoTネットワークの動的分散ルーティング
- Authors: Shubham Vaishnav, Praveen Kumar Donta, Sindri Magnússon,
- Abstract要約: IoTネットワークにおける重要なタスクは、ネットワーク上で情報を検知し、送信することである。
本稿では,多目的Q-ラーニングに基づく新しい動的分散ルーティングを提案する。
また、予期しない嗜好の変化に対して、ほぼ最適な決定を下すための新しい欲求政策スキームを提案する。
- 参考スコア(独自算出の注目度): 5.694070924765916
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The last few decades have witnessed a rapid increase in IoT devices owing to their wide range of applications, such as smart healthcare monitoring systems, smart cities, and environmental monitoring. A critical task in IoT networks is sensing and transmitting information over the network. The IoT nodes gather data by sensing the environment and then transmit this data to a destination node via multi-hop communication, following some routing protocols. These protocols are usually designed to optimize possibly contradictory objectives, such as maximizing packet delivery ratio and energy efficiency. While most literature has focused on optimizing a static objective that remains unchanged, many real-world IoT applications require adapting to rapidly shifting priorities. For example, in monitoring systems, some transmissions are time-critical and require a high priority on low latency, while other transmissions are less urgent and instead prioritize energy efficiency. To meet such dynamic demands, we propose novel dynamic and distributed routing based on multiobjective Q-learning that can adapt to changes in preferences in real-time. Our algorithm builds on ideas from both multi-objective optimization and Q-learning. We also propose a novel greedy interpolation policy scheme to take near-optimal decisions for unexpected preference changes. The proposed scheme can approximate and utilize the Pareto-efficient solutions for dynamic preferences, thus utilizing past knowledge to adapt to unpredictable preferences quickly during runtime. Simulation results show that the proposed scheme outperforms state-of-the-art algorithms for various exploration strategies, preference variation patterns, and important metrics like overall reward, energy efficiency, and packet delivery ratio.
- Abstract(参考訳): 過去数十年間、スマートヘルスケア監視システム、スマートシティ、環境監視など、幅広いアプリケーションのために、IoTデバイスが急速に増加するのを目撃してきた。
IoTネットワークにおける重要なタスクは、ネットワーク上で情報を検知し、送信することである。
IoTノードは環境を検知してデータを収集し、いくつかのルーティングプロトコルに従ってマルチホップ通信を介して宛先ノードにデータを送信する。
これらのプロトコルは通常、パケットの送出率とエネルギー効率の最大化など、矛盾する可能性のある目的を最適化するために設計されている。
ほとんどの文献では、変化のない静的な目的を最適化することに重点を置いているが、現実のIoTアプリケーションの多くは、急速にシフトする優先順位に適応する必要がある。
例えば、監視システムでは、一部の送信は時間クリティカルであり、低レイテンシで高い優先度を必要とするが、他の送信は緊急性が低く、エネルギー効率が優先される。
このような動的要求を満たすために,マルチオブジェクトQ-ラーニングに基づく動的分散ルーティングを提案する。
提案アルゴリズムは多目的最適化とQラーニングの両方のアイデアに基づいている。
また、予期しない嗜好の変化に対して、ほぼ最適な決定を下すための新しい欲求補間スキームを提案する。
提案手法は動的選好に対してパレート効率のよい解を近似して利用することができ、過去の知識を利用して実行時に予測不可能な選好に迅速に適応することができる。
シミュレーションの結果,提案手法は,様々な探索戦略,嗜好変動パターン,および全体報酬,エネルギー効率,パケット配信率といった重要な指標に対して,最先端のアルゴリズムよりも優れていた。
関連論文リスト
- Adaptive routing protocols for determining optimal paths in AI multi-agent systems: a priority- and learning-enhanced approach [0.0]
本稿では,AIマルチエージェントネットワークに適した拡張適応ルーティングを提案する。
タスク複雑性,ユーザ要求優先度,エージェント能力,帯域幅,レイテンシ,負荷,モデル高度化,信頼性などの多面的パラメータを組み込んだ。
論文 参考訳(メタデータ) (2025-03-10T13:16:54Z) - DRL Optimization Trajectory Generation via Wireless Network Intent-Guided Diffusion Models for Optimizing Resource Allocation [58.62766376631344]
本稿では、無線通信ネットワークの異なる状態変化に対応するために、カスタマイズされた無線ネットワークインテント(WNI-G)モデルを提案する。
大規模シミュレーションにより、動的通信システムにおけるスペクトル効率と従来のDRLモデルの変動の安定性が向上する。
論文 参考訳(メタデータ) (2024-10-18T14:04:38Z) - Improved Q-learning based Multi-hop Routing for UAV-Assisted Communication [4.799822253865053]
本稿では,Q-Learning-based Multi-hop Routing (IQMR) アルゴリズムを提案する。
ルーティング決定にQ(lambda)学習を用いることで、IQMRはエネルギー効率とネットワークデータのスループットを大幅に向上する。
論文 参考訳(メタデータ) (2024-08-17T06:24:31Z) - Generalized Multi-Objective Reinforcement Learning with Envelope Updates in URLLC-enabled Vehicular Networks [12.323383132739195]
我々は,無線ネットワークの選択と自律運転ポリシーを協調的に最適化する,新しい多目的強化学習フレームワークを開発した。
提案フレームワークは,車両の運動力学を制御することにより,交通流の最大化と衝突の最小化を目的としている。
提案されたポリシーにより、自動運転車は、接続性を改善した安全な運転行動を採用することができる。
論文 参考訳(メタデータ) (2024-05-18T16:31:32Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Multi-objective Deep Reinforcement Learning for Mobile Edge Computing [11.966938107719903]
モバイルエッジコンピューティング(MEC)は、遅延やエネルギー消費など、さまざまなパフォーマンス指標を優先する次世代のモバイルネットワークアプリケーションに不可欠である。
本研究では,複数のエッジを持つMECにおいて,長期エネルギー消費と送信遅延を最小限に抑えるために,多目的オフロード問題を定式化する。
我々は,MECシステムにおいて,複数のエッジの機能を構築するためのよく設計された状態符号化手法を導入し,遅延とエネルギー消費のユーティリティを正確に計算する洗練された報酬関数を提案する。
論文 参考訳(メタデータ) (2023-07-05T16:36:42Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Data-Driven Random Access Optimization in Multi-Cell IoT Networks with
NOMA [78.60275748518589]
非直交多重アクセス(NOMA)は、5Gネットワーク以降で大規模なマシンタイプ通信(mMTC)を可能にする重要な技術です。
本稿では,高密度空間分散マルチセル無線IoTネットワークにおけるランダムアクセス効率向上のために,NOMAを適用した。
ユーザ期待容量の幾何学的平均を最大化するために,各IoTデバイスの伝送確率を調整したランダムチャネルアクセス管理の新たな定式化を提案する。
論文 参考訳(メタデータ) (2021-01-02T15:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。