論文の概要: Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection
- arxiv url: http://arxiv.org/abs/2509.13934v2
- Date: Fri, 19 Sep 2025 19:47:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 12:27:33.489688
- Title: Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection
- Title(参考訳): UAVデータ収集のための大規模言語モデル駆動型決定変換器
- Authors: Zhixion Chen, Jiangzhou Wang, Hyundong Shin, Arumugam Nallanathan,
- Abstract要約: 空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。
有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。
LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
- 参考スコア(独自算出の注目度): 71.84636717632206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The deployment of unmanned aerial vehicles (UAVs) for reliable and energy-efficient data collection from spatially distributed devices holds great promise in supporting diverse Internet of Things (IoT) applications. Nevertheless, the limited endurance and communication range of UAVs necessitate intelligent trajectory planning. While reinforcement learning (RL) has been extensively explored for UAV trajectory optimization, its interactive nature entails high costs and risks in real-world environments. Offline RL mitigates these issues but remains susceptible to unstable training and heavily rely on expert-quality datasets. To address these challenges, we formulate a joint UAV trajectory planning and resource allocation problem to maximize energy efficiency of data collection. The resource allocation subproblem is first transformed into an equivalent linear programming formulation and solved optimally with polynomial-time complexity. Then, we propose a large language model (LLM)-empowered critic-regularized decision transformer (DT) framework, termed LLM-CRDT, to learn effective UAV control policies. In LLM-CRDT, we incorporate critic networks to regularize the DT model training, thereby integrating the sequence modeling capabilities of DT with critic-based value guidance to enable learning effective policies from suboptimal datasets. Furthermore, to mitigate the data-hungry nature of transformer models, we employ a pre-trained LLM as the transformer backbone of the DT model and adopt a parameter-efficient fine-tuning strategy, i.e., LoRA, enabling rapid adaptation to UAV control tasks with small-scale dataset and low computational overhead. Extensive simulations demonstrate that LLM-CRDT outperforms benchmark online and offline RL methods, achieving up to 36.7\% higher energy efficiency than the current state-of-the-art DT approaches.
- Abstract(参考訳): 空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)の配備は、さまざまなモノのインターネット(IoT)アプリケーションをサポートする上で大きな約束である。
それでも、UAVの耐久性と通信範囲は限られており、インテリジェントな軌道計画が必要である。
強化学習(RL)は、UAV軌道最適化のために広く研究されているが、そのインタラクティブな性質は、現実世界の環境において高いコストとリスクを伴っている。
オフラインRLはこれらの問題を緩和するが、不安定なトレーニングの影響を受けにくく、専門家品質のデータセットに大きく依存している。
これらの課題に対処するため、データ収集のエネルギー効率を最大化するために、共同UAV軌道計画と資源配分問題を定式化する。
リソース割り当てサブプロブレムは、まず等価な線形プログラミングの定式化に変換され、多項式時間複雑性で最適に解かれる。
そこで我々は,LLM-CRDT と呼ばれる大規模言語モデル (LLM) を用いた批判正規化決定変換器 (DT) フレームワークを提案する。
LLM-CRDTでは,DTモデルトレーニングの正規化に批判ネットワークを組み込んで,DTのシーケンスモデリング機能と批判に基づく価値ガイダンスを統合して,最適なデータセットから効果的なポリシを学習する。
さらに、トランスモデルのデータ・ハングリー性を軽減するため、DTモデルのトランスフォーマーバックボーンとして事前訓練されたLCMを用い、パラメータ効率の良い微調整戦略、すなわちLoRAを採用し、小規模データセットと計算オーバーヘッドの少ないUAV制御タスクへの迅速な適応を可能にした。
大規模なシミュレーションにより、LLM-CRDTはオンラインおよびオフラインのRL法よりも優れた性能を示し、現在の最先端DT法よりも最大36.7%のエネルギー効率を実現している。
関連論文リスト
- LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Age of Information Minimization in UAV-Enabled Integrated Sensing and Communication Systems [34.92822911897626]
統合センシング通信(ISAC)機能を備えた無人航空機(UAV)は、将来の無線ネットワークにおいて重要な役割を果たすと想定されている。
ターゲットセンシングとマルチユーザ通信を同時に行う老化情報(AoI)システムを提案する。
論文 参考訳(メタデータ) (2025-07-18T18:17:09Z) - Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - Diffusion Models for Smarter UAVs: Decision-Making and Modeling [15.093742222365156]
無人航空機(UAV)は、現代の通信ネットワークにおいてますます採用されている。
しかし、意思決定とデジタルモデリングの課題は、その急速な進歩を妨げ続けている。
本稿では,これらの課題を効果的に解決するために,DMとRL,DTの統合について検討する。
論文 参考訳(メタデータ) (2025-01-10T09:59:16Z) - Solving Continual Offline Reinforcement Learning with Decision Transformer [78.59473797783673]
連続的オフライン強化学習(CORL)は、連続的およびオフライン的な強化学習を組み合わせたものである。
Actor-Critic構造とエクスペリエンス・リプレイ(ER)を取り入れた既存の手法は、分散シフト、低効率、知識共有の弱さに悩まされている。
我々は,マルチヘッドDT (MH-DT) とローランク適応DT (LoRA-DT) を導入し,DTの無視問題を緩和する。
論文 参考訳(メタデータ) (2024-01-16T16:28:32Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Q-learning Decision Transformer: Leveraging Dynamic Programming for
Conditional Sequence Modelling in Offline RL [0.0]
決定変換器(DT)は条件付きポリシーアプローチと変圧器アーキテクチャを組み合わせたものである。
DTには縫合能力がない -- オフラインのRLが最適なポリシを学ぶ上で重要な能力の1つだ。
DTの欠点に対処するQ-learning Decision Transformer (QDT)を提案する。
論文 参考訳(メタデータ) (2022-09-08T18:26:39Z) - Model-aided Deep Reinforcement Learning for Sample-efficient UAV
Trajectory Design in IoT Networks [20.303937220315177]
飛行時間制限されたUAVをデータハーベスティングミッションに導くためのモデル支援型深層Q-ラーニング手法を提案する。
標準DRL手法と比較して,提案手法では,同一データ収集性能に到達するためには,少なくとも1桁のトレーニングデータサンプルを必要とする。
論文 参考訳(メタデータ) (2021-04-21T08:25:11Z) - Multi-UAV Path Planning for Wireless Data Harvesting with Deep
Reinforcement Learning [18.266087952180733]
本稿では,データ収集ミッションを定義するシナリオパラメータの深い変化に適応できるマルチエージェント強化学習(MARL)手法を提案する。
提案するネットワークアーキテクチャにより,データ収集タスクを慎重に分割することで,エージェントが効果的に協調できることを示す。
論文 参考訳(メタデータ) (2020-10-23T14:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。