論文の概要: Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization
- arxiv url: http://arxiv.org/abs/2510.10028v1
- Date: Sat, 11 Oct 2025 05:11:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.74319
- Title: Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization
- Title(参考訳): LLM最適化によるUAV対応低高度経済ネットワークの効率的な車載ビジョンランゲージ推定
- Authors: Yang Li, Ruichen Zhang, Yinqiu Liu, Guangyuan Liu, Dusit Niyato, Abbas Jamalipour, Xianbin Wang, Dong In Kim,
- Abstract要約: 低高度経済ネットワーク(LAENets)は、航空監視、環境検知、セマンティックデータ収集など、様々な応用を可能にしている。
オンボードビジョン(VLM)は、リアルタイムな推論を提供するが、オンボードの動的ネットワーク条件は限られている。
動的LEENet条件下での通信効率を向上させるUAV対応LEENetシステムを提案する。
- 参考スコア(独自算出の注目度): 61.55616421408666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid advancement of Low-Altitude Economy Networks (LAENets) has enabled a variety of applications, including aerial surveillance, environmental sensing, and semantic data collection. To support these scenarios, unmanned aerial vehicles (UAVs) equipped with onboard vision-language models (VLMs) offer a promising solution for real-time multimodal inference. However, ensuring both inference accuracy and communication efficiency remains a significant challenge due to limited onboard resources and dynamic network conditions. In this paper, we first propose a UAV-enabled LAENet system model that jointly captures UAV mobility, user-UAV communication, and the onboard visual question answering (VQA) pipeline. Based on this model, we formulate a mixed-integer non-convex optimization problem to minimize task latency and power consumption under user-specific accuracy constraints. To solve the problem, we design a hierarchical optimization framework composed of two parts: (i) an Alternating Resolution and Power Optimization (ARPO) algorithm for resource allocation under accuracy constraints, and (ii) a Large Language Model-augmented Reinforcement Learning Approach (LLaRA) for adaptive UAV trajectory optimization. The large language model (LLM) serves as an expert in refining reward design of reinforcement learning in an offline fashion, introducing no additional latency in real-time decision-making. Numerical results demonstrate the efficacy of our proposed framework in improving inference performance and communication efficiency under dynamic LAENet conditions.
- Abstract(参考訳): 低高度経済ネットワーク(LAENets)の急速な進歩により、航空監視、環境検知、セマンティックデータ収集など、様々な応用が可能になった。
これらのシナリオをサポートするために、搭載された視覚言語モデル(VLM)を備えた無人航空機(UAV)は、リアルタイムマルチモーダル推論のための有望なソリューションを提供する。
しかしながら、推論精度と通信効率の両立は、オンボードリソースや動的ネットワーク条件が限られているため、依然として大きな課題である。
本稿では、UAVモビリティ、ユーザ-UAV通信、およびVQAパイプラインを共同でキャプチャするUAV対応LEENetシステムモデルを提案する。
このモデルに基づいて、ユーザ固有の精度制約下でのタスク遅延と消費電力を最小限に抑えるために、混合整数非凸最適化問題を定式化する。
この問題を解決するために、2つの部分からなる階層的最適化フレームワークを設計する。
一 精度制約下での資源配分のための代替分解能・電力最適化(ARPO)アルゴリズム
(II) 適応型UAV軌道最適化のための大規模言語モデル強化強化学習手法(LLaRA)。
大規模言語モデル(LLM)は、強化学習の報酬設計をオフラインで精錬する専門家として機能し、リアルタイム意思決定に追加のレイテンシを導入しない。
LAENetの動的条件下での推論性能と通信効率を向上させるための提案手法の有効性を数値解析により実証した。
関連論文リスト
- Latency-aware Multimodal Federated Learning over UAV Networks [5.942882029411925]
本稿では,無人航空機(UAV)が補助するマルチモーダル学習(FML)について,システム遅延の最小化に着目して検討する。
このフレームワークでは、UAVはネットワーク全体に分散し、データを収集し、モデルトレーニングに参加し、グローバルモデルを構築する。
主な目的は、UAVスケジューリング、電力制御、軌道、計画、リソース割り当て、BSリソース管理を併用することで、UAVネットワークにおけるFMLシステムのレイテンシを最適化することである。
論文 参考訳(メタデータ) (2025-10-02T06:57:44Z) - Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。
有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。
LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文 参考訳(メタデータ) (2025-09-17T13:05:08Z) - Age of Information Minimization in UAV-Enabled Integrated Sensing and Communication Systems [34.92822911897626]
統合センシング通信(ISAC)機能を備えた無人航空機(UAV)は、将来の無線ネットワークにおいて重要な役割を果たすと想定されている。
ターゲットセンシングとマルチユーザ通信を同時に行う老化情報(AoI)システムを提案する。
論文 参考訳(メタデータ) (2025-07-18T18:17:09Z) - Task Delay and Energy Consumption Minimization for Low-altitude MEC via Evolutionary Multi-objective Deep Reinforcement Learning [52.64813150003228]
無人航空機や他の航空機による低高度経済(LAE)は、輸送、農業、環境監視といった分野に革命をもたらした。
今後の6世代(6G)時代において、UAV支援移動エッジコンピューティング(MEC)は特に山岳や災害に遭った地域のような困難な環境において重要である。
タスクオフロード問題は、主にタスク遅延の最小化とUAVのエネルギー消費のトレードオフに対処するUAV支援MECの重要な問題の一つである。
論文 参考訳(メタデータ) (2025-01-11T02:32:42Z) - Wireless Federated Learning over UAV-enabled Integrated Sensing and Communication [2.8203310972866382]
本稿では,無人航空機(UAV)を利用した統合型統合学習(FL)における新しい遅延最適化問題について検討する。
ベンチマーク方式と比較して,システム遅延を最大68.54%削減し,高品質な近似解を求めるため,単純かつ効率的な反復アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-01T14:25:24Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Joint User Association, Interference Cancellation and Power Control for
Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。
既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。
我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文 参考訳(メタデータ) (2023-12-08T01:57:10Z) - Distributed CNN Inference on Resource-Constrained UAVs for Surveillance
Systems: Design and Optimization [43.9909417652678]
無人航空機(UAV)は、広い地域をカバーし、困難で危険な目標地域にアクセスする能力のため、ここ数年で大きな関心を集めている。
コンピュータビジョンと機械学習の進歩により、UAVは幅広いソリューションやアプリケーションに採用されている。
ディープニューラルネットワーク(DNN)は、それらがオンボードで実行されるのを防ぐ、より深く複雑なモデルに向かって進んでいる。
論文 参考訳(メタデータ) (2021-05-23T20:19:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。