論文の概要: Bridging Network Fragmentation: A Semantic-Augmented DRL Framework for UAV-aided VANETs
- arxiv url: http://arxiv.org/abs/2603.18871v1
- Date: Thu, 19 Mar 2026 13:15:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.159632
- Title: Bridging Network Fragmentation: A Semantic-Augmented DRL Framework for UAV-aided VANETs
- Title(参考訳): ブリッジングネットワークフラグメンテーション:UAV支援VANETのためのセマンティック拡張DRLフレームワーク
- Authors: Gaoxiang Cao, Wenke Yuan, Huasen He, Yunpeng Hou, Xiaofeng Jiang, Shuangwu Chen, Jian Yang,
- Abstract要約: 無人航空機(UAV)は、接続ギャップを橋渡しするための重要な解決策として登場した。
従来のDeep Reinforcement Learning (DRL)ベースのUAVデプロイメント戦略では、道路トポロジの意味的理解が欠如している。
本稿では,ロジット・フュージョン(Logit Fusion)機構を応用したセマンティック拡張PPO(Semantic-Augmented PPO)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 19.20506139729645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vehicular Ad-hoc Networks (VANETs) are the digital cornerstone of autonomous driving, yet they suffer from severe network fragmentation in urban environments due to physical obstructions. Unmanned Aerial Vehicles (UAVs), with their high mobility, have emerged as a vital solution to bridge these connectivity gaps. However, traditional Deep Reinforcement Learning (DRL)-based UAV deployment strategies lack semantic understanding of road topology, often resulting in blind exploration and sample inefficiency. By contrast, Large Language Models (LLMs) possess powerful reasoning capabilities capable of identifying topological importance, though applying them to control tasks remains challenging. To address this, we propose the Semantic-Augmented DRL (SA-DRL) framework. Firstly, we propose a fragmentation quantification method based on Road Topology Graphs (RTG) and Dual Connected Graphs (DCG). Subsequently, we design a four-stage pipeline to transform a general-purpose LLM into a domain-specific topology expert. Finally, we propose the Semantic-Augmented PPO (SA-PPO) algorithm, which employs a Logit Fusion mechanism to inject the LLM's semantic reasoning directly into the policy as a prior, effectively guiding the agent toward critical intersections. Extensive high-fidelity simulations demonstrate that SA-PPO achieves state-of-the-art performance with remarkable efficiency, reaching baseline performance levels using only 26.6% of the training episodes. Ultimately, SA-PPO improves two key connectivity metrics by 13.2% and 23.5% over competing methods, while reducing energy consumption to just 28.2% of the baseline.
- Abstract(参考訳): Vehicular Ad-hoc Networks (VANETs) は自動運転のデジタル基盤であるが、物理的障害による都市環境のネットワークの断片化に悩まされている。
無人航空機(UAV)は高い移動性を持ち、これらの接続ギャップを埋めるための重要な解決策として浮上している。
しかし、従来のDeep Reinforcement Learning (DRL)ベースのUAVデプロイメント戦略では、道路トポロジーの意味的な理解が欠如しており、しばしば盲点探索とサンプルの非効率をもたらす。
対照的に、Large Language Models (LLM) は、トポロジ的重要性を識別できる強力な推論能力を持っているが、それらを制御タスクに適用することは難しい。
そこで我々は,Semantic-Augmented DRL (SA-DRL) フレームワークを提案する。
まず,道路トポロジグラフ(RTG)とデュアル接続グラフ(DCG)に基づく断片化定量化手法を提案する。
その後、汎用LSMをドメイン固有のトポロジーエキスパートに変換する4段階パイプラインを設計する。
最後に,ロジット・フュージョンを用いたセマンティック拡張PPO (SA-PPO) アルゴリズムを提案する。
広範囲にわたる高忠実度シミュレーションは、SA-PPOが最先端の性能を著しく向上し、トレーニングエピソードの26.6%でベースラインのパフォーマンスレベルに達することを示した。
最終的に、SA-PPOは競合する手法よりも13.2%と23.5%の2つの重要な接続指標を改善し、エネルギー消費を28.2%に減らした。
関連論文リスト
- TopoCurate:Modeling Interaction Topology for Tool-Use Agent Training [53.93696896939915]
訓練用ツール使用エージェントは一般的に、パスレート選択されたタスクに対して、軌道変更の成功と強化学習(RL)に依存している。
TopoCurateは,同一タスクから多段階的なロールアウトを統一的な意味的商トポロジに投影する対話型フレームワークである。
TopoCurateは最先端のベースラインに対して4.2%(SFT)と6.9%(RL)という一貫したゲインを達成している。
論文 参考訳(メタデータ) (2026-03-02T10:38:54Z) - Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions [51.22818149833102]
マルチエージェント強化学習(MARL)は、車間通信(C-V2X)ネットワークにおける無線リソース割り当ての有望なアプローチとして登場した。
しかし、MARLに固有の多面的課題はしばしば絡み合っており、車載環境における個々の影響を理解することは困難である。
我々は, C-V2X RRA を, 複雑さが徐々に増大する多エージェント干渉ゲーム列として定式化し, このギャップを埋める。
論文 参考訳(メタデータ) (2026-02-18T14:46:56Z) - Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception [8.774658029766988]
FlowAdaptは最適な輸送理論に基づくパラメータ効率のフレームワークである。
冗長サンプルを選択的にフィルタするWasserstein Greedy Smpling戦略を導入する。
プログレッシブ・ナレッジ・トランスファーモジュールは圧縮された初期表現を後段に注入するように設計されている。
論文 参考訳(メタデータ) (2026-02-12T04:36:50Z) - DualGazeNet: A Biologically Inspired Dual-Gaze Query Network for Salient Object Detection [52.32976488996896]
我々はDualGazeNetを紹介した。DualGazeNetは、純粋なトランスフォーマーフレームワークで、有能なオブジェクト検出を行う。
5つのRGBベンチマークの実験によると、DualGazeNetは25の最先端CNNとTransformerベースのメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-24T08:08:22Z) - Learning to Reason as Action Abstractions with Scalable Mid-Training RL [55.24192942739207]
効果的な中間訓練フェーズは、有用なアクションのコンパクトなセットを特定し、高速な選択を可能にする。
本稿では,スケーラブルなミッドトレーニングアルゴリズムであるReasoning as Action Abstractions (RA3)を提案する。
論文 参考訳(メタデータ) (2025-09-30T05:34:20Z) - Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.312659530314937]
適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。
本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。
提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文 参考訳(メタデータ) (2025-02-23T15:29:12Z) - FENet: Focusing Enhanced Network for Lane Detection [0.0]
この研究は、Focusing Smpling、Partial Field of View Evaluation、Enhanced FPN Architecture、Directional IoU Lossで拡張されたネットワークのパイオニアである。
実験では、均一なアプローチとは異なり、重要な遠隔の細部を強調しながら、集中サンプリング戦略を実証した。
今後の方向性には、道路上のデータ収集や、補完的な2つのフレームワークの統合などが含まれる。
論文 参考訳(メタデータ) (2023-12-28T17:52:09Z) - RLAD: Reinforcement Learning from Pixels for Autonomous Driving in Urban
Environments [0.716879432974126]
本稿では,都市AD領域に適用された最初のRLfP(Reinforcement Learning from Pixels)手法であるRLADを提案する。
実験の結果,RLADはNoCrashベンチマークにおいて,最先端のRLfP手法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2023-05-29T16:14:56Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。