論文の概要: Hallucination-Aware Generative Pretrained Transformer for Cooperative Aerial Mobility Control
- arxiv url: http://arxiv.org/abs/2504.10831v1
- Date: Tue, 15 Apr 2025 03:21:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:07:03.714168
- Title: Hallucination-Aware Generative Pretrained Transformer for Cooperative Aerial Mobility Control
- Title(参考訳): 協調空気移動制御のためのハロシン化対応事前学習型変圧器
- Authors: Hyojun Ahn, Seungcheol Oh, Gyu Seon Kim, Soyi Jung, Soohyun Park, Joongheon Kim,
- Abstract要約: 本稿では、GPT(Generative Pretrained Transformer)と強化学習(RL)を統合したSafeGPTを提案する。
提案した設計では,Global GPTモジュールがセクター割り当てなどのハイレベルなタスクを割り当て,On-Device GPTがリアルタイムなローカルルート計画を管理する。
RLベースの安全フィルタは、各GPT判定を監視し、バッテリの枯渇や重複する訪問につながる可能性のある安全でないアクションをオーバーライドし、幻覚を効果的に緩和する。
- 参考スコア(独自算出の注目度): 8.700601831949099
- License:
- Abstract: This paper proposes SafeGPT, a two-tiered framework that integrates generative pretrained transformers (GPTs) with reinforcement learning (RL) for efficient and reliable unmanned aerial vehicle (UAV) last-mile deliveries. In the proposed design, a Global GPT module assigns high-level tasks such as sector allocation, while an On-Device GPT manages real-time local route planning. An RL-based safety filter monitors each GPT decision and overrides unsafe actions that could lead to battery depletion or duplicate visits, effectively mitigating hallucinations. Furthermore, a dual replay buffer mechanism helps both the GPT modules and the RL agent refine their strategies over time. Simulation results demonstrate that SafeGPT achieves higher delivery success rates compared to a GPT-only baseline, while substantially reducing battery consumption and travel distance. These findings validate the efficacy of combining GPT-based semantic reasoning with formal safety guarantees, contributing a viable solution for robust and energy-efficient UAV logistics.
- Abstract(参考訳): 本稿では,GPT(Generative Pretrained Transformer)と強化学習(Regress Learning, RL)を統合し,効率よく信頼性の高い無人航空機(UAV)のラストマイル配送を実現する2層フレームワークであるSafeGPTを提案する。
提案した設計では,Global GPTモジュールがセクター割り当てなどのハイレベルなタスクを割り当て,On-Device GPTがリアルタイムなローカルルート計画を管理する。
RLベースの安全フィルタは、各GPT判定を監視し、バッテリの枯渇や重複する訪問につながる可能性のある安全でないアクションをオーバーライドし、幻覚を効果的に緩和する。
さらに、デュアルリプレイバッファ機構は、GPTモジュールとRLエージェントの両方が時間とともに戦略を洗練するのに役立つ。
シミュレーションの結果,SafeGPTはGPTのみのベースラインよりも高い納品率を実現し,バッテリ消費と走行距離を大幅に削減した。
これらの結果は,GPTに基づくセマンティック推論と形式的安全保証を組み合わせることの有効性を検証し,ロバストでエネルギー効率のよいUAVロジスティクスの実現に寄与している。
関連論文リスト
- Gated Slot Attention for Efficient Linear-Time Sequence Modeling [59.019501274074564]
Gated Slot Attention(GSA)は境界メモリ・コントロル(ABC)による注意を高める
GSAはGated Linear Attention (GLA)にインスパイアされたゲーティング機構を組み込んでいる
論文 参考訳(メタデータ) (2024-09-11T09:49:50Z) - RL-Based Cargo-UAV Trajectory Planning and Cell Association for Minimum
Handoffs, Disconnectivity, and Energy Consumption [23.734853912297634]
無人航空機(UAV)は、ラストマイル貨物輸送のための有望な技術である。
既存の携帯電話ネットワークは、主に地上ユーザー向けに設計された。
本稿では, 共同貨物・UAV軌道計画とセルアソシエーションのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-05T04:06:09Z) - UAV Swarm-enabled Collaborative Secure Relay Communications with
Time-domain Colluding Eavesdropper [115.56455278813756]
航空中継機としての無人航空機(UAV)は、インターネットモノ(IoT)ネットワークの補助として事実上魅力的である。
本研究では,UAV基地局と端末端末装置間のセキュアな通信を支援するために,UAVを活用することを目的とする。
論文 参考訳(メタデータ) (2023-10-03T11:47:01Z) - Energy Management of Multi-mode Plug-in Hybrid Electric Vehicle using
Multi-agent Deep Reinforcement Learning [6.519522573636577]
多モードプラグインハイブリッド電気自動車(PHEV)技術は、脱炭に寄与する経路の1つである。
本稿では,多モードPHEVのエネルギー管理のためのマルチエージェント深部強化学習(MADRL)制御法について検討する。
統合DDPG設定と0.2の関連性比を用いて、MADRLシステムはシングルエージェント学習システムと比較して最大4%のエネルギーを節約でき、従来のルールベースシステムに比べて最大23.54%のエネルギーを節約できる。
論文 参考訳(メタデータ) (2023-03-16T21:31:55Z) - Robustness of a universal gate set implementation in transmon systems
via Chopped Random Basis optimal control [50.591267188664666]
CNOT, Hadamard, phase と $pi/8$ gates から構成される汎用2量子ゲートセットのトランスモン系システムに対する実装を数値解析的に検討する。
このようなゲートを実装するための制御信号は、目標ゲート不忠実度が10-2$のチョッペランダムバス最適制御技術を用いて得られる。
論文 参考訳(メタデータ) (2022-07-27T10:55:15Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z) - BEV-SGD: Best Effort Voting SGD for Analog Aggregation Based Federated
Learning against Byzantine Attackers [32.14738452396869]
本稿では,既存のFLOA文献で広く用いられているチャネル反転(CI)電力制御機構を解析する。
我々は、勾配降下(SGD)と統合されたBEV(Best effort voting)電力制御政策と呼ばれる新しい防衛方式を提案する。
私たちのBEV-SGDは、すべての労働者が最大送信電力でローカル更新を送信できるようにすることで、FLOAのビザンチン攻撃に対する堅牢性を改善します。
論文 参考訳(メタデータ) (2021-10-18T23:55:13Z) - A Unified Off-Policy Evaluation Approach for General Value Function [131.45028999325797]
一般価値関数(GVF)は、強化学習(RL)における予測的知識と振り返り的知識の両方を表現する強力なツールである。
本稿では,GVF評価のためのGenTDと呼ばれる新しいアルゴリズムを提案する。
我々は、GenTDが単一の標準スカラー値関数と同じくらい効率的に複数の相互関連多次元GVFを学習することを示す。
論文 参考訳(メタデータ) (2021-07-06T16:20:34Z) - Transfer Deep Reinforcement Learning-enabled Energy Management Strategy
for Hybrid Tracked Vehicle [8.327437591702163]
本稿では、深部強化学習(DRL)と伝達学習(TL)を組み合わせたハイブリッド電気自動車の適応エネルギー管理戦略を提案する。
退屈なトレーニング時間でDRLの欠陥に対処することを目的としている。
DRLおよびTL対応制御ポリシは、エネルギー効率を向上し、システム性能を向上させることができる。
論文 参考訳(メタデータ) (2020-07-16T23:39:34Z) - Federated Learning in the Sky: Joint Power Allocation and Scheduling
with UAV Swarms [98.78553146823829]
無人航空機(UAV)は様々なタスクを実行するために機械学習(ML)を利用する必要がある。
本稿では,UAVスワム内に分散学習(FL)アルゴリズムを実装するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T14:04:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。