論文の概要: ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions
- arxiv url: http://arxiv.org/abs/2409.10283v2
- Date: Mon, 10 Mar 2025 21:51:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:39:05.559061
- Title: ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions
- Title(参考訳): ASMA:Scene-Aware Control Barrier関数による視覚言語ドローンナビゲーションのためのアダプティブセーフティマージンアルゴリズム
- Authors: Sourav Sanyal, Kaushik Roy,
- Abstract要約: VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。
ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
- 参考スコア(独自算出の注目度): 9.645098673995317
- License:
- Abstract: In the rapidly evolving field of vision-language navigation (VLN), ensuring safety for physical agents remains an open challenge. For a human-in-the-loop language-operated drone to navigate safely, it must understand natural language commands, perceive the environment, and simultaneously avoid hazards in real time. Control Barrier Functions (CBFs) are formal methods that enforce safe operating conditions. Model Predictive Control (MPC) is an optimization framework that plans a sequence of future actions over a prediction horizon, ensuring smooth trajectory tracking while obeying constraints. In this work, we consider a VLN-operated drone platform and enhance its safety by formulating a novel scene-aware CBF that leverages ego-centric observations from a camera which has both Red-Green-Blue as well as Depth (RGB-D) channels. A CBF-less baseline system uses a Vision-Language Encoder with cross-modal attention to convert commands into an ordered sequence of landmarks. An object detection model identifies and verifies these landmarks in the captured images to generate a planned path. To further enhance safety, an Adaptive Safety Margin Algorithm (ASMA) is proposed. ASMA tracks moving objects and performs scene-aware CBF evaluation on-the-fly, which serves as an additional constraint within the MPC framework. By continuously identifying potentially risky observations, the system performs prediction in real time about unsafe conditions and proactively adjusts its control actions to maintain safe navigation throughout the trajectory. Deployed on a Parrot Bebop2 quadrotor in the Gazebo environment using the Robot Operating System (ROS), ASMA achieves 64%-67% increase in success rates with only a slight increase (1.4%-5.8%) in trajectory lengths compared to the baseline CBF-less VLN.
- Abstract(参考訳): 視覚言語ナビゲーション(VLN)の分野では、物理エージェントの安全性を確保することはオープンな課題である。
人間の言語操作型ドローンが安全にナビゲートするには、自然言語コマンドを理解し、環境を認識し、同時に危険をリアルタイムに回避する必要がある。
制御バリア関数(CBF)は、安全な動作条件を強制する形式的な方法である。
Model Predictive Control (MPC) は、予測地平線上で将来の行動のシーケンスを計画し、制約に従ってスムーズな軌道追跡を保証する最適化フレームワークである。
本研究では,VLNが運用するドローンプラットフォームについて検討し,レッドグリーンブルーとディープス(RGB-D)チャネルを持つカメラからのエゴ中心の観察を生かした新しいシーン認識CBFを定式化することによって,安全性を高める。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モード横断の注意を持つビジョンランゲージエンコーダを使用する。
オブジェクト検出モデルは、キャプチャされた画像中のこれらのランドマークを特定し、検証し、計画されたパスを生成する。
安全性をさらに高めるため、適応安全マージンアルゴリズム(ASMA)を提案する。
ASMAは移動物体を追跡し、MPCフレームワーク内の追加制約として機能するシーン認識CBF評価をオンザフライで行う。
リスクのある観測を継続的に特定することにより、システムは安全でない条件についてリアルタイムで予測を行い、その制御動作を積極的に調整し、軌道全体にわたって安全なナビゲーションを維持する。
ロボット・オペレーティング・システム(ROS)を用いたガゼボの環境におけるParrot Bebop2四極子上に展開されたASMAは、CBFレスVLNに比べて軌道長がわずかに増加し(1.4%-5.8%)、成功率が64%-67%向上した。
関連論文リスト
- Low-altitude Friendly-Jamming for Satellite-Maritime Communications via Generative AI-enabled Deep Reinforcement Learning [72.72954660774002]
低地球軌道(LEO)衛星は、海上無線通信で広範囲にわたるデータ通信を支援するために使用できる。
LEO衛星を広範囲にカバーし、チャネルの開放性と組み合わせることで、通信プロセスはセキュリティ上のリスクに悩まされる可能性がある。
本稿では無人航空機による低高度衛星通信システムLEOについて述べる。
論文 参考訳(メタデータ) (2025-01-26T10:13:51Z) - One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.103090762559708]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。
我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。
提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文 参考訳(メタデータ) (2024-12-13T09:21:02Z) - A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Towards Building Secure UAV Navigation with FHE-aware Knowledge Distillation [0.0]
本稿では,セキュアなUAVナビゲーションの実現性を高めるため,知識蒸留を活用した革新的なアプローチを提案する。
RLとFHEを統合することで、我々のフレームワークは、暗号化されたUAVカメラフィードのリアルタイム処理を可能にしながら、敵攻撃に対する脆弱性に対処する。
FHEのレイテンシを軽減するために、知識蒸留を用いてネットワークを圧縮し、性能を損なうことなく18倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2024-11-01T07:04:24Z) - Long-Range Vision-Based UAV-assisted Localization for Unmanned Surface Vehicles [7.384309568198598]
地球測位システム (GPS) は海洋環境下での無人表面車両 (USV) によるフィールド操作に必須のナビゲーション手法となっている。
GPSは、自然の干渉や悪意のある妨害攻撃に弱いため、必ずしも屋外で利用できるとは限らない。
本研究では,無人航空機(UAV)を用いて,制限された海洋環境下でのUSVのローカライズを支援する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-21T08:37:37Z) - Secure Navigation using Landmark-based Localization in a GPS-denied
Environment [1.19658449368018]
本稿では,ランドマークに基づくローカライゼーション(LanBLoc)と拡張カルマンフィルタ(EKF)を統合した新たなフレームワークを提案する。
本稿では,障害物や危険のない経路を移動する物体を誘導する2つのアプローチについて,シミュレーションした戦場シナリオを提案する。
論文 参考訳(メタデータ) (2024-02-22T04:41:56Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Segmentation of Drone Collision Hazards in Airborne RADAR Point Clouds
Using PointNet [0.7067443325368975]
統合のための重要な前提条件は、安全な運用を確保するために、状況認識を増強したUAVを装備することである。
本研究は,複数の衝突リスクを同時に識別するために,レーダ技術を活用した航空点雲のエンドツーエンドセマンティックセマンティックセマンティックセグメンテーションを実現する。
我々の知る限り、これは空中における複数の衝突脅威の同時識別に対処する最初のアプローチであり、94%の精度を達成する。
論文 参考訳(メタデータ) (2023-11-06T16:04:58Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。