論文の概要: ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions
- arxiv url: http://arxiv.org/abs/2409.10283v3
- Date: Sat, 07 Jun 2025 18:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:09.007831
- Title: ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions
- Title(参考訳): ASMA:Scene-Aware Control Barrier関数による視覚言語ドローンナビゲーションのためのアダプティブセーフティマージンアルゴリズム
- Authors: Sourav Sanyal, Kaushik Roy,
- Abstract要約: VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。
ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
- 参考スコア(独自算出の注目度): 9.645098673995317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the rapidly evolving field of vision-language navigation (VLN), ensuring safety for physical agents remains an open challenge. For a human-in-the-loop language-operated drone to navigate safely, it must understand natural language commands, perceive the environment, and simultaneously avoid hazards in real time. Control Barrier Functions (CBFs) are formal methods that enforce safe operating conditions. Model Predictive Control (MPC) is an optimization framework that plans a sequence of future actions over a prediction horizon, ensuring smooth trajectory tracking while obeying constraints. In this work, we consider a VLN-operated drone platform and enhance its safety by formulating a novel scene-aware CBF that leverages ego-centric observations from a camera which has both Red-Green-Blue as well as Depth (RGB-D) channels. A CBF-less baseline system uses a Vision-Language Encoder with cross-modal attention to convert commands into an ordered sequence of landmarks. An object detection model identifies and verifies these landmarks in the captured images to generate a planned path. To further enhance safety, an Adaptive Safety Margin Algorithm (ASMA) is proposed. ASMA tracks moving objects and performs scene-aware CBF evaluation on-the-fly, which serves as an additional constraint within the MPC framework. By continuously identifying potentially risky observations, the system performs prediction in real time about unsafe conditions and proactively adjusts its control actions to maintain safe navigation throughout the trajectory. Deployed on a Parrot Bebop2 quadrotor in the Gazebo environment using the Robot Operating System (ROS), ASMA achieves 64%-67% increase in success rates with only a slight increase (1.4%-5.8%) in trajectory lengths compared to the baseline CBF-less VLN.
- Abstract(参考訳): 視覚言語ナビゲーション(VLN)の分野では、物理エージェントの安全性を確保することはオープンな課題である。
人間の言語操作型ドローンが安全にナビゲートするには、自然言語コマンドを理解し、環境を認識し、同時に危険をリアルタイムに回避する必要がある。
制御バリア関数(CBF)は、安全な動作条件を強制する形式的な方法である。
Model Predictive Control (MPC) は、予測地平線上で将来の行動のシーケンスを計画し、制約に従ってスムーズな軌道追跡を保証する最適化フレームワークである。
本研究では,VLNが運用するドローンプラットフォームについて検討し,レッドグリーンブルーとディープス(RGB-D)チャネルを持つカメラからのエゴ中心の観察を生かした新しいシーン認識CBFを定式化することによって,安全性を高める。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モード横断の注意を持つビジョンランゲージエンコーダを使用する。
オブジェクト検出モデルは、キャプチャされた画像中のこれらのランドマークを特定し、検証し、計画されたパスを生成する。
安全性をさらに高めるため、適応安全マージンアルゴリズム(ASMA)を提案する。
ASMAは移動物体を追跡し、MPCフレームワーク内の追加制約として機能するシーン認識CBF評価をオンザフライで行う。
リスクのある観測を継続的に特定することにより、システムは安全でない条件についてリアルタイムで予測を行い、その制御動作を積極的に調整し、軌道全体にわたって安全なナビゲーションを維持する。
ロボット・オペレーティング・システム(ROS)を用いたガゼボの環境におけるParrot Bebop2四極子上に展開されたASMAは、CBFレスVLNに比べて軌道長がわずかに増加し(1.4%-5.8%)、成功率が64%-67%向上した。
関連論文リスト
- Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.02966123945644]
本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文 参考訳(メタデータ) (2025-04-30T13:47:25Z) - Soft Actor-Critic-based Control Barrier Adaptation for Robust Autonomous Navigation in Unknown Environments [4.788163807490197]
制御バリア関数(CBF)の制約パラメータを実行時に適用するためのソフトアクタ・クリティカル(SAC)ベースのポリシーを提案する。
我々は,本フレームワークがCBF制約を効果的に適用し,ロボットが安全性を損なうことなく最終目標に達することを実証した。
論文 参考訳(メタデータ) (2025-03-11T14:33:55Z) - One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments [10.103090762559708]
観測条件付き到達可能性に基づく安全フィルタ(OCR)フレームワークを提案する。
我々のキーとなるアイデアは、新しい障害領域に対する最適制御理論安全値関数を予測するOCR値ネットワーク(OCR-VN)を使用することです。
提案手法は,多種多様な階層型二次制御系を自動で保護できることを実証する。
論文 参考訳(メタデータ) (2024-12-13T09:21:02Z) - A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Defining and Evaluating Physical Safety for Large Language Models [62.4971588282174]
大型言語モデル (LLM) は、ドローンのようなロボットシステムを制御するためにますます使われている。
現実世界のアプリケーションに物理的な脅威や害をもたらすリスクは、まだ解明されていない。
我々は,ドローンの物理的安全性リスクを,(1)目標脅威,(2)目標脅威,(3)インフラ攻撃,(4)規制違反の4つのカテゴリに分類する。
論文 参考訳(メタデータ) (2024-11-04T17:41:25Z) - Towards Building Secure UAV Navigation with FHE-aware Knowledge Distillation [0.0]
本稿では,セキュアなUAVナビゲーションの実現性を高めるため,知識蒸留を活用した革新的なアプローチを提案する。
RLとFHEを統合することで、我々のフレームワークは、暗号化されたUAVカメラフィードのリアルタイム処理を可能にしながら、敵攻撃に対する脆弱性に対処する。
FHEのレイテンシを軽減するために、知識蒸留を用いてネットワークを圧縮し、性能を損なうことなく18倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2024-11-01T07:04:24Z) - Long-Range Vision-Based UAV-assisted Localization for Unmanned Surface Vehicles [7.384309568198598]
地球測位システム (GPS) は海洋環境下での無人表面車両 (USV) によるフィールド操作に必須のナビゲーション手法となっている。
GPSは、自然の干渉や悪意のある妨害攻撃に弱いため、必ずしも屋外で利用できるとは限らない。
本研究では,無人航空機(UAV)を用いて,制限された海洋環境下でのUSVのローカライズを支援する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-21T08:37:37Z) - Secure Navigation using Landmark-based Localization in a GPS-denied
Environment [1.19658449368018]
本稿では,ランドマークに基づくローカライゼーション(LanBLoc)と拡張カルマンフィルタ(EKF)を統合した新たなフレームワークを提案する。
本稿では,障害物や危険のない経路を移動する物体を誘導する2つのアプローチについて,シミュレーションした戦場シナリオを提案する。
論文 参考訳(メタデータ) (2024-02-22T04:41:56Z) - Angle Robustness Unmanned Aerial Vehicle Navigation in GNSS-Denied
Scenarios [66.05091704671503]
本稿では、ポイントツーポイントナビゲーションタスクにおける飛行偏差に対処する新しい角度ナビゲーションパラダイムを提案する。
また、Adaptive Feature Enhance Module、Cross-knowledge Attention-guided Module、Robust Task-oriented Head Moduleを含むモデルを提案する。
論文 参考訳(メタデータ) (2024-02-04T08:41:20Z) - Segmentation of Drone Collision Hazards in Airborne RADAR Point Clouds
Using PointNet [0.7067443325368975]
統合のための重要な前提条件は、安全な運用を確保するために、状況認識を増強したUAVを装備することである。
本研究は,複数の衝突リスクを同時に識別するために,レーダ技術を活用した航空点雲のエンドツーエンドセマンティックセマンティックセマンティックセグメンテーションを実現する。
我々の知る限り、これは空中における複数の衝突脅威の同時識別に対処する最初のアプローチであり、94%の精度を達成する。
論文 参考訳(メタデータ) (2023-11-06T16:04:58Z) - Runtime Stealthy Perception Attacks against DNN-based Adaptive Cruise Control Systems [8.561553195784017]
本稿では,実行時認識攻撃下での深層ニューラルネットワークを用いたACCシステムのセキュリティ評価を行う。
攻撃を誘発する最も重要な時間を選択するための文脈認識戦略を提案する。
提案攻撃の有効性を,実車,公用運転データセット,現実的なシミュレーションプラットフォームを用いて評価した。
論文 参考訳(メタデータ) (2023-07-18T03:12:03Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - Obstacle Avoidance for UAS in Continuous Action Space Using Deep
Reinforcement Learning [9.891207216312937]
小型無人航空機の障害物回避は将来の都市空輸の安全に不可欠である。
本稿では, PPO(Proximal Policy Optimization)に基づく深層強化学習アルゴリズムを提案する。
その結果,提案モデルが正確かつ堅牢なガイダンスを提供し,99%以上の成功率で競合を解消できることが示唆された。
論文 参考訳(メタデータ) (2021-11-13T04:44:53Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。