論文の概要: FIRE-VLM: A Vision-Language-Driven Reinforcement Learning Framework for UAV Wildfire Tracking in a Physics-Grounded Fire Digital Twin
- arxiv url: http://arxiv.org/abs/2601.03449v1
- Date: Tue, 06 Jan 2026 22:31:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.674993
- Title: FIRE-VLM: A Vision-Language-Driven Reinforcement Learning Framework for UAV Wildfire Tracking in a Physics-Grounded Fire Digital Twin
- Title(参考訳): FIRE-VLM:物理界の火災デジタル双発機におけるUAVワイルドファイア追跡のための視覚言語駆動型強化学習フレームワーク
- Authors: Chris Webb, Mobin Habibpour, Mayamin Hamid Raha, Ali Reza Tavakkoli, Janice Coen, Fatemeh Afghah,
- Abstract要約: ワイルドファイア監視は、極度の視覚的劣化の下で推論できる自律システムを要求する。
Fire-VLMは、ファイア・トゥ・エンド・ビジョン・ランゲージ・モデル(VLM)ガイド付き強化学習フレームワークである。
筆者らの貢献は,(1)野火デジタル双生児構築のためのGIS-to-simulation Pipeline,(2)UAVファイアフロント追跡のためのVLM誘導RLエージェント,(3)物理用語とVLM意味論を組み合わせた山火事対応報酬設計である。
- 参考スコア(独自算出の注目度): 5.958733922398943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wildfire monitoring demands autonomous systems capable of reasoning under extreme visual degradation, rapidly evolving physical dynamics, and scarce real-world training data. Existing UAV navigation approaches rely on simplified simulators and supervised perception pipelines, and lack embodied agents interacting with physically realistic fire environments. We introduce FIRE-VLM, the first end-to-end vision-language model (VLM) guided reinforcement learning (RL) framework trained entirely within a high-fidelity, physics-grounded wildfire digital twin. Built from USGS Digital Elevation Model (DEM) terrain, LANDFIRE fuel inventories, and semi-physical fire-spread solvers, this twin captures terrain-induced runs, wind-driven acceleration, smoke plume occlusion, and dynamic fuel consumption. Within this environment, a PPO agent with dual-view UAV sensing is guided by a CLIP-style VLM. Wildfire-specific semantic alignment scores, derived from a single prompt describing active fire and smoke plumes, are integrated as potential-based reward shaping signals. Our contributions are: (1) a GIS-to-simulation pipeline for constructing wildfire digital twins; (2) a VLM-guided RL agent for UAV firefront tracking; and (3) a wildfire-aware reward design that combines physical terms with VLM semantics. Across five digital-twin evaluation tasks, our VLM-guided policy reduces time-to-detection by up to 6 times, increases time-in-FOV, and is, to our knowledge, the first RL-based UAV wildfire monitoring system demonstrated in kilometer-scale, physics-grounded digital-twin fires.
- Abstract(参考訳): ワイルドファイアの監視には、極端な視覚的劣化、急速に進化する物理力学、現実世界のトレーニングデータ不足を推論できる自律システムが必要である。
既存のUAVナビゲーションアプローチは、単純化されたシミュレータと教師付き知覚パイプラインに依存しており、物理的に現実的な火災環境と相互作用する具体的エージェントが欠如している。
FIRE-VLMは,高忠実で物理地上の野火デジタル双生児に完全に訓練された,最初のエンドツーエンドビジョン言語モデル(VLM)による強化学習(RL)フレームワークである。
USGS Digital Elevation Model (DEM) 地形、LANDFIRE燃料在庫、および半物理的消火装置から構築されたこの双子は、地形によって誘導される走行、風駆動加速度、煙管閉塞、動的燃料消費を捉えている。
この環境では、デュアルビューUAVセンシングを備えたPPOエージェントをCLIPスタイルのVLMで誘導する。
ワイルドファイア固有のセマンティックアライメントスコアは、アクティブファイアとスモークプラムを記述した単一のプロンプトから派生し、ポテンシャルに基づく報酬形成信号として統合される。
筆者らの貢献は,(1)野火デジタル双生児構築のためのGIS-to-simulation Pipeline,(2)UAVファイアフロント追跡のためのVLM誘導RLエージェント,(3)物理用語とVLM意味論を組み合わせた山火事対応報酬設計である。
5つのディジタルツイン評価タスクにおいて,VLM誘導方式により,最大6倍の時間検出が可能となり,FOVのタイム・イン・フォワードが増加し,RLをベースとした最初のUAV山火事監視システムが1km規模の物理地上のデジタルツイン火災で実証された。
関連論文リスト
- FireRescue: A UAV-Based Dataset and Enhanced YOLO Model for Object Detection in Fire Rescue Scenes [24.465732878368545]
本稿では,複数の救助シナリオをカバーする,救助コマンドのための新しいデータセット"FireRescue"を最初に構築する。
次に,FRS-YOLOと呼ばれる改良モデルを提案する。
論文 参考訳(メタデータ) (2025-12-31T04:37:51Z) - UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data [47.317955428393134]
UAV-MM3Dは,低高度UAV知覚と動作理解のための多モード合成データセットである。
様々なシーン(都市部、郊外部、森林部、沿岸部)と気象条件にまたがる400Kの同期フレームで構成されている。
各フレームは2D/3Dバウンディングボックス、6-DoFのポーズ、インスタンスレベルのアノテーションを提供し、3D検出、ポーズ推定、ターゲット追跡、短期軌道予測などのUAVに関連するコアタスクを可能にする。
論文 参考訳(メタデータ) (2025-11-27T12:30:28Z) - Trajectory Design for UAV-Based Low-Altitude Wireless Networks in Unknown Environments: A Digital Twin-Assisted TD3 Approach [62.11847362756054]
低高度無線ネットワーク(LAWN)のキーイネーブラーとして無人航空機(UAV)が登場している
我々は、デジタルツイン(DT)支援トレーニングおよびデプロイメントフレームワークを提案する。
このフレームワークでは、UAVは統合されたセンシングと通信信号を送信し、地上ユーザーに通信サービスを提供し、同時にDTサーバにアップロードされたエコーを収集して、仮想環境(VE)を段階的に構築する。
これらのVEはモデルトレーニングを加速し、展開中のリアルタイムUAVセンシングデータを継続的に更新し、意思決定をサポートし、飛行安全性を向上する。
論文 参考訳(メタデータ) (2025-10-28T10:05:53Z) - LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Towards Intelligent Transportation with Pedestrians and Vehicles In-the-Loop: A Surveillance Video-Assisted Federated Digital Twin Framework [62.47416496137193]
本稿では,歩行者や車いすによるITSを支援するための監視ビデオ支援型デジタルツイン(SV-FDT)フレームワークを提案する。
i)複数のソースからトラフィック監視ビデオを収集するエンドレイヤ、(ii)セマンティックセグメンテーションに基づく視覚理解、ツインエージェントベースのインタラクションモデリング、およびローカルデジタルツインシステム(LDTS)をローカルで作成するエッジレイヤ、(iii)異なるリージョンにわたるLDTSを統合してグローバルDTモデルをリアルタイムで構築するクラウドレイヤの3層で構成されている。
論文 参考訳(メタデータ) (2025-03-06T07:36:06Z) - BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents [56.33989853438012]
BEVWorldは,マルチモーダルセンサ入力を統一的でコンパクトなBird's Eye View潜在空間に変換し,全体的環境モデリングを行うフレームワークである。
提案する世界モデルは,多モードトークン化器と遅延BEVシーケンス拡散モデルという2つの主要成分から構成される。
論文 参考訳(メタデータ) (2024-07-08T07:26:08Z) - Hardware Acceleration for Real-Time Wildfire Detection Onboard Drone
Networks [6.313148708539912]
遠隔地や森林地帯での山火事の検出は 破壊と生態系の保全を 最小化するのに不可欠です
ドローンは、高度な撮像技術を備えた、リモートで困難な地形へのアジャイルアクセスを提供する。
限られた計算とバッテリリソースは、画像分類モデルの実装と効率的な実装に困難をもたらす。
本稿では,リアルタイム画像分類と火災分断モデルの構築を目的とする。
論文 参考訳(メタデータ) (2024-01-16T04:16:46Z) - A comprehensive survey of research towards AI-enabled unmanned aerial
systems in pre-, active-, and post-wildfire management [6.043705525669726]
森林火災は世界でも最も破壊的な自然災害の1つであり、人命と森林の野生生物に壊滅的な被害をもたらしている。
近年、無人航空機(UAV)とディープラーニングモデルの統合によって推進される山火事における人工知能(AI)の使用は、より効果的な山火事管理を実装し、開発するための前例のない勢いを生み出している。
論文 参考訳(メタデータ) (2024-01-04T05:09:35Z) - Optimal Wildfire Escape Route Planning for Drones under Dynamic Fire and
Smoke [3.9561033879611944]
無人航空機(UAV)の利用は、山火事管理の取り組みを支援する上で有望であることが示されている。
本研究は、ドローン専用に設計された最適な山火事避難経路計画システムの開発に焦点を当てる。
論文 参考訳(メタデータ) (2023-12-06T14:30:15Z) - Active Wildfires Detection and Dynamic Escape Routes Planning for Humans
through Information Fusion between Drones and Satellites [3.9561033879611944]
本稿では,アクティブな山火事検出と道路網抽出のためのUAVビジョン技術と衛星画像解析技術の融合を提案する。
火源の位置と煙と火の分断は、センチネル2衛星画像に基づいて行われる。
その結果, 動的避難経路計画アルゴリズムは, 火災発生時に人間に最適なリアルタイムナビゲーション経路を提供することができた。
論文 参考訳(メタデータ) (2023-12-06T14:25:47Z) - Federated Learning in the Sky: Joint Power Allocation and Scheduling
with UAV Swarms [98.78553146823829]
無人航空機(UAV)は様々なタスクを実行するために機械学習(ML)を利用する必要がある。
本稿では,UAVスワム内に分散学習(FL)アルゴリズムを実装するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T14:04:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。