論文の概要: VULCAN: Vision-Language-Model Enhanced Multi-Agent Cooperative Navigation for Indoor Fire-Disaster Response
- arxiv url: http://arxiv.org/abs/2604.12831v1
- Date: Tue, 14 Apr 2026 14:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.515485
- Title: VULCAN: Vision-Language-Model Enhanced Multi-Agent Cooperative Navigation for Indoor Fire-Disaster Response
- Title(参考訳): VULCAN:屋内火災対応のための多エージェント協調ナビゲーション
- Authors: Shengding Liu, Qiben Yan,
- Abstract要約: VULCANは、マルチモーダル認識と視覚言語モデルに基づくマルチエージェント協調ナビゲーションフレームワークである。
我々は,煙拡散,熱害,センサ劣化など,物理的に現実的な火災シナリオをシミュレートすることで,Habitat-Matterport3Dベンチマークを拡張した。
- 参考スコア(独自算出の注目度): 3.994114606137195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Indoor fire disasters pose severe challenges to autonomous search and rescue due to dense smoke, high temperatures, and dynamically evolving indoor environments. In such time-critical scenarios, multi-agent cooperative navigation is particularly useful, as it enables faster and broader exploration than single-agent approaches. However, existing multi-agent navigation systems are primarily vision-based and designed for benign indoor settings, leading to significant performance degradation under fire-driven dynamic conditions. In this paper, we present VULCAN, a multi-agent cooperative navigation framework based on multi-modal perception and vision-language models (VLMs), tailored for indoor fire disaster response. We extend the Habitat-Matterport3D benchmark by simulating physically realistic fire scenarios, including smoke diffusion, thermal hazards, and sensor degradation. We evaluate representative multi-agent cooperative navigation baselines under both normal and fire-driven environments. Our results reveal critical failure modes of existing methods in fire scenarios and underscore the necessity of robust perception and hazard-aware planning for reliable multi-agent search and rescue.
- Abstract(参考訳): 屋内火災は、密煙、高温、動的に進化する屋内環境により、自律的な捜索と救助に深刻な課題をもたらす。
このような時間クリティカルなシナリオでは、単一エージェントアプローチよりも高速で広範な探索を可能にするため、マルチエージェント協調ナビゲーションが特に有用である。
しかし、既存のマルチエージェントナビゲーションシステムは、主に視覚ベースであり、室内環境の良質な設定のために設計されており、火力駆動による動的条件下での大幅な性能低下につながっている。
本稿では,屋内火災対応に適したマルチモーダル認識と視覚言語モデル(VLM)に基づくマルチエージェント協調ナビゲーションフレームワークであるVULCANを提案する。
我々は,煙拡散,熱害,センサ劣化など,物理的に現実的な火災シナリオをシミュレートすることで,Habitat-Matterport3Dベンチマークを拡張した。
常用および消火環境下での代表的な多エージェント協調ナビゲーションベースラインの評価を行った。
本研究は,火災シナリオにおける既存手法の致命的な障害モードを明らかにし,信頼性の高い多エージェント探索・救助のための堅牢な認識とハザード対応計画の必要性を浮き彫りにした。
関連論文リスト
- Digital Twin and Agentic AI for Wild Fire Disaster Management: Intelligent Virtual Situation Room [1.4323566945483497]
森林火災の頻度と強度は、2030年までに約14%増加し、2050年までに30%増加すると予測されている。
従来の災害管理フレームワークは静的シミュレーションと受動的データ取得に依存している。
本稿では、自律型AIエージェントによって強化された双方向デジタルツイン(DT)プラットフォームである、Intelligent Virtual situation Room (IVSR)を紹介する。
論文 参考訳(メタデータ) (2026-02-09T17:44:52Z) - FireRescue: A UAV-Based Dataset and Enhanced YOLO Model for Object Detection in Fire Rescue Scenes [24.465732878368545]
本稿では,複数の救助シナリオをカバーする,救助コマンドのための新しいデータセット"FireRescue"を最初に構築する。
次に,FRS-YOLOと呼ばれる改良モデルを提案する。
論文 参考訳(メタデータ) (2025-12-31T04:37:51Z) - Hierarchical Task Offloading and Trajectory Optimization in Low-Altitude Intelligent Networks Via Auction and Diffusion-based MARL [37.79695337425523]
低高度インテリジェントネットワーク(LAIN)は、災害対応、環境モニタリング、リアルタイムセンシングといったミッションクリティカルなアプリケーションをサポートすることができる。
これらのシステムは、エネルギー制約のあるUAV、タスク到着、異種コンピューティングリソースなど、重要な課題に直面している。
本稿では,UAV軌道計画とタスクオフロード決定を協調的に最適化する,時間依存型整数型非線形計画問題の解法を提案する。
論文 参考訳(メタデータ) (2025-12-05T08:14:45Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - Universal Camouflage Attack on Vision-Language Models for Autonomous Driving [67.34987318443761]
自動運転のためのビジュアル言語モデリングが、有望な研究方向として浮上している。
VLM-ADは、敵の攻撃による深刻なセキュリティ脅威に弱いままである。
VLM-ADのための最初のユニバーサルカモフラージュ攻撃フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-24T14:52:01Z) - CREW-WILDFIRE: Benchmarking Agentic Multi-Agent Collaborations at Scale [4.464959191643012]
我々は、次世代マルチエージェントエージェントAIフレームワークを評価するために設計されたオープンソースのベンチマークであるCREW-Wildfireを紹介する。
CREW-Wildfireは、大きな地図、異種エージェント、部分観測可能性、ダイナミックス、長期計画目的を含む手続き的に生成された山火事対応シナリオを提供する。
我々は、最先端のLLMベースのマルチエージェントエージェントAIフレームワークの実装と評価を行い、重要なパフォーマンスギャップを明らかにした。
論文 参考訳(メタデータ) (2025-07-07T16:33:42Z) - Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。
Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。
nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-12-28T14:23:58Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Heterogeneous Multi-Agent Reinforcement Learning for Unknown Environment
Mapping [0.0]
異種エージェントのチームが未知の環境をカバーするための分散制御ポリシーを学習できるようにするアクター批判アルゴリズムを提案する。
このタスクは、無人航空機のチームを配置することで危険地域における状況認識を高めたい国家の安全と緊急対応組織に関心を寄せている。
論文 参考訳(メタデータ) (2020-10-06T12:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。