論文の概要: Voice-Driven Semantic Perception for UAV-Assisted Emergency Networks
- arxiv url: http://arxiv.org/abs/2602.17394v1
- Date: Thu, 19 Feb 2026 14:18:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:29.093171
- Title: Voice-Driven Semantic Perception for UAV-Assisted Emergency Networks
- Title(参考訳): UAV支援緊急ネットワークにおける音声駆動型セマンティック知覚
- Authors: Nuno Saavedra, Pedro Ribeiro, André Coelho, Rui Campos,
- Abstract要約: 無人航空機(UAV)支援ネットワークは、緊急対応のための有望なアプローチとして、ますます予見されつつある。
本稿では,UAV支援ネットワークに対する音声駆動型認識を可能にするAI駆動型フレームワークであるSIRENを提案する。
- 参考スコア(独自算出の注目度): 1.2685085803791043
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unmanned Aerial Vehicle (UAV)-assisted networks are increasingly foreseen as a promising approach for emergency response, providing rapid, flexible, and resilient communications in environments where terrestrial infrastructure is degraded or unavailable. In such scenarios, voice radio communications remain essential for first responders due to their robustness; however, their unstructured nature prevents direct integration with automated UAV-assisted network management. This paper proposes SIREN, an AI-driven framework that enables voice-driven perception for UAV-assisted networks. By integrating Automatic Speech Recognition (ASR) with Large Language Model (LLM)-based semantic extraction and Natural Language Processing (NLP) validation, SIREN converts emergency voice traffic into structured, machine-readable information, including responding units, location references, emergency severity, and Quality-of-Service (QoS) requirements. SIREN is evaluated using synthetic emergency scenarios with controlled variations in language, speaker count, background noise, and message complexity. The results demonstrate robust transcription and reliable semantic extraction across diverse operating conditions, while highlighting speaker diarization and geographic ambiguity as the main limiting factors. These findings establish the feasibility of voice-driven situational awareness for UAV-assisted networks and show a practical foundation for human-in-the-loop decision support and adaptive network management in emergency response operations.
- Abstract(参考訳): 無人航空機(UAV)支援ネットワークは、地上インフラが劣化または利用できない環境で、迅速で柔軟で回復力のある通信を提供する、緊急対応のための有望なアプローチとして、ますます予見されつつある。
このようなシナリオでは、その堅牢性のため、最初の応答者にとって音声無線通信は不可欠であるが、その非構造的な性質は、自動UAVアシストネットワーク管理との直接統合を妨げている。
本稿では,UAV支援ネットワークに対する音声駆動型認識を可能にするAI駆動型フレームワークであるSIRENを提案する。
音声認識(ASR)とLarge Language Model(LLM)に基づく意味抽出と自然言語処理(NLP)検証を統合することで、SIRENは緊急音声トラフィックを、応答ユニット、位置参照、緊急重大度、QoS要求を含む、構造化された機械可読情報に変換する。
SIRENは、言語、話者数、バックグラウンドノイズ、メッセージの複雑さを制御した、合成緊急シナリオを用いて評価される。
その結果, 話者ダイアリゼーションと地理的あいまいさを主な制約要因として強調しつつ, 多様な操作条件にまたがるロバストな書き起こしと確実な意味抽出が示された。
これらの知見は,UAV支援ネットワークにおける音声駆動型状況認識の実現可能性を確立し,緊急対応作業におけるヒューマン・イン・ザ・ループ決定支援と適応型ネットワーク管理の実践的基盤を示す。
関連論文リスト
- SW-ASR: A Context-Aware Hybrid ASR Pipeline for Robust Single Word Speech Recognition [0.8921166277011348]
単一単語自動音声認識は言語文脈の欠如による課題である。
本稿では,最近のディープラーニング手法を概観し,ロバストな単一単語検出のためのモジュラーフレームワークを提案する。
我々は、Google Speech Commandsデータセットと、電話やメッセージングプラットフォームから収集された実世界のデータセットについて、帯域幅に制限のある条件下で評価する。
論文 参考訳(メタデータ) (2026-01-28T04:50:04Z) - TRIDENT: A Redundant Architecture for Caribbean-Accented Emergency Speech Triage [0.0]
TRIDENT (Transcription and Routing Intelligence for Dispatcher-Empowered National Triage) は、ヒューマン・アプリケーションのための緊急コール・インプットを構築するために設計された3層・ディスペンサーをサポートするアーキテクチャである。
この研究は、カリブの音声が確立したトリアージプロトコルへの公平なアクセスを確実に受けられるように、アクセント耐性の緊急AIのためのフレームワークを確立する。
論文 参考訳(メタデータ) (2025-12-11T15:29:33Z) - Efficient VoIP Communications through LLM-based Real-Time Speech Reconstruction and Call Prioritization for Emergency Services [0.0]
緊急通信システムは、パケット損失、帯域制限、信号品質の低下、遅延、VoIPシステムのジッタによる破壊に直面している。
苦悩の被害者はしばしば、パニック、発声障害、背景雑音による重要な情報を伝えるのに苦労する。
本稿では,不完全な音声を再構成し,文脈的ギャップを埋め,重大度に基づく呼の優先順位付けを行うことにより,これらの課題に対処するためにLarge Language Models(LLMs)を活用することを提案する。
論文 参考訳(メタデータ) (2024-12-09T17:22:40Z) - AI Flow at the Network Edge [58.31090055138711]
AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文 参考訳(メタデータ) (2024-11-19T12:51:17Z) - Emergency Computing: An Adaptive Collaborative Inference Method Based on
Hierarchical Reinforcement Learning [14.929735103723573]
センシング,通信,計算,キャッシュ,インテリジェンスを備えた緊急ネットワーク(E-SC3I)を提案する。
このフレームワークには、緊急コンピューティング、キャッシュ、統合通信とセンシング、インテリジェンス強化のためのメカニズムが含まれている。
本稿では,特に緊急コンピューティングに焦点をあて,階層的強化学習に基づく適応型協調推論手法(ACIM)を提案する。
論文 参考訳(メタデータ) (2024-02-03T13:28:35Z) - UNIT-DSR: Dysarthric Speech Reconstruction System Using Speech Unit
Normalization [60.43992089087448]
変形性音声再構成システムは、変形性音声を正常な音声に変換することを目的としている。
本稿では,HuBERTのドメイン適応能力を活用して学習効率を向上させるユニットDSRシステムを提案する。
NEDアプローチと比較すると、ユニットDSRシステムは音声単位正規化器とユニットHiFi-GANボコーダのみで構成されている。
論文 参考訳(メタデータ) (2024-01-26T06:08:47Z) - Generative AI-aided Joint Training-free Secure Semantic Communications
via Multi-modal Prompts [89.04751776308656]
本稿では,多モデルプロンプトを用いたGAI支援型SemComシステムを提案する。
セキュリティ上の懸念に応えて、フレンドリーなジャマーによって支援される隠蔽通信の応用を紹介する。
論文 参考訳(メタデータ) (2023-09-05T23:24:56Z) - CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual
Navigation in Noisy Environments [41.21509045214965]
CAVENは、エージェントが音声目標にナビゲートするタスクを解決するためのヒューマン/オーラルと対話することのできるフレームワークである。
以上の結果から,我々の全会話的アプローチは,成功率のオーダー・オブ・マグニチュード改善にほぼ寄与していることがわかった。
論文 参考訳(メタデータ) (2023-06-06T22:32:49Z) - Artificial Intelligence Aided Next-Generation Networks Relying on UAVs [140.42435857856455]
動的環境において,人工知能(AI)による無人航空機(UAV)による次世代ネットワーク支援が提案されている。
AI対応のUAV支援無線ネットワーク(UAWN)では、複数のUAVが航空基地局として使用され、ダイナミックな環境に迅速に適応することができる。
AIフレームワークの利点として、従来のUAWNのいくつかの課題が回避され、ネットワークパフォーマンスが向上し、信頼性が向上し、アジャイル適応性が向上する。
論文 参考訳(メタデータ) (2020-01-28T15:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。