論文の概要: Combining Textual and Spectral Features for Robust Classification of Pilot Communications
- arxiv url: http://arxiv.org/abs/2509.09752v1
- Date: Thu, 11 Sep 2025 16:43:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:07.882255
- Title: Combining Textual and Spectral Features for Robust Classification of Pilot Communications
- Title(参考訳): パイロット通信のロバスト分類のためのテキスト特徴とスペクトル特徴の組み合わせ
- Authors: Abdullah All Tanvir, Chenyu Huang, Moe Alahmad, Chuyang Yang, Xin Zhong,
- Abstract要約: 本稿では、テキストとスペクトルの両方の特徴を用いてパイロット無線通信を分類する、新しいデュアルパイプライン機械学習フレームワークを提案する。
我々の知る限り、これは実世界の航空交通オーディオの二重パイプラインMLフレームワークを用いて、運用航空機の意図を分類する最初のシステムである。
- 参考スコア(独自算出の注目度): 2.9346090159291283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate estimation of aircraft operations, such as takeoffs and landings, is critical for effective airport management, yet remains challenging, especially at non-towered facilities lacking dedicated surveillance infrastructure. This paper presents a novel dual pipeline machine learning framework that classifies pilot radio communications using both textual and spectral features. Audio data collected from a non-towered U.S. airport was annotated by certified pilots with operational intent labels and preprocessed through automatic speech recognition and Mel-spectrogram extraction. We evaluate a wide range of traditional classifiers and deep learning models, including ensemble methods, LSTM, and CNN across both pipelines. To our knowledge, this is the first system to classify operational aircraft intent using a dual-pipeline ML framework on real-world air traffic audio. Our results demonstrate that spectral features combined with deep architectures consistently yield superior classification performance, with F1-scores exceeding 91%. Data augmentation further improves robustness to real-world audio variability. The proposed approach is scalable, cost-effective, and deployable without additional infrastructure, offering a practical solution for air traffic monitoring at general aviation airports.
- Abstract(参考訳): 離陸や着陸などの航空作戦の正確な評価は、効果的な空港管理には不可欠であるが、特に専用の監視インフラが欠如している非調査施設では依然として困難である。
本稿では、テキストとスペクトルの両方の特徴を用いてパイロット無線通信を分類する、新しいデュアルパイプライン機械学習フレームワークを提案する。
調査対象でない空港から収集された音声データは、運用目的ラベルを持つ認定パイロットによって注釈付けされ、自動音声認識とメル・スペクトログラム抽出によって前処理された。
両パイプラインにまたがるアンサンブル法,LSTM,CNNなど,従来の分類法やディープラーニングモデルについて幅広い評価を行った。
我々の知る限り、これは実世界の航空交通オーディオの二重パイプラインMLフレームワークを用いて、運用航空機の意図を分類する最初のシステムである。
F1スコアは91%を超え, スペクトル特性と深層構造を併用することで, 優れた分類性能が得られることを示した。
データ拡張により、実世界のオーディオ可変性に対する堅牢性がさらに向上する。
提案手法は、拡張性があり、コスト効率が高く、追加のインフラなしで展開可能であり、一般空港における航空交通監視の実用的なソリューションを提供する。
関連論文リスト
- Bayesian-Driven Graph Reasoning for Active Radio Map Construction [96.08082552413117]
本稿では,経路ナビゲーションに適したグラフベースの推論を明示的に活用する不確実性を考慮した無線地図再構成フレームワークを提案する。
提案手法は,(1)空間的不確実性をリアルタイムで推定するベイズニューラルネットワーク,(2)グローバル推論を行う注意に基づく強化学習ポリシの2つの重要な深層学習要素を統合した。
実験の結果,URAMは既存のベースラインよりも最大で34%の精度で復元できることがわかった。
論文 参考訳(メタデータ) (2025-07-29T03:32:01Z) - A Transformer-Based Conditional GAN with Multiple Instance Learning for UAV Signal Detection and Classification [17.586093539522327]
本稿では,トランスフォーマーをベースとしたGAN(Generative Adversarial Network)とMILET(Multiple Examplely Explainable Learning)を統合した新しいフレームワークを提案する。
実験の結果,DroneDetectデータセットでは96.5%,DroneRFデータセットでは98.6%の精度が得られた。
このフレームワークはまた、様々なUAVプラットフォームと飛行状態にまたがる強力な計算効率と堅牢な一般化を示す。
論文 参考訳(メタデータ) (2025-07-19T12:35:45Z) - Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications [0.0]
本研究では,東南アジアアクセントに特化して微調整されたASRモデルの開発について述べる。
本研究は,SEA音声における単語誤り率(WER)0.0982,9.82%を達成し,大幅な改善を実現している。
その結果,ATC通信における非西欧アクセントの転写精度を向上させるため,ノイズロバスト訓練技術と地域特化データセットの必要性が強調された。
論文 参考訳(メタデータ) (2025-02-27T17:35:59Z) - Joint vs Sequential Speaker-Role Detection and Automatic Speech Recognition for Air-traffic Control [60.35553925189286]
本稿では,標準のASRアーキテクチャを頼りながら,両タスクを協調的に解決するトランスフォーマーベースのジョイントASR-SRDシステムを提案する。
複数のATCデータセット上でのASRとSRDの2つのケースドアプローチとの比較を行った。
論文 参考訳(メタデータ) (2024-06-19T21:11:01Z) - A Virtual Simulation-Pilot Agent for Training of Air Traffic Controllers [0.797970449705065]
航空交通管制士(ATCo)の訓練を高速化する新しい仮想シミュレーションパイロットエンジンを提案する。
エンジンはATCo訓練生から音声通信を受け、自動音声認識と理解を行う。
私たちの知る限りでは、オープンソースのATCリソースとAIツールを完全にベースとした最初の作品です。
論文 参考訳(メタデータ) (2023-04-16T17:45:21Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Wireless-Enabled Asynchronous Federated Fourier Neural Network for
Turbulence Prediction in Urban Air Mobility (UAM) [101.80862265018033]
垂直離着陸機(VTOL)が配車サービスに使用される都市空力(UAM)が提案されている。
UAMでは、航空機はエアロドロムを繋ぐ廊下として知られる指定空域で運用することができる。
GBSと航空機間の信頼性の高い通信網により、UAMは適切に空域を利用することができる。
論文 参考訳(メタデータ) (2021-12-26T14:41:52Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - BERTraffic: A Robust BERT-Based Approach for Speaker Change Detection
and Role Identification of Air-Traffic Communications [2.270534915073284]
音声活動検出(SAD)またはダイアリゼーションシステムは失敗し、2つ以上の単一話者セグメントが同一記録に含まれる。
我々は、SADモジュールのセグメンテーションをBERTモデルと組み合わせて、ASR transcripts(ダイアリゼーション+SRI)に基づく話者変更検出(SCD)と話者ロール識別(SRI)を行うシステムを開発した。
提案したモデルはATCO/パイロットで最大0.90/0.95 F1スコアに達する。
論文 参考訳(メタデータ) (2021-10-12T07:25:12Z) - A Simplified Framework for Air Route Clustering Based on ADS-B Data [0.0]
本稿では,ADS-Bデータに基づく空港間の典型的な航空路の検出を支援する枠組みを提案する。
実のところ,エアフロー最適化の計算コストを実質的に低減するために,我々の枠組みを考慮に入れることができる。
論文 参考訳(メタデータ) (2021-07-07T08:55:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。