論文の概要: Speech and Natural Language Processing Technologies for Pseudo-Pilot
Simulator
- arxiv url: http://arxiv.org/abs/2212.07164v1
- Date: Wed, 14 Dec 2022 11:34:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 14:09:36.097561
- Title: Speech and Natural Language Processing Technologies for Pseudo-Pilot
Simulator
- Title(参考訳): Pseudo-Pilotシミュレータのための音声・自然言語処理技術
- Authors: Amrutha Prasad, Juan Zuluaga-Gomez, Petr Motlicek, Saeed Sarfjoo,
Iuliia Nigmatulina, Karel Vesely
- Abstract要約: 本稿では,AtCos(Air-traffic Controls)トレーニングの高速化を目的とした,簡易かつ効率的な反復型モジュールシステムについて述べる。
例えば、ATCo訓練中にEUROのESCAPE liteシミュレータ(https://www.eurocontrol.int/simulator/escape)に人間のパイロットが必要である。
このニーズは、パイロットとして機能する自動システムによって置き換えることができる。
- 参考スコア(独自算出の注目度): 0.5480546613836199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a simple yet efficient repetition-based modular system
for speeding up air-traffic controllers (ATCos) training. E.g., a human pilot
is still required in EUROCONTROL's ESCAPE lite simulator (see
https://www.eurocontrol.int/simulator/escape) during ATCo training. However,
this need can be substituted by an automatic system that could act as a pilot.
In this paper, we aim to develop and integrate a pseudo-pilot agent into the
ATCo training pipeline by merging diverse artificial intelligence (AI) powered
modules. The system understands the voice communications issued by the ATCo,
and, in turn, it generates a spoken prompt that follows the pilot's phraseology
to the initial communication. Our system mainly relies on open-source AI tools
and air traffic control (ATC) databases, thus, proving its simplicity and ease
of replicability. The overall pipeline is composed of the following: (1) a
submodule that receives and pre-processes the input stream of raw audio, (2) an
automatic speech recognition (ASR) system that transforms audio into a sequence
of words; (3) a high-level ATC-related entity parser, which extracts relevant
information from the communication, i.e., callsigns and commands, and finally,
(4) a speech synthesizer submodule that generates responses based on the
high-level ATC entities previously extracted. Overall, we show that this system
could pave the way toward developing a real proof-of-concept pseudo-pilot
system. Hence, speeding up the training of ATCos while drastically reducing its
overall cost.
- Abstract(参考訳): 本稿では,atcos(air-traffic controllers)トレーニングの高速化を目的とした,簡易かつ効率的な反復型モジュールシステムについて述べる。
例えば、ATCo訓練中にEUROCONTROLのESCAPE liteシミュレータ(https://www.eurocontrol.int/simulator/escape)に人間のパイロットが必要である。
しかし、このニーズはパイロットとして機能する自動システムによって置き換えることができる。
本稿では,多種多様な人工知能(AI)搭載モジュールを統合することで,擬似パイロットエージェントをATCoトレーニングパイプラインに統合することを目的とする。
このシステムは、atcoが発する音声通信を理解し、その後、パイロットのフレーズを最初の通信に追従する音声プロンプトを生成する。
我々のシステムは、主にオープンソースのAIツールと航空交通制御(ATC)データベースに依存しており、そのシンプルさと再現性を証明する。
1)生音声の入力ストリームを受信・前処理するサブモジュール,(2)音声を一連の単語に変換する自動音声認識(ASR)システム,(3)通信から関連情報を抽出する高レベルATC関連エンティティパーサ,(4)従来抽出した高レベルATCエンティティに基づいて応答を生成する音声シンセサイザーサブモジュールから構成される。
全体として,本システムは,概念実証型擬似パイロットシステムを開発するための道を開くことができる。
そのため、ATCoのトレーニングをスピードアップし、全体のコストを大幅に削減する。
関連論文リスト
- Joint vs Sequential Speaker-Role Detection and Automatic Speech Recognition for Air-traffic Control [60.35553925189286]
本稿では,標準のASRアーキテクチャを頼りながら,両タスクを協調的に解決するトランスフォーマーベースのジョイントASR-SRDシステムを提案する。
複数のATCデータセット上でのASRとSRDの2つのケースドアプローチとの比較を行った。
論文 参考訳(メタデータ) (2024-06-19T21:11:01Z) - LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - A Virtual Simulation-Pilot Agent for Training of Air Traffic Controllers [0.797970449705065]
航空交通管制士(ATCo)の訓練を高速化する新しい仮想シミュレーションパイロットエンジンを提案する。
エンジンはATCo訓練生から音声通信を受け、自動音声認識と理解を行う。
私たちの知る限りでは、オープンソースのATCリソースとAIツールを完全にベースとした最初の作品です。
論文 参考訳(メタデータ) (2023-04-16T17:45:21Z) - ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech
Recognition and Natural Language Understanding of Air Traffic Control
Communications [51.24043482906732]
本稿では,ATC分野の研究を促進するためのデータセットであるATCO2コーパスを紹介する。
ATCO2コーパスは3つのサブセットに分けられる。
我々はATCO2コーパスが堅牢なASRとNLUの研究を促進することを期待している。
論文 参考訳(メタデータ) (2022-11-08T07:26:45Z) - Call-sign recognition and understanding for noisy air-traffic
transcripts using surveillance information [72.20674534231314]
航空交通管制(ATC)は、パイロットと航空交通管制官(ATCO)の間の音声による通信に依存している。
コールサインは、各フライトのユニークな識別子として、ATCOによって特定のパイロットに対処するために使用される。
この問題に対処する新しいコールサイン認識・理解システム(CRU)を提案する。
認識器は、ノイズの多いATC文字起こしのコールサインを識別し、標準国際民間航空機関(ICAO)フォーマットに変換するよう訓練されている。
論文 参考訳(メタデータ) (2022-04-13T11:30:42Z) - Deliberation Model for On-Device Spoken Language Understanding [69.5587671262691]
我々は、エンドツーエンド(E2E)音声言語理解(SLU)に対する新しい議論に基づくアプローチを提案する。
提案手法は,自然言語から合成音声訓練に移行する際の劣化を著しく低減できることを示す。
論文 参考訳(メタデータ) (2022-04-04T23:48:01Z) - BERTraffic: A Robust BERT-Based Approach for Speaker Change Detection
and Role Identification of Air-Traffic Communications [2.270534915073284]
音声活動検出(SAD)またはダイアリゼーションシステムは失敗し、2つ以上の単一話者セグメントが同一記録に含まれる。
我々は、SADモジュールのセグメンテーションをBERTモデルと組み合わせて、ASR transcripts(ダイアリゼーション+SRI)に基づく話者変更検出(SCD)と話者ロール識別(SRI)を行うシステムを開発した。
提案したモデルはATCO/パイロットで最大0.90/0.95 F1スコアに達する。
論文 参考訳(メタデータ) (2021-10-12T07:25:12Z) - Contextual Semi-Supervised Learning: An Approach To Leverage
Air-Surveillance and Untranscribed ATC Data in ASR Systems [0.6465251961564605]
飛行機へのコールサインは、atco-パイロット通信の必須部分である。
ASRシステムのエラー率を低減するために,半教師付きトレーニング中に文脈知識を追加する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-08T09:53:54Z) - A question-answering system for aircraft pilots' documentation [58.720142291102135]
航空宇宙産業は、システム記述、マニュアル、手順を含む複雑な文書や技術文書の大量収集に依存している。
本稿では,航空機パイロットが自然にシステムと対話し,自然言語による質問を行うことで,情報へのアクセスを支援する質問応答システムを提案する。
論文 参考訳(メタデータ) (2020-11-26T13:33:47Z) - Automatic Speech Recognition Benchmark for Air-Traffic Communications [1.175956452196938]
CleanSky EC-H2020 ATCO2は、航空空間からATCo音声データを収集、整理、自動処理するASRベースのプラットフォームを開発することを目的としている。
アクセントによるアクセント間の欠陥は、データ量によって最小限に抑えられ、ATC環境でシステムを実現することができる。
論文 参考訳(メタデータ) (2020-06-18T06:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。