論文の概要: ASTRA: A Scalable Next-Generation ATCO Training Simulator with Autonomous Simpilots
- arxiv url: http://arxiv.org/abs/2606.18319v2
- Date: Mon, 22 Jun 2026 12:15:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 16:10:14.665482
- Title: ASTRA: A Scalable Next-Generation ATCO Training Simulator with Autonomous Simpilots
- Title(参考訳): ASTRA: 自律型シミュレータを備えたスケーラブルな次世代ATCOトレーニングシミュレータ
- Authors: Ethan Chew, Enjia Wu, Iruss Eng, Ian Lim, Ranen Sim, Brandon Koh, Kaleb Nim, Caden Toh, Wei Dong Soin, Darius Koh, Galen Tay, Prannaya Gupta, Jonathan Koong, Yong Zhi Lim,
- Abstract要約: ASTRAは、ATCO音声を転写し、指示を解釈し、ローカルに適応した音声モデルを使用して適切なパイロットとATCO応答を生成するパイプラインを通じて、シミュレートロールを自動化するエンドツーエンドのトレーニングシミュレータである。
ASTRAにはAIによるパフォーマンス評価フレームワークが組み込まれており、正確性、簡潔性、完全性を通じて訓練生の無線電話通信を評価する。
- 参考スコア(独自算出の注目度): 0.30370026811994105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Air Traffic Control Operators (ATCOs) are vital in ensuring the safe, orderly, and efficient flow of air traffic, yet training capacity is constrained by reliance on specialized human trainers known as simpilots, who must role-play both pilots and ATCOs in a simulated airspace. Existing automated solutions rely on Western-centric speech models that perform poorly in Singaporean operational contexts, with off-the-shelf systems exhibiting Word Error Rates (WER) of up to 107.80% on Singaporean-accented aviation speech. We introduce ASTRA, an end-to-end training simulator that automates these simpilot roles through a pipeline that transcribes ATCO speech, interprets instructions, and generates appropriate pilot and ATCO responses using locally adapted voice models. Our fine-tuned Automatic Speech Recognition (ASR) pipeline reduces WER to 23.45%, substantially outperforming existing approaches in this domain. Beyond traffic simulation, ASTRA incorporates an AI-assisted performance evaluation framework that assesses trainee radiotelephony communications across accuracy, brevity, and completeness, achieving post-optimization scores of 91.7%, 88.2%, and 86.9%, respectively. Built on open-source foundations such as DSPy and Unsloth, this approach enables scalable, standardized ATCO assessment while reducing instructor workload.
- Abstract(参考訳): 航空交通管制オペレーター(ATCO)は、安全で秩序があり、効率的な航空交通の流れを確保するのに不可欠であるが、訓練能力は、パイロットとATCOの両方をシミュレートされた空域で役割を果たさなければならないシミュパイロット(simpilots)と呼ばれる専門訓練員に依存して制限される。
既存の自動化されたソリューションは、シンガポールの運用環境では不十分な西洋中心の音声モデルに依存しており、シンガポールの航空スピーチで最大107.80%のワードエラー率(WER)を示すオフ・ザ・シェルフシステムである。
我々は、ATCO音声を転写し、指示を解釈し、局所的に適応した音声モデルを用いて適切なパイロットとATCO応答を生成するパイプラインを通じて、これらのシミュレートロールを自動化するエンドツーエンドトレーニングシミュレータASTRAを紹介する。
我々の微調整自動音声認識(ASR)パイプラインは、WERを23.45%に削減し、この領域における既存のアプローチを大幅に上回っている。
交通シミュレーションの他に、ASTRAはAI支援のパフォーマンス評価フレームワークを組み、正確性、簡潔性、完全性で訓練生の無線電話通信を評価し、それぞれ91.7%、88.2%、86.9%の最適化スコアを達成している。
DSPyやUnslothといったオープンソース基盤に基づいて構築されたこのアプローチは、インストラクターの作業量を削減しつつ、スケーラブルで標準化されたATCOアセスメントを可能にする。
関連論文リスト
- Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications [0.0]
本研究では,東南アジアアクセントに特化して微調整されたASRモデルの開発について述べる。
本研究は,SEA音声における単語誤り率(WER)0.0982,9.82%を達成し,大幅な改善を実現している。
その結果,ATC通信における非西欧アクセントの転写精度を向上させるため,ノイズロバスト訓練技術と地域特化データセットの必要性が強調された。
論文 参考訳(メタデータ) (2025-02-27T17:35:59Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Joint vs Sequential Speaker-Role Detection and Automatic Speech Recognition for Air-traffic Control [60.35553925189286]
本稿では,標準のASRアーキテクチャを頼りながら,両タスクを協調的に解決するトランスフォーマーベースのジョイントASR-SRDシステムを提案する。
複数のATCデータセット上でのASRとSRDの2つのケースドアプローチとの比較を行った。
論文 参考訳(メタデータ) (2024-06-19T21:11:01Z) - A Virtual Simulation-Pilot Agent for Training of Air Traffic Controllers [0.797970449705065]
航空交通管制士(ATCo)の訓練を高速化する新しい仮想シミュレーションパイロットエンジンを提案する。
エンジンはATCo訓練生から音声通信を受け、自動音声認識と理解を行う。
私たちの知る限りでは、オープンソースのATCリソースとAIツールを完全にベースとした最初の作品です。
論文 参考訳(メタデータ) (2023-04-16T17:45:21Z) - Embedding Synthetic Off-Policy Experience for Autonomous Driving via
Zero-Shot Curricula [48.58973705935691]
我々は、データの10%サブセットのみを使用してトレーニングされたエージェントが、データセット全体に対してトレーニングされたエージェントと同様に動作することを示す。
次に、この難易度スコアをゼロショット転送に使用して、模倣学習に基づく計画エージェントのカリキュラムを生成することを実証する。
論文 参考訳(メタデータ) (2022-12-02T18:57:21Z) - ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech
Recognition and Natural Language Understanding of Air Traffic Control
Communications [51.24043482906732]
本稿では,ATC分野の研究を促進するためのデータセットであるATCO2コーパスを紹介する。
ATCO2コーパスは3つのサブセットに分けられる。
我々はATCO2コーパスが堅牢なASRとNLUの研究を促進することを期待している。
論文 参考訳(メタデータ) (2022-11-08T07:26:45Z) - BERTraffic: A Robust BERT-Based Approach for Speaker Change Detection
and Role Identification of Air-Traffic Communications [2.270534915073284]
音声活動検出(SAD)またはダイアリゼーションシステムは失敗し、2つ以上の単一話者セグメントが同一記録に含まれる。
我々は、SADモジュールのセグメンテーションをBERTモデルと組み合わせて、ASR transcripts(ダイアリゼーション+SRI)に基づく話者変更検出(SCD)と話者ロール識別(SRI)を行うシステムを開発した。
提案したモデルはATCO/パイロットで最大0.90/0.95 F1スコアに達する。
論文 参考訳(メタデータ) (2021-10-12T07:25:12Z) - Grammar Based Identification Of Speaker Role For Improving ATCO And
Pilot ASR [1.1391158217994781]
航空交通管制のための補助ベース音声認識(ABSR)は一般に、航空交通管制官(ATCO)とパイロットデータの両方をプールすることで訓練される。
ATCOのデータ不均衡と様々な音響条件のため、ASRの性能はパイロットよりもATCOにとって極めて優れている。
論文 参考訳(メタデータ) (2021-08-27T08:40:08Z) - The USYD-JD Speech Translation System for IWSLT 2021 [85.64797317290349]
本稿では,シドニー大学とJDが共同でIWSLT 2021低リソース音声翻訳タスクを提出したことを述べる。
私たちは、公式に提供されたASRとMTデータセットでモデルをトレーニングしました。
翻訳性能の向上を目的として, バック翻訳, 知識蒸留, 多機能再構成, トランスダクティブファインタニングなど, 最新の効果的な手法について検討した。
論文 参考訳(メタデータ) (2021-07-24T09:53:34Z) - Automatic Speech Recognition Benchmark for Air-Traffic Communications [1.175956452196938]
CleanSky EC-H2020 ATCO2は、航空空間からATCo音声データを収集、整理、自動処理するASRベースのプラットフォームを開発することを目的としている。
アクセントによるアクセント間の欠陥は、データ量によって最小限に抑えられ、ATC環境でシステムを実現することができる。
論文 参考訳(メタデータ) (2020-06-18T06:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。