論文の概要: Improving callsign recognition with air-surveillance data in air-traffic
communication
- arxiv url: http://arxiv.org/abs/2108.12156v1
- Date: Fri, 27 Aug 2021 07:56:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:22:11.280657
- Title: Improving callsign recognition with air-surveillance data in air-traffic
communication
- Title(参考訳): 航空交通における航空監視データによるコールサイン認識の改善
- Authors: Iuliia Nigmatulina, Rudolf Braun, Juan Zuluaga-Gomez, Petr Motlicek
- Abstract要約: 音声認識は、パイロットと航空交通管制官の間の音声通信の補助として使用できる。
エラーのリスクを最小限に抑えるためには、高精度な予測が必要である。
この結果から,着信信号を含む監視データは,発声における着信信号の認識を著しく向上させる可能性が示唆された。
- 参考スコア(独自算出の注目度): 1.6058099298620423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic Speech Recognition (ASR) can be used as the assistance of speech
communication between pilots and air-traffic controllers. Its application can
significantly reduce the complexity of the task and increase the reliability of
transmitted information. Evidently, high accuracy predictions are needed to
minimize the risk of errors. Especially, high accuracy is required in
recognition of key information, such as commands and callsigns, used to
navigate pilots. Our results prove that the surveillance data containing
callsigns can help to considerably improve the recognition of a callsign in an
utterance when the weights of probable callsign n-grams are reduced per
utterance. In this paper, we investigate two approaches: (1) G-boosting, when
callsigns weights are adjusted at language model level (G) and followed by the
dynamic decoder with an on-the-fly composition, and (2) lattice rescoring when
callsign information is introduced on top of lattices generated using a
conventional decoder. Boosting callsign n-grams with the combination of two
methods allowed us to gain 28.4% of absolute improvement in callsign
recognition accuracy and up to 74.2% of relative improvement in WER of callsign
recognition.
- Abstract(参考訳): 自動音声認識(asr)は、パイロットと航空管制官間の音声通信の補助として使用できる。
そのアプリケーションはタスクの複雑さを著しく低減し、送信された情報の信頼性を高めることができる。
エラーのリスクを最小限に抑えるためには、高い精度の予測が必要である。
特に、パイロットのナビゲートに使用されるコマンドやコールサインといった重要な情報を認識するには、高い精度が必要である。
以上より,コールサインを含む監視データは,発話毎に確率的なコールサインn-gramの重みが低減された場合に,発話中のコールサインの認識を大幅に改善できることを示す。
本稿では,(1)言語モデルレベル(g)でコールサイン重みを調整し,その後にオンザフライ構成の動的デコーダ,(2)従来のデコーダで生成された格子上にコールサイン情報を導入した場合の格子リコーダという2つのアプローチについて検討する。
コールサインn-gramと2つの手法を組み合わせることで、コールサイン認識精度が28.4%向上し、コールサイン認識のWERが74.2%向上した。
関連論文リスト
- InterBiasing: Boost Unseen Word Recognition through Biasing Intermediate Predictions [5.50485371072671]
本手法は,ラベルの修正による中間CTC予測に代えて,誤認識対象キーワードの認識精度を向上させる。
日本語を用いた実験により,未知語に対するF1スコアの改善が得られた。
論文 参考訳(メタデータ) (2024-06-21T06:25:10Z) - Distillation-guided Representation Learning for Unconstrained Gait Recognition [50.0533243584942]
本研究では,屋外シナリオにおける人間認証のためのGADER(GAit Detection and Recognition)フレームワークを提案する。
GADERは、歩行情報を含むフレームのみを使用する新しい歩行認識手法により識別的特徴を構築する。
室内および屋外のデータセットに一貫した改善を示すため,複数の歩行ベースライン(SoTA)について評価を行った。
論文 参考訳(メタデータ) (2023-07-27T01:53:57Z) - On the Importance of Signer Overlap for Sign Language Detection [65.26091369630547]
我々は,手話検出のための現在のベンチマークデータセットは,一般化が不十分な過度に肯定的な結果であると主張している。
我々は、現在の符号検出ベンチマークデータセットに対するシグナ重なりの影響を詳細に分析することでこれを定量化する。
我々は、重複のない新しいデータセット分割を提案し、より現実的なパフォーマンス評価を可能にします。
論文 参考訳(メタデータ) (2023-03-19T22:15:05Z) - Evaluating Automatic Speech Recognition in an Incremental Setting [0.7734726150561086]
単語誤り率,レイテンシ,すでに認識されている単語に対する英語テストデータへの更新回数などの指標を用いて,6つの音声認識器を体系的に評価した。
一般的に、ローカルの認識器はより高速で、クラウドベースの認識器よりも少ない更新を必要とする。
論文 参考訳(メタデータ) (2023-02-23T14:22:40Z) - Call-sign recognition and understanding for noisy air-traffic
transcripts using surveillance information [72.20674534231314]
航空交通管制(ATC)は、パイロットと航空交通管制官(ATCO)の間の音声による通信に依存している。
コールサインは、各フライトのユニークな識別子として、ATCOによって特定のパイロットに対処するために使用される。
この問題に対処する新しいコールサイン認識・理解システム(CRU)を提案する。
認識器は、ノイズの多いATC文字起こしのコールサインを識別し、標準国際民間航空機関(ICAO)フォーマットに変換するよう訓練されている。
論文 参考訳(メタデータ) (2022-04-13T11:30:42Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - A two-step approach to leverage contextual data: speech recognition in
air-traffic communications [1.3229510087215552]
ASR法とNLP法の利点を組み合わせることで,コールサインの認識が大幅に向上することが証明された。
ASR法とNLP法の組み合わせでコールサインn-gramを増強すると、絶対値の53.7%、相対値の60.4%のコールサイン認識が改善される。
論文 参考訳(メタデータ) (2022-02-08T08:59:54Z) - Contextual Semi-Supervised Learning: An Approach To Leverage
Air-Surveillance and Untranscribed ATC Data in ASR Systems [0.6465251961564605]
飛行機へのコールサインは、atco-パイロット通信の必須部分である。
ASRシステムのエラー率を低減するために,半教師付きトレーニング中に文脈知識を追加する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-08T09:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。