論文の概要: Sequential Classification of Aviation Safety Occurrences with Natural Language Processing
- arxiv url: http://arxiv.org/abs/2501.06490v1
- Date: Sat, 11 Jan 2025 09:23:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:28:31.404553
- Title: Sequential Classification of Aviation Safety Occurrences with Natural Language Processing
- Title(参考訳): 自然言語処理による航空安全事故の逐次分類
- Authors: Aziida Nanyonga, Hassan Wasswa, Ugur Turhan, Oleksandra Molloy, Graham Wild,
- Abstract要約: 安全事象を分類し分類する能力は、航空産業の利害関係者が情報的安全クリティカルな決定を下すのに役立つだろう。
各種深層学習モデルの分類性能を,NTSBによる27,000件の安全発生報告に基づいて評価した。
- 参考スコア(独自算出の注目度): 14.379311972506791
- License:
- Abstract: Safety is a critical aspect of the air transport system given even slight operational anomalies can result in serious consequences. To reduce the chances of aviation safety occurrences, accidents and incidents are reported to establish the root cause, propose safety recommendations etc. However, analysis narratives of the pre-accident events are presented using human-understandable, raw, unstructured, text that a computer system cannot understand. The ability to classify and categorise safety occurrences from their textual narratives would help aviation industry stakeholders make informed safety-critical decisions. To classify and categorise safety occurrences, we applied natural language processing (NLP) and AI (Artificial Intelligence) models to process text narratives. The study aimed to answer the question. How well can the damage level caused to the aircraft in a safety occurrence be inferred from the text narrative using natural language processing. The classification performance of various deep learning models including LSTM, BLSTM, GRU, sRNN, and combinations of these models including LSTM and GRU, BLSTM+GRU, sRNN and LSTM, sRNN and BLSTM, sRNN and GRU, sRNN and BLSTM and GRU, and sRNN and LSTM and GRU was evaluated on a set of 27,000 safety occurrence reports from the NTSB. The results of this study indicate that all models investigated performed competitively well recording an accuracy of over 87.9% which is well above the random guess of 25% for a four-class classification problem. Also, the models recorded high precision, recall, and F1 scores above 80%, 88%, and 85%, respectively. sRNN slightly outperformed other single models in terms of recall (90%) and accuracy (90%) while LSTM reported slightly better performance in terms of precision (87%).
- Abstract(参考訳): 安全は航空輸送システムにとって重要な側面であり、わずかな運用上の異常さえも重大な結果をもたらす可能性がある。
航空安全事故の発生確率を低減するため、事故や事故を報告し、根本原因の確立、安全勧告の提案等を行う。
しかし, コンピュータシステムでは理解できない, 人間の理解できない, 生の, 構造化されていないテキストを用いて, 事故前事象の分析物語を提示する。
テキストの物語から安全事象を分類し分類する能力は、航空産業の利害関係者が情報的安全クリティカルな決定を下すのに役立つだろう。
そこで本稿では,自然言語処理(NLP)モデルとAI(Artificial Intelligence)モデルをテキスト物語の処理に適用した。
その研究は質問に答えることを目的としていた。
安全発生時の航空機の損傷レベルは、自然言語処理を用いてテキスト物語からどの程度推測できるか。
LSTM, BLSTM, GRU, sRNNなどの各種深層学習モデルの分類性能と, LSTM, GRU, BLSTM+GRU, sRNN, LSTM, sRNN, GRU, sRNN, BLSTM, GRU, sRNN, LSTM, GRU, sRNN, LSTM, LSTM, GRUの組合せについて, NTSBの安全発生報告27,000件について評価した。
本研究の結果は,全モデルが87.9%以上の精度を競合的に良好に記録していることを示し,これは4クラス分類問題に対する25%のランダムな推定よりもはるかに高い値を示した。
また、高精度、リコール、F1スコアはそれぞれ80%、88%、そして85%のスコアを記録した。
sRNNはリコール(90%)と精度(90%)で他のシングルモデルよりも若干優れており、LSTMは精度(87%)で若干性能が優れていた。
関連論文リスト
- Phase of Flight Classification in Aviation Safety using LSTM, GRU, and BiLSTM: A Case Study with ASN Dataset [0.0]
本研究の目的は,NLP技術を用いて,事故後の出来事の物語から飛行の段階を推定できるかどうかを判断することである。
各種深層学習モデルの分類性能を評価した。
論文 参考訳(メタデータ) (2025-01-14T08:26:58Z) - Aviation Safety Enhancement via NLP & Deep Learning: Classifying Flight Phases in ATSB Safety Reports [0.0]
本研究では, LSTM, CNN, Bidirectional LSTM(BLSTM), Simple Recurrent Neural Networks(sRNN)を含む自然言語処理(NLP)とディープラーニングモデルを用いて, オーストラリア運輸安全局(ATSB)の安全レポートの飛行相を分類する。
LSTMは87%,88%,87%,88%であった。
論文 参考訳(メタデータ) (2025-01-14T08:18:41Z) - Natural Language Processing and Deep Learning Models to Classify Phase of Flight in Aviation Safety Occurrences [14.379311972506791]
研究者らは、自然言語処理(NLP)と人工知能(AI)モデルを使用して、安全発生の飛行フェーズを分類するテキスト物語を処理した。
NTSBによる27,000件の安全発生レポートの初期データセットを用いて、ResNetとsRNNの2つのディープラーニングモデルの分類性能を評価した。
論文 参考訳(メタデータ) (2025-01-11T15:02:49Z) - Comparative Study of Deep Learning Architectures for Textual Damage Level Classification [0.0]
本研究では、自然言語処理(NLP)とディープラーニングモデルを用いて、非構造化テキストの物語を分析することを目的とする。
LSTM, BLSTM, GRU, およびsRNN深層学習モデルを用いて, 安全発生時に発生する航空機の損傷レベルを分類する。
sRNNモデルはリコールと精度でトップパフォーマーとして登場し、驚くべき89%を誇った。
論文 参考訳(メタデータ) (2025-01-03T08:23:29Z) - Classification of Operational Records in Aviation Using Deep Learning Approaches [0.0]
本研究では,商業・軍事・民間の分類課題におけるDP(深層学習)の4つのモデルの性能評価を行った。
モデルのうち、BLSTMは72%の最高精度を達成し、安定性とバランスの取れた分類において優れた性能を示した。
CNNとsRNNは67%と69%の低い精度を示し、プライベートクラスでは大きな誤分類があった。
論文 参考訳(メタデータ) (2025-01-02T12:12:02Z) - SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection [92.38300626647342]
SEALは、二段階最適化に基づいてデータローカを学習し、安全で高品質な微調整データをランク付けし、安全でないものや低品質なものをランク付けする。
SEALで訓練されたモデルは、複数のベースラインよりも優れた品質を示し、ランダム選択に比べて8.5%と9.7%の勝利率が上昇した。
論文 参考訳(メタデータ) (2024-10-09T22:24:22Z) - What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [64.9691741899956]
安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。
これを用いて,3つのよく知られた安全微調整手法について検討する。
論文 参考訳(メタデータ) (2024-07-14T16:12:57Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - OR-Bench: An Over-Refusal Benchmark for Large Language Models [65.34666117785179]
大きな言語モデル(LLM)は、悪意のある出力を防ぐために慎重に安全アライメントを必要とする。
本研究では,大規模に有害なプロンプトを自動生成する新しい手法を提案する。
次に,8つのモデルファミリーにまたがる25のLLMの過剰拒絶量を測定するための総合的研究を行った。
論文 参考訳(メタデータ) (2024-05-31T15:44:33Z) - Predicting Overtakes in Trucks Using CAN Data [51.28632782308621]
CANデータからトラックの積載量の検出について検討する。
私たちの分析では、オーバーテイクイベントの最大10秒前をカバーしています。
我々は、オーバーテイク・トリガーに近づくと、オーバーテイク・クラスの予測スコアが増加する傾向にあることを観察する。
論文 参考訳(メタデータ) (2024-04-08T17:58:22Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。