論文の概要: Analyzing Aviation Safety Narratives with LDA, NMF and PLSA: A Case Study Using Socrata Datasets
- arxiv url: http://arxiv.org/abs/2501.01690v1
- Date: Fri, 03 Jan 2025 08:14:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:11:20.658774
- Title: Analyzing Aviation Safety Narratives with LDA, NMF and PLSA: A Case Study Using Socrata Datasets
- Title(参考訳): LDA, NMF, PLSAによる航空安全物語の分析:ソクラタデータセットを用いた事例研究
- Authors: Aziida Nanyonga, Graham Wild,
- Abstract要約: 本研究は,1908年から2009年までのソクラタデータセットにおけるトピックモデリング手法の適用について検討した。
この分析では、パイロットエラー、機械的故障、天候条件、訓練不足などの重要なテーマを特定した。
今後の方向性としては、追加のコンテキスト変数の統合、ニューラルトピックモデルの利用、航空安全プロトコルの強化などがある。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study explores the application of topic modelling techniques Latent Dirichlet Allocation (LDA), Nonnegative Matrix Factorization (NMF), and Probabilistic Latent Semantic Analysis (PLSA) on the Socrata dataset spanning from 1908 to 2009. Categorized by operator type (military, commercial, and private), the analysis identified key themes such as pilot error, mechanical failure, weather conditions, and training deficiencies. The study highlights the unique strengths of each method: LDA ability to uncover overlapping themes, NMF production of distinct and interpretable topics, and PLSA nuanced probabilistic insights despite interpretative complexity. Statistical analysis revealed that PLSA achieved a coherence score of 0.32 and a perplexity value of -4.6, NMF scored 0.34 and 37.1, while LDA achieved the highest coherence of 0.36 but recorded the highest perplexity at 38.2. These findings demonstrate the value of topic modelling in extracting actionable insights from unstructured aviation safety narratives, aiding in the identification of risk factors and areas for improvement across sectors. Future directions include integrating additional contextual variables, leveraging neural topic models, and enhancing aviation safety protocols. This research provides a foundation for advanced text-mining applications in aviation safety management.
- Abstract(参考訳): 本研究は、1908年から2009年までのソクラタデータセットにおける、LDA(Latent Dirichlet Allocation)、NMF(Non negative Matrix Factorization)、PLSA(Probabilistic Latent Semantic Analysis)の適用について検討した。
この分析は、操縦士のタイプ(軍事、商業、民間)によって分類され、パイロットエラー、機械的故障、気象条件、訓練不足などの重要なテーマを特定した。
この研究は、重なり合うテーマを明らかにするLDA能力、明瞭で解釈可能なトピックのNMF生成、解釈複雑性に拘わらずPLSAの予測確率的洞察など、それぞれの方法の独特な強みを強調している。
統計分析の結果、PLSAはコヒーレンススコア0.32、パープレキシティ値は-4.6、NMFは0.34、37.1、LDAは0.36、パープレキシティは38.2であった。
これらの知見は,非構造航空安全物語から行動可能な知見を抽出し,リスク要因の同定とセクター間の改善領域の同定を支援する上で,トピックモデリングの価値を示すものである。
今後の方向性としては、追加のコンテキスト変数の統合、ニューラルトピックモデルの利用、航空安全プロトコルの強化などがある。
本研究は航空安全管理における高度なテキストマイニングの基盤を提供する。
関連論文リスト
- Computational Safety for Generative AI: A Signal Processing Perspective [65.268245109828]
計算安全性は、GenAIにおける安全性の定量的評価、定式化、研究を可能にする数学的枠組みである。
ジェイルブレイクによる悪意のあるプロンプトを検出するために, 感度解析と損失景観解析がいかに有効かを示す。
我々は、AIの安全性における信号処理の鍵となる研究課題、機会、そして重要な役割について論じる。
論文 参考訳(メタデータ) (2025-02-18T02:26:50Z) - Exploring Aviation Incident Narratives Using Topic Modeling and Clustering Techniques [0.0]
本研究は,国立運輸安全委員会(NTSB)データセットに高度自然言語処理(NLP)技術を適用した。
主な目的は、潜在テーマの識別、意味的関係の探索、確率的関係の評価、共有特性に基づくクラスタインシデントである。
比較分析の結果, LDAのコヒーレンス値は0.597, pLSAは0.583, LSAは0.542, NMFは0.437であった。
論文 参考訳(メタデータ) (2025-01-14T08:23:15Z) - Comparative Study of Deep Learning Architectures for Textual Damage Level Classification [0.0]
本研究では、自然言語処理(NLP)とディープラーニングモデルを用いて、非構造化テキストの物語を分析することを目的とする。
LSTM, BLSTM, GRU, およびsRNN深層学習モデルを用いて, 安全発生時に発生する航空機の損傷レベルを分類する。
sRNNモデルはリコールと精度でトップパフォーマーとして登場し、驚くべき89%を誇った。
論文 参考訳(メタデータ) (2025-01-03T08:23:29Z) - Comparative Analysis of Topic Modeling Techniques on ATSB Text Narratives Using Natural Language Processing [0.0]
本稿では、確率的潜在意味分析(pLSA)、潜在意味分析(LSA)、潜在ディリクレ割当(LDA)、非負行列分解(NMF)の4つの顕著なトピックモデリング手法の適用について検討する。
この研究は、各技術がデータ内に潜伏するテーマ構造を明らかにする能力を調べ、安全専門家に行動可能な洞察を得るための体系的なアプローチを提供する。
論文 参考訳(メタデータ) (2025-01-02T12:21:07Z) - Explainability of Point Cloud Neural Networks Using SMILE: Statistical Model-Agnostic Interpretability with Local Explanations [0.0]
本研究は,深層ニューラルネットワーク用に設計された新たな説明可能性手法であるSMILEの実装を,ポイントクラウドベースモデルを用いて検討する。
このアプローチは、様々なカーネル幅、摂動数、クラスタリング構成における忠実度損失、R2スコア、ロバストネスの点で優れた性能を示す。
カテゴリの分類におけるデータセットバイアスをさらに特定し、安全クリティカルなアプリケーションにおいてより包括的なデータセットの必要性を強調した。
論文 参考訳(メタデータ) (2024-10-20T12:13:59Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach [64.42462708687921]
評価の結果、スケーリング、トレーニングタイプ、アーキテクチャなどの要因がLLMのパフォーマンスに大きな影響を与えていることが明らかになった。
本研究は, これらのLCMの徹底的な再検討に着手し, 現状評価手法における不整合性に着目した。
これには、ANOVA、Tukey HSDテスト、GAMM、クラスタリング技術などが含まれる。
論文 参考訳(メタデータ) (2024-03-22T14:47:35Z) - Topic Modeling Analysis of Aviation Accident Reports: A Comparative
Study between LDA and NMF Models [0.0]
本稿では、LDA(Latent Dirichlet Allocation)とNon- negative Matrix Factorization(NMF)の2つの主要なトピックモデリング手法を比較した。
LDAは、トピック内の単語間のより強い意味的関連性を示す、より高いトピックコヒーレンスを示す。
NMFは、航空事故の特定の側面についてより焦点を絞った分析を可能にする、はっきりした、きめ細かいトピックを生み出すのに優れていた。
論文 参考訳(メタデータ) (2024-03-04T01:41:07Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - A Comprehensive Survey on Source-free Domain Adaptation [69.17622123344327]
ソースフリードメイン適応(SFDA)の研究は近年注目を集めている。
SFDAの最近の進歩を包括的に調査し、それらを統一的な分類体系に整理する。
一般的な3つの分類基準で30以上のSFDA法を比較検討した。
論文 参考訳(メタデータ) (2023-02-23T06:32:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。