論文の概要: Building Trust in the Skies: A Knowledge-Grounded LLM-based Framework for Aviation Safety
- arxiv url: http://arxiv.org/abs/2604.13101v1
- Date: Fri, 10 Apr 2026 12:59:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.196424
- Title: Building Trust in the Skies: A Knowledge-Grounded LLM-based Framework for Aviation Safety
- Title(参考訳): スキーにおける信頼の構築: 航空安全のための知識学習型LCMフレームワーク
- Authors: Anirudh Iyengar, Alisa Tiselska, Dumindu Samaraweera, Hong Liu,
- Abstract要約: LLM(Large Language Models)の航空安全決定への統合は、重要な技術的進歩を示している。
スタンドアローンの応用は、事実の不正確さ、幻覚、妥当性の欠如など、固有の制限のために重大なリスクを引き起こす。
本稿では,安全性分析の信頼性を高めるために,LLMと知識グラフ(KG)を組み合わせた新しいエンドツーエンドフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.177763855644263
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The integration of Large Language Models (LLMs) into aviation safety decision-making represents a significant technological advancement, yet their standalone application poses critical risks due to inherent limitations such as factual inaccuracies, hallucination, and lack of verifiability. These challenges undermine the reliability required for safety-critical environments where errors can have catastrophic consequences. To address these challenges, this paper proposes a novel, end-to-end framework that synergistically combines LLMs and Knowledge Graphs (KGs) to enhance the trustworthiness of safety analytics. The framework introduces a dual-phase pipeline: it first employs LLMs to automate the construction and dynamic updating of an Aviation Safety Knowledge Graph (ASKG) from multimodal sources. It then leverages this curated KG within a Retrieval-Augmented Generation (RAG) architecture to ground, validate, and explain LLM-generated responses. The implemented system demonstrates improved accuracy and traceability over LLM-only approaches, effectively supporting complex querying and mitigating hallucination. Results confirm the framework's capability to deliver context-aware, verifiable safety insights, addressing the stringent reliability requirements of the aviation industry. Future work will focus on enhancing relationship extraction and integrating hybrid retrieval mechanisms.
- Abstract(参考訳): LLM(Large Language Models)の航空安全決定への統合は、重要な技術的進歩を示しているが、それらのスタンドアロンの応用は、事実的不正確さ、幻覚、検証可能性の欠如といった固有の制限のために、重大なリスクをもたらす。
これらの課題は、エラーが破滅的な結果をもたらす可能性のある安全クリティカルな環境に必要な信頼性を損なう。
これらの課題に対処するために、安全分析の信頼性を高めるために、LLMと知識グラフ(KG)を相乗的に組み合わせた新しいエンドツーエンドフレームワークを提案する。
このフレームワークは、まずLLMを使用して、マルチモーダルソースからの航空安全知識グラフ(ASKG)の構築と動的更新を自動化する。
次に、このキュレートされたKGを検索型拡張生成(RAG)アーキテクチャに利用して、LLM生成応答のグラウンド、検証、説明を行う。
実装されたシステムでは,LSMのみのアプローチよりも精度とトレーサビリティが向上し,複雑なクエリと緩和幻覚を効果的にサポートしている。
結果は、航空産業の厳格な信頼性要件に対処するため、コンテキスト対応、検証可能な安全性の洞察を提供するフレームワークの能力を確認した。
今後の研究は、関係抽出の強化とハイブリッド検索機構の統合に焦点を当てる。
関連論文リスト
- Inference-Time Safety For Code LLMs Via Retrieval-Augmented Revision [3.983997834693767]
大規模言語モデル(LLM)は、高度なソフトウェア開発において、コード生成のためにますます多くデプロイされている。
LLMは、新しく発見された脆弱性やセキュリティ標準の変更に容易に適応できない。
本稿では,推論時安全機構として機能する設計による信頼に値するコード生成への原則的アプローチを提案する。
論文 参考訳(メタデータ) (2026-03-02T06:06:34Z) - SAGE-LLM: Towards Safe and Generalizable LLM Controller with Fuzzy-CBF Verification and Graph-Structured Knowledge Retrieval for UAV Decision [46.089736018739295]
大型言語モデル (LLM) には、ドメイン固有のUAV制御知識と正式な安全保証がない。
本稿では,LLMに基づく列車自由な2層決定アーキテクチャを提案し,低レベルの高精度制御と高レベルの安全計画を統合する。
論文 参考訳(メタデータ) (2026-02-27T06:41:04Z) - Leveraging the Power of Ensemble Learning for Secure Low Altitude Economy [64.39232788946173]
低高度経済(LAE)は社会福祉の強化と経済成長の推進に大きく貢献している。
本稿では,セキュアなLAEのためのアンサンブル学習,研究の焦点,解決策,ケーススタディについて検討する。
論文 参考訳(メタデータ) (2026-02-07T23:15:58Z) - Towards Verifiably Safe Tool Use for LLM Agents [53.55621104327779]
大規模言語モデル(LLM)ベースのAIエージェントは、データソース、API、検索エンジン、コードサンドボックス、さらにはその他のエージェントなどのツールへのアクセスを可能にすることで、機能を拡張する。
LLMは意図しないツールインタラクションを起動し、機密データを漏洩したり、クリティカルレコードを上書きしたりするリスクを発生させる。
モデルベースセーフガードのようなリスクを軽減するための現在のアプローチは、エージェントの信頼性を高めるが、システムの安全性を保証することはできない。
論文 参考訳(メタデータ) (2026-01-12T21:31:38Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - On the Surprising Efficacy of LLMs for Penetration-Testing [3.11537581064266]
この論文は、浸透試験におけるLarge Language Models (LLMs)の進化を徹底的にレビューする。
さまざまな攻撃的なセキュリティタスクにまたがって、彼らのアプリケーションをデモし、サイバー殺人チェーンの幅広いフェーズをカバーする。
論文では、より広範な採用と安全なデプロイメントを妨げる重要な障害を特定し、議論する。
論文 参考訳(メタデータ) (2025-07-01T15:01:18Z) - LLM Embedding-based Attribution (LEA): Quantifying Source Contributions to Generative Model's Response for Vulnerability Analysis [1.3543506826034255]
大規模言語モデル(LLM)はサイバーセキュリティの脅威分析にますます利用されているが、セキュリティに敏感な環境への展開は信頼と安全性の懸念を引き起こす。
本研究は、脆弱性攻撃分析のために生成された応答を分析するために、埋め込み属性(LEA)を提案する。
以上の結果から,LEAは大規模モデルにおいて95%以上の精度で,非検索,汎用検索,有効検索シナリオの明確な区別を検出できることを示した。
論文 参考訳(メタデータ) (2025-06-12T21:20:10Z) - Fundamental Safety-Capability Trade-offs in Fine-tuning Large Language Models [92.38300626647342]
タスク固有のデータセット上でのLLM(Fun-tuning Large Language Model)は、LLMの第一の用途である。
本稿では,LLMファインチューニング戦略の安全性と能力の相互作用を理解するための理論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-03-24T20:41:57Z) - Global Challenge for Safe and Secure LLMs Track 1 [57.08717321907755]
LLM(Global Challenge for Safe and Secure Large Language Models)は、AI Singapore(AISG)とCyberSG R&D Programme Office(CRPO)が主催する先駆的イニシアチブである。
本稿では,AI Singapore(AISG)とCyberSG R&D Programme Office(CRPO)が組織した先駆的イニシアチブであるLLM(Global Challenge for Safe and Secure Large Language Models)を紹介する。
論文 参考訳(メタデータ) (2024-11-21T08:20:31Z) - Current state of LLM Risks and AI Guardrails [0.0]
大規模言語モデル(LLM)はますます洗練され、安全性と信頼性が最優先されるセンシティブなアプリケーションに広くデプロイされるようになる。
これらのリスクは、LSMを望ましい行動と整合させ、潜在的な害を軽減するために、"ガードレール"の開発を必要とする。
本研究は,LLMの展開に伴うリスクを調査し,ガードレールの実装とモデルアライメント技術に対する現在のアプローチを評価する。
論文 参考訳(メタデータ) (2024-06-16T22:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。