論文の概要: AviationLMM: A Large Multimodal Foundation Model for Civil Aviation
- arxiv url: http://arxiv.org/abs/2601.09105v2
- Date: Fri, 16 Jan 2026 04:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 14:30:44.040271
- Title: AviationLMM: A Large Multimodal Foundation Model for Civil Aviation
- Title(参考訳): AviationLMM:民間航空のための大規模マルチモーダル基礎モデル
- Authors: Wenbin Li, Jingling Wu, Xiaoyong Lin. Jing Chen, Cong Chen,
- Abstract要約: 本稿では,民間航空のための大規模マルチモーダル基盤モデルであるAviationLMMのビジョンを紹介する。
本稿では, 地上音声, 監視, オンボードテレメトリ, ビデオ, 構造化テキストなどのマルチモーダル入力を取り入れたモデルアーキテクチャについて述べる。
データ取得、アライメントと融合、事前訓練、推論、信頼性、プライバシー、欠落したモダリティに対する堅牢性、合成シナリオ生成など、対処すべき重要な研究機会を特定します。
- 参考スコア(独自算出の注目度): 4.416746793380407
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Civil aviation is a cornerstone of global transportation and commerce, and ensuring its safety, efficiency and customer satisfaction is paramount. Yet conventional Artificial Intelligence (AI) solutions in aviation remain siloed and narrow, focusing on isolated tasks or single modalities. They struggle to integrate heterogeneous data such as voice communications, radar tracks, sensor streams and textual reports, which limits situational awareness, adaptability, and real-time decision support. This paper introduces the vision of AviationLMM, a Large Multimodal foundation Model for civil aviation, designed to unify the heterogeneous data streams of civil aviation and enable understanding, reasoning, generation and agentic applications. We firstly identify the gaps between existing AI solutions and requirements. Secondly, we describe the model architecture that ingests multimodal inputs such as air-ground voice, surveillance, on-board telemetry, video and structured texts, and performs cross-modal alignment and fusion, and produces flexible outputs ranging from situation summaries and risk alerts to predictive diagnostics and multimodal incident reconstructions. In order to fully realize this vision, we identify key research opportunities to address, including data acquisition, alignment and fusion, pretraining, reasoning, trustworthiness, privacy, robustness to missing modalities, and synthetic scenario generation. By articulating the design and challenges of AviationLMM, we aim to boost the civil aviation foundation model progress and catalyze coordinated research efforts toward an integrated, trustworthy and privacy-preserving aviation AI ecosystem.
- Abstract(参考訳): 民間航空はグローバル輸送と商業の基盤であり、安全、効率、顧客満足度が最重要である。
しかし、航空における従来の人工知能(AI)ソリューションは、孤立したタスクや単一のモダリティに焦点を絞って、サイロ化され、狭いままである。
彼らは、音声コミュニケーション、レーダートラック、センサーストリーム、テキストレポートなどの異種データを統合するのに苦労し、状況認識、適応性、リアルタイム意思決定のサポートを制限する。
本稿では, 民間航空の異種データストリームを統一し, 理解, 推論, 生成, エージェントアプリケーションを実現するために設計された, 民間航空のための大規模マルチモーダル基盤モデルであるAviationLMMのビジョンを紹介する。
まず、既存のAIソリューションと要件のギャップを特定します。
次に, 地上音声, 監視, テレメトリ, ビデオ, 構造化テキストなどのマルチモーダル入力を取り込み, クロスモーダルアライメントと融合を行い, 状況要約や危険警報から予測診断, マルチモーダルインシデント再構築に至るまで, 柔軟な出力を生成するモデルアーキテクチャについて述べる。
このビジョンを完全に実現するために、私たちは、データ取得、アライメントと融合、事前訓練、推論、信頼性、プライバシー、欠落したモダリティに対する堅牢性、合成シナリオ生成など、対処すべき重要な研究機会を特定します。
航空LMMの設計と課題を明確にすることにより、民間航空基盤モデルの進歩を促進し、統合され、信頼性が高く、プライバシーに配慮した航空AIエコシステムに向けた協調研究の取り組みを促進することを目指している。
関連論文リスト
- Forging Spatial Intelligence: A Roadmap of Multi-Modal Data Pre-Training for Autonomous Systems [75.78934957242403]
自動運転車とドローンは、マルチモーダル搭載センサーデータから真の空間情報を必要とする。
本稿では,この目標に向かって進む中核的な技術群を同定し,マルチモーダル・プレトレーニングのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-30T17:58:01Z) - AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios [64.51320327698231]
UAVシナリオにおける最初の大規模RMOTベンチマークであるAerialMindを紹介する。
我々は、革新的な半自動協調型エージェントベースラベリングアシスタントフレームワークを開発した。
また,視覚言語表現学習を協調的に強化する新しい手法であるHawkEyeTrackを提案する。
論文 参考訳(メタデータ) (2025-11-26T04:44:27Z) - All You Need for Object Detection: From Pixels, Points, and Prompts to Next-Gen Fusion and Multimodal LLMs/VLMs in Autonomous Vehicles [7.863490977061713]
自律走行車(AV)は、インテリジェントな認識、意思決定、制御システムの進歩を通じて、交通の未来を変えつつある。
彼らの成功は、複雑でマルチモーダルな環境での信頼性の高いオブジェクト検出という、ひとつのコア能力と結びついている。
コンピュータビジョン(CV)と人工知能(AI)の最近の進歩は目覚ましい進歩をもたらした。
この調査は、AVにおける物体検出の前方的な分析を提供することによって、そのギャップを埋める。
論文 参考訳(メタデータ) (2025-10-30T16:08:25Z) - Integrating Neurosymbolic AI in Advanced Air Mobility: A Comprehensive Survey [19.989015008002056]
ニューロシンボリックAIは、ニューラルネットワーク適応性とシンボリック推論を組み合わせる。
この調査は、主要なAdvanced Air Mobilityドメインにわたるアプリケーションについてレビューする。
我々は、現在の進歩を分類し、関連するケーススタディを提示し、今後の研究方向性を概説する。
論文 参考訳(メタデータ) (2025-08-10T03:30:06Z) - Agentic Satellite-Augmented Low-Altitude Economy and Terrestrial Networks: A Survey on Generative Approaches [76.12691010182802]
本調査は,衛星搭載低高度経済と地上ネットワーク(SLAETN)におけるエージェント人工知能(AI)の実現に焦点をあてる。
SLAETNのアーキテクチャと特徴を紹介するとともに,衛星,空中,地上コンポーネントの統合において生じる課題を分析する。
これらのモデルが,コミュニケーション強化,セキュリティとプライバシ保護,インテリジェントな衛星タスクという,3つの領域にわたるエージェント機能をどのように強化するかを検討する。
論文 参考訳(メタデータ) (2025-07-19T14:07:05Z) - UAVs Meet Agentic AI: A Multidomain Survey of Autonomous Aerial Intelligence and Agentic UAVs [0.36868085124383626]
エージェントUAVは、ゴール駆動行動、文脈推論、対話的自律性を示すことによって、従来のUAVを上回る。
本研究では, 精密農業, 建設・鉱業, 災害対応, 環境モニタリング, インフラ検査, 物流, セキュリティ, 野生生物保護の7分野について検討した。
論文 参考訳(メタデータ) (2025-06-08T01:39:51Z) - Generative AI for Autonomous Driving: Frontiers and Opportunities [145.6465312554513]
この調査は、自律運転スタックにおけるGenAIの役割の包括的合成を提供する。
まず、VAE、GAN、拡散モデル、および大規模言語モデルを含む、現代の生成モデリングの原則とトレードオフを蒸留することから始めます。
我々は、合成データ一般化、エンドツーエンド駆動戦略、高忠実なデジタルツインシステム、スマートトランスポートネットワーク、具体化されたAIへのクロスドメイン転送など、実用的な応用を分類する。
論文 参考訳(メタデータ) (2025-05-13T17:59:20Z) - Probabilistic Mission Design in Neuro-Symbolic Systems [19.501311018760177]
Probabilistic Mission Design (ProMis)は、地理空間と感覚データを宣言型ハイブリッド確率論理プログラム(HPLP)に結びつけるシステムアーキテクチャである。
ProMisは確率的ミッションランドスケープ(Probabilistic Mission Landscapes, PML)を生成する。
本稿では,Large Language Models(LLM)やTransformerベースの視覚モデルなど,強力な機械学習モデルとの統合について述べる。
論文 参考訳(メタデータ) (2024-12-25T11:04:00Z) - Large Language Models for UAVs: Current State and Pathways to the Future [6.85423435360359]
無人航空機(UAV)は様々な分野にまたがるトランスフォーメーション技術として登場した。
この研究は、自律システムの開発を促進するために、UAVとLarge Language Models(LLM)を統合する大きな可能性を探求する。
論文 参考訳(メタデータ) (2024-05-02T21:30:10Z) - Data-Driven Aerospace Engineering: Reframing the Industry with Machine
Learning [49.367020832638794]
航空宇宙産業は、ビッグデータと機械学習を収益化しようとしている。
最近のトレンドは、設計、製造、検証、サービスにおける重要な課題の文脈で検討される。
論文 参考訳(メタデータ) (2020-08-24T22:40:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。