論文の概要: Vision-Language Modeling with Regularized Spatial Transformer Networks for All Weather Crosswind Landing of Aircraft
- arxiv url: http://arxiv.org/abs/2405.05574v2
- Date: Sat, 16 Nov 2024 14:49:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:29:21.129051
- Title: Vision-Language Modeling with Regularized Spatial Transformer Networks for All Weather Crosswind Landing of Aircraft
- Title(参考訳): 航空機全天候クロスウインドランディングのための正規化空間変圧器ネットワークを用いた視覚言語モデル
- Authors: Debabrata Pal, Anvita Singh, Saumya Saumya, Shouvik Das,
- Abstract要約: 気象によって引き起こされる視覚劣化をクリアするために訓練された視覚ベースのシステムは、様々な気候条件下で堅牢な着陸データセットを必要とする。
本稿では,迅速な気候拡散ネットワークを訓練し,厳しい気象画像の合成を提案する。
また、新しい拡散蒸留損失を用いた気象蒸留モデルの最適化を行い、これらの視覚的劣化を解明する。
- 参考スコア(独自算出の注目度): 0.3749861135832073
- License:
- Abstract: The intrinsic capability of the Human Vision System (HVS) to perceive depth of field and failure of Instrument Landing Systems (ILS) stimulates a pilot to perform a vision-based manual landing over an autoland approach. However, harsh weather creates challenges, and a pilot must have a clear view of runway elements before the minimum decision altitude. To aid in manual landing, a vision-based system trained to clear weather-induced visual degradations requires a robust landing dataset under various climatic conditions. Nevertheless, to acquire a dataset, flying an aircraft in dangerous weather impacts safety. Also, this system fails to generate reliable warnings, as localization of runway elements suffers from projective distortion while landing at crosswind. To combat, we propose to synthesize harsh weather landing images by training a prompt-based climatic diffusion network. Also, we optimize a weather distillation model using a novel diffusion-distillation loss to learn to clear these visual degradations. Precisely, the distillation model learns an inverse relationship with the diffusion network. Inference time, pre-trained distillation network directly clears weather-impacted onboard camera images, which can be further projected to display devices for improved visibility.Then, to tackle crosswind landing, a novel Regularized Spatial Transformer Networks (RuSTaN) module accurately warps landing images. It minimizes the localization error of runway object detector and helps generate reliable internal software warnings. Finally, we curated an aircraft landing dataset (AIRLAD) by simulating a landing scenario under various weather degradations and experimentally validated our contributions.
- Abstract(参考訳): HVS(Human Vision System)は、インスツルメンテーション・ランディング・システム(ILS)の被写界深度と故障を知覚する能力を持つ。
しかし、厳しい天候は困難を生じさせ、パイロットは最低判定高度の前に滑走路要素を明確に把握しなければならない。
手動での着陸を支援するために、気象によって引き起こされる視覚劣化をクリアするために訓練された視覚ベースのシステムは、様々な気候条件下で堅牢な着陸データセットを必要とする。
それでも、データセットを取得するために、危険な天候下で航空機を飛行することは安全性に影響を及ぼす。
また、滑走路要素の局所化は、横風に着陸する際の射影歪みに悩まされるため、このシステムは信頼性の高い警告を生成することができない。
そこで本研究では,迅速な気候拡散ネットワークを訓練することにより,厳しい気象画像の合成を提案する。
また、新しい拡散蒸留損失を用いた気象蒸留モデルの最適化を行い、これらの視覚的劣化を解明する。
正確には、蒸留モデルは拡散ネットワークとの逆関係を学習する。
予測時間では,事前学習した蒸留ネットワークは,気象の影響を受けやすいカメラ画像を直接クリアし,さらに可視性向上のためのデバイスを表示できるように投影し,また,クロスウインドランディングに取り組むために,新しい正則型空間変圧器ネットワーク(RuSTaN)モジュールが正確な着陸画像のワープを行う。
ランウェイオブジェクト検出器のローカライズエラーを最小限に抑え、信頼性の高い内部ソフトウェア警告を生成するのに役立つ。
最後に,各種気象条件下での着陸シナリオをシミュレーションし,航空機着陸データセット(AIRLAD)をキュレートし,その貢献を実験的に検証した。
関連論文リスト
- Power Line Aerial Image Restoration under dverse Weather: Datasets and Baselines [17.3009572002435]
電力線自律検査(PLAI)はスマートグリッドの構築において重要な役割を果たす。
PLAIはUAVが捉えた空中画像の電気成分と欠陥を正確に検出して完成する。
航空画像の可視的品質は、ヘイズ、雨、雪などの悪天候によって必然的に劣化し、我々の研究で検出精度を劇的に低下させることが判明した。
本稿では,悪天候の劣化画像から清潔で高品質な画像の復元を目的とした,逆気象下での電力線動画像復元(PLAIR-AW)の課題を提案する。
論文 参考訳(メタデータ) (2024-09-07T12:53:05Z) - Genuine Knowledge from Practice: Diffusion Test-Time Adaptation for
Video Adverse Weather Removal [53.15046196592023]
ビデオの悪天候除去におけるテスト時間適応について紹介する。
本稿では,テスト時間適応を反復拡散逆プロセスに統合する最初のフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-12T14:21:30Z) - Aircraft Landing Time Prediction with Deep Learning on Trajectory Images [18.536109188450876]
本研究では、終端空域(TMA)をカバーする研究空域に突入する航空機のALTを予測するために、軌道画像に基づく深層学習手法を提案する。
軌道画像には航空機の位置、速度、進路、相対距離、到着する交通の流れなど様々な情報が含まれている。
また,軌道データから得られた実時間滑走路の利用状況と,航空機の種類や気象条件などの外部情報を付加入力として利用する。
論文 参考訳(メタデータ) (2024-01-02T07:56:05Z) - Exploring the Application of Large-scale Pre-trained Models on Adverse
Weather Removal [97.53040662243768]
ネットワークが異なる気象条件を適応的に処理できるようにするために,CLIP埋め込みモジュールを提案する。
このモジュールは、CLIP画像エンコーダによって抽出されたサンプル特定気象と、パラメータセットによって学習された分布特定情報を統合する。
論文 参考訳(メタデータ) (2023-06-15T10:06:13Z) - ScatterNeRF: Seeing Through Fog with Physically-Based Inverse Neural
Rendering [83.75284107397003]
本稿では,シーンをレンダリングし,霧のない背景を分解するニューラルネットワークレンダリング手法であるScatterNeRFを紹介する。
本研究では,散乱量とシーンオブジェクトの非絡み合い表現を提案し,物理に着想を得た損失を伴ってシーン再構成を学習する。
マルチビューIn-the-Wildデータをキャプチャして,大規模な霧室内でのキャプチャを制御し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-05-03T13:24:06Z) - Inferring Traffic Models in Terminal Airspace from Flight Tracks and
Procedures [52.25258289718559]
本稿では,レーダ監視データから収集したプロシージャデータとフライトトラックから可変性を学習可能な確率モデルを提案する。
任意の航空機数を含む交通量を生成するために,ペアワイズモデルを用いる方法を示す。
論文 参考訳(メタデータ) (2023-03-17T13:58:06Z) - Aerial Diffusion: Text Guided Ground-to-Aerial View Translation from a
Single Image using Diffusion Models [72.76182801289497]
そこで本研究では,テキストガイダンスを用いて1つの地上画像から空中映像を生成する新しい手法であるAerial Diffusionを提案する。
地上ビューと空中ビューのドメインギャップに対応する2つの主な課題に対処する。
航空拡散(Aerial Diffusion)は、地上から航空への翻訳を教師なしで行う最初のアプローチである。
論文 参考訳(メタデータ) (2023-03-15T22:26:09Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - PlaneDepth: Self-supervised Depth Estimation via Orthogonal Planes [41.517947010531074]
複数の前頭平行面に基づく深度推定は、自己教師付き単眼深度推定(MDE)において顕著な結果を示した
本研究では,垂直面と接地面を含む新しい平面ベースプレゼンテーションであるPlaneDepthを提案する。
本手法は, 自律走行において重要な, 教師なしの方法で地上面を抽出することができる。
論文 参考訳(メタデータ) (2022-10-04T13:51:59Z) - Phased Flight Trajectory Prediction with Deep Learning [8.898269198985576]
過去10年間で民間航空会社や民間機が前例のない増加を遂げたことは、航空交通管理の課題となっている。
正確な飛行軌跡予測は、安全かつ秩序ある飛行の決定に寄与する航空輸送管理において非常に重要である。
本研究では,大型旅客・輸送航空機の飛行軌道予測における最先端手法よりも優れた位相付き飛行軌道予測フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-17T02:16:02Z) - Predicting Flight Delay with Spatio-Temporal Trajectory Convolutional
Network and Airport Situational Awareness Map [20.579487904188802]
空港に適用可能な高い予測精度を実現するためのビジョンベースソリューションを提案する。
本稿では,状況認識マップから空間的情報と時間的情報の両方をキャプチャする,エンドツーエンドのディープラーニングアーキテクチャであるTrajCNNを提案する。
提案手法は,ロサンゼルス国際空港での発着遅延の予測に有効である(約18分遅れ)。
論文 参考訳(メタデータ) (2021-05-19T07:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。