論文の概要: SIA-FTP: A Spoken Instruction Aware Flight Trajectory Prediction
Framework
- arxiv url: http://arxiv.org/abs/2305.01661v1
- Date: Tue, 2 May 2023 08:28:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 17:06:37.387089
- Title: SIA-FTP: A Spoken Instruction Aware Flight Trajectory Prediction
Framework
- Title(参考訳): SIA-FTP: 飛行軌道予測フレームワークを意識したスポークインストラクション
- Authors: Dongyue Guo, Jianwei Zhang, Yi Lin
- Abstract要約: 音声通信による地上交渉は、航空交通制御(ATC)の安全と効率を確保するための重要な前提条件である。
既存の飛行軌道予測アプローチは、主に歴史的軌道の飛行状態に依存する。
SIA-FTPと呼ばれる音声命令対応FTPフレームワークが提案されている。
- 参考スコア(独自算出の注目度): 8.538029298967707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ground-air negotiation via speech communication is a vital prerequisite for
ensuring safety and efficiency in air traffic control (ATC) operations.
However, with the increase in traffic flow, incorrect instructions caused by
human factors bring a great threat to ATC safety. Existing flight trajectory
prediction (FTP) approaches primarily rely on the flight status of historical
trajectory, leading to significant delays in the prediction of real-time
maneuvering instruction, which is not conducive to conflict detection. A major
reason is that spoken instructions and flight trajectories are presented in
different modalities in the current air traffic control (ATC) system, bringing
great challenges to considering the maneuvering instruction in the FTP tasks.
In this paper, a spoken instruction-aware FTP framework, called SIA-FTP, is
innovatively proposed to support high-maneuvering FTP tasks by incorporating
instant spoken instruction. To address the modality gap and minimize the data
requirements, a 3-stage learning paradigm is proposed to implement the SIA-FTP
framework in a progressive manner, including trajectory-based FTP pretraining,
intent-oriented instruction embedding learning, and multi-modal finetuning.
Specifically, the FTP model and the instruction embedding with maneuvering
semantics are pre-trained using volumes of well-resourced trajectory and text
data in the 1st and 2nd stages. In succession, a multi-modal fusion strategy is
proposed to incorporate the pre-trained instruction embedding into the FTP
model and integrate the two pre-trained networks into a joint model. Finally,
the joint model is finetuned using the limited trajectory-instruction data to
enhance the FTP performance within maneuvering instruction scenarios. The
experimental results demonstrated that the proposed framework presents an
impressive performance improvement in high-maneuvering scenarios.
- Abstract(参考訳): 音声通信による地上交渉は、航空交通制御(ATC)の安全と効率を確保するための重要な前提条件である。
しかし、交通流の増加に伴い、人的要因による誤った指示はATCの安全性に大きな脅威をもたらす。
既存の飛行軌道予測(FTP)アプローチは、主に歴史的軌道の飛行状態に依存しており、衝突検出には適さないリアルタイム操縦命令の予測にかなりの遅延をもたらす。
主な理由は、現在の航空交通管制(ATC)システムにおいて、音声指示と飛行軌跡が異なるモードで提示されることであり、FTPタスクの操作命令を考える上で大きな課題となっている。
本稿では,SIA-FTPと呼ばれる音声命令対応FTPフレームワークを革新的に提案し,即時音声命令を組み込むことで高調なFTPタスクを支援する。
モダリティギャップに対処し,データ要求を最小化するために,軌道ベースFTP事前学習,意図指向型命令埋め込み学習,マルチモーダル微調整など,SIA-FTPフレームワークを段階的に実装する3段階学習パラダイムを提案する。
具体的には、FTPモデルと操作意味論を組み込んだ命令埋め込みを、第1段階と第2段階の十分な出力軌跡とテキストデータを用いて事前訓練する。
次いで, FTPモデルに事前学習した命令を埋め込み, 2つの事前学習したネットワークをジョイントモデルに統合するためのマルチモーダル融合戦略を提案する。
最後に、関節モデルを限られた軌道指示データを用いて微調整し、操作的命令シナリオにおけるFTP性能を向上させる。
実験結果から,提案フレームワークは高効率シナリオにおいて印象的な性能改善が得られた。
関連論文リスト
- FedAuxHMTL: Federated Auxiliary Hard-Parameter Sharing Multi-Task Learning for Network Edge Traffic Classification [9.816810723612653]
本稿では,FedAuxHMTLという,多タスク学習のための補助的ハードパラメータ共有フレームワークを提案する。
エッジサーバとベースステーション間のモデルパラメータ交換を取り入れ、分散領域のベースステーションがFedAuxHMTLプロセスに参加することを可能にする。
実験により,FedAuxHMTLの有効性を,精度,全地球的損失,通信コスト,計算時間,エネルギー消費の観点から検証し,実証した。
論文 参考訳(メタデータ) (2024-04-11T16:23:28Z) - Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。
近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。
本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文 参考訳(メタデータ) (2024-01-10T01:50:29Z) - Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - SEPT: Towards Efficient Scene Representation Learning for Motion
Prediction [19.111948522155004]
本稿では,自己教師付き学習を活用し,複雑な交通シーンのための強力なモデルを開発するためのモデリングフレームワークSEPTを提案する。
実験により、SEPTはアーキテクチャ設計や機能エンジニアリングを伴わず、Argoverse 1 と Argoverse 2 のモーション予測ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-09-26T21:56:03Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - A Non-autoregressive Multi-Horizon Flight Trajectory Prediction Framework with Gray Code Representation [11.29608316753389]
FlightBERT++と呼ばれる新しいフレームワークが提案されている。
提案するフレームワークは,汎用エンコーダデコーダアーキテクチャによって実装されている。
実験の結果,提案フレームワークはFTP性能と計算効率の両面において,競合する基本性能を上回る性能を示した。
論文 参考訳(メタデータ) (2023-05-02T04:11:23Z) - Online Spatio-Temporal Correlation-Based Federated Learning for Traffic
Flow Forecasting [11.253575460227127]
本稿では,FLフレームワークにおけるオンライン学習(OL)方式を用いた交通流の予測に関する最初の研究を行う。
次に,オンライン時空間相関に基づくフェデレート学習(FedOSTC)という新しい予測手法を提案する。
論文 参考訳(メタデータ) (2023-02-17T02:37:36Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Language-guided Navigation via Cross-Modal Grounding and Alternate
Adversarial Learning [66.9937776799536]
新たなビジョン・アンド・ランゲージナビゲーション(VLN)問題は、見えない写真リアリスティック環境において、エージェントがターゲットの場所に向かうことを学習することを目的としている。
VLNの主な課題は、主に2つの側面から生じている: まず、エージェントは動的に変化する視覚環境に対応する言語命令の有意義な段落に出席する必要がある。
そこで本稿では,エージェントにテキストと視覚の対応性を追跡する機能を持たせるために,クロスモーダルグラウンドモジュールを提案する。
論文 参考訳(メタデータ) (2020-11-22T09:13:46Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。