論文の概要: CmIVTP: Cross-modal Interaction-based Vessel Trajectory Prediction for Maritime Intelligence
- arxiv url: http://arxiv.org/abs/2605.26524v1
- Date: Tue, 26 May 2026 04:14:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.615933
- Title: CmIVTP: Cross-modal Interaction-based Vessel Trajectory Prediction for Maritime Intelligence
- Title(参考訳): CmIVTP:海事インテリジェンスのためのクロスモーダル相互作用に基づく容器軌道予測
- Authors: Yuxu Lu, Dong Yang, Xiaoyu Li, Mengwei Bao, Congcong Zhao,
- Abstract要約: そこで本稿では, 船舶力学と環境制約の複雑な相互作用をモデル化するための, クロスモーダル相互作用に基づく船舶軌道予測フレームワーク(CmIVTP)を提案する。
CmIVTPはマルチモーダル駆動型船舶軌道予測ベンチマークでより良い性能を実現する。
- 参考スコア(独自算出の注目度): 8.119468130391292
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maritime intelligent transportation systems (MITS) are essential for ensuring navigation safety and efficiency in busy waterways. However, accurate vessel trajectory prediction remains challenging due to the limitations of single-source data. Automatic identification system (AIS) data is often sparse or unavailable for small vessels, while closed-circuit television (CCTV) data alone cannot fully capture dynamic vessel behavior. To mitigate these challenges, we propose a cross-modal interaction-based vessel trajectory prediction (named CmIVTP) framework to model the intricate interactions between vessel dynamics and environmental constraints. Specifically, we introduce a target-aware scene encoder to extract scene semantic features, effectively capturing vessel-environment interactions and enhancing trajectory prediction accuracy. In addition, we propose a cross-modal interaction transformer, which integrates AIS-derived motion features, CCTV-based environmental features, and scene representations. It leverages cross-modal attention mechanisms to simultaneously capture intra-modal semantics and inter-modal interactions, ensuring dynamically consistent and environmentally feasible predictions. Furthermore, we construct a vessel group trajectory bank by clustering historical AIS trajectories into representative motion patterns, providing an efficient and scalable approach for candidate trajectory generation. Additionally, we introduce the maritime multimodal dataset plus (named Maritime-MmD$^+$), a large-scale dataset that synchronizes AIS data and CCTV video data, providing robust support for multimodal trajectory prediction research. Extensive experiments demonstrate that CmIVTP achieves better performance on multimodal-driven vessel trajectory prediction benchmarks. The code resources for this work can be available at https://github.com/LouisYxLu/CmIVTP.
- Abstract(参考訳): 海中知的輸送システム(MITS)は,交通の安全確保と交通の効率化に不可欠である。
しかし、単一ソースデータの制限のため、正確な船体軌道予測は依然として困難である。
自動識別システム(AIS)のデータは、小型船では希少または利用できないことが多いが、クローズド・サーキット・テレビ(CCTV)のデータだけでは、動的船舶の挙動を完全に把握できない。
これらの課題を緩和するために, 船舶力学と環境制約の複雑な相互作用をモデル化するための, 相互モーダル相互作用に基づく船舶軌道予測(CmIVTP)フレームワークを提案する。
具体的には,シーンのセマンティックな特徴を抽出し,船舶と環境の相互作用を効果的に捉え,軌道予測精度を向上するターゲット・アウェア・シーン・エンコーダを提案する。
さらに,AISから派生した動作特徴,CCTVに基づく環境特徴,シーン表現を統合したクロスモーダル・インタラクション・トランスフォーマを提案する。
モーダル間アテンション機構を利用して、モーダル内セマンティクスとモーダル間相互作用を同時に捕捉し、動的に一貫し、環境的に実現可能な予測を確実にする。
さらに,従来のAIS軌道を代表的な動きパターンにクラスタリングすることで,容器群軌道バンクを構築することにより,候補軌道生成のための効率的かつスケーラブルなアプローチを提供する。
さらに、AISデータとCCTVビデオデータを同期し、マルチモーダル軌道予測研究の堅牢なサポートを提供する大規模データセットである海洋マルチモーダルデータセットプラス(Maritime-MmD$^+$)を導入する。
CmIVTPはマルチモーダル駆動型船舶軌道予測ベンチマークにおいて高い性能を示す。
この作業のコードリソースはhttps://github.com/LouisYxLu/CmIVTPで入手できる。
関連論文リスト
- From Vessel Trajectories to Safety-Critical Encounter Scenarios: A Generative AI Framework for Autonomous Ship Digital Testing [4.73074147871828]
本稿では,大規模自動識別システム(AIS)トラジェクトリを構造化された安全クリティカルな遭遇シナリオに変換するデータ駆動型フレームワークを提案する。
実世界の海上交通流実験により, 提案手法は軌道の忠実度と滑らかさを向上することを示した。
論文 参考訳(メタデータ) (2026-03-30T06:14:04Z) - Unified Multimodal Vessel Trajectory Prediction with Explainable Navigation Intention [18.699213433572996]
船舶軌道予測は、インテリジェント海洋システムの基本である。
既存の船舶軌道予測手法は、限られたシナリオ適用性と説明性に乏しい。
本稿では,説明可能なナビゲーション意図を取り入れた統合型船舶軌道予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-18T08:56:30Z) - Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.1960918379255]
Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。
X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。
提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-09-25T04:59:02Z) - Multi-vessel Interaction-Aware Trajectory Prediction and Collision Risk Assessment [0.3277163122167433]
衝突リスク解析を統合した多容器軌道予測のための変圧器ベースのフレームワークを提案する。
大規模実世界のAISデータ上での連成マルチコンテナメトリクスを用いたモデルの評価を行った。
論文 参考訳(メタデータ) (2025-09-01T23:38:01Z) - Visual Trajectory Prediction of Vessels for Inland Navigation [42.81677042059531]
本研究では,高度な物体検出手法を統合することで,映像に基づく容器追跡と予測の課題に対処する。
BoT-SORT、Deep OC-SORT、ByeTrackなどの追跡アルゴリズムの比較評価では、スムーズなトラジェクトリを提供する際のカルマンフィルタの堅牢性を強調している。
この結果は、内陸航法のためのカスタマイズされたデータセットとモデルの必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-05-01T15:31:15Z) - Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。
マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。
その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文 参考訳(メタデータ) (2025-04-07T15:38:25Z) - STGDPM:Vessel Trajectory Prediction with Spatio-Temporal Graph Diffusion Probabilistic Model [0.0]
船舶軌道予測は、海上交通の安全を確保し、衝突を避けるために重要な要素である。
船舶の挙動に固有の不確実性があるため、軌道予測システムは将来的な運動状態を正確にモデル化するためのマルチモーダルなアプローチを採用する必要がある。
本稿では, 容器の状態に依存する従来の集約型手法を置き換え, 動的グラフとしての相互作用のモデル化を提案する。
論文 参考訳(メタデータ) (2025-03-11T05:50:27Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Multimodal Trajectory Prediction via Topological Invariance for
Navigation at Uncontrolled Intersections [45.508973373913946]
道路交差点において,信号機や信号機を使わずに複数の非通信的合理的エージェント間の分散ナビゲーションに着目した。
我々の重要な洞察は、交差点の幾何学的構造と、効率的に動くエージェントのインセンティブが衝突を避け(合理性)、起こりうる行動の空間を減少させるということである。
マルチエージェント交差点シーンにおける高次モードの軌道表現を再構成するデータ駆動型軌道予測機構であるMTPを設計する。
論文 参考訳(メタデータ) (2020-11-08T02:56:42Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Implicit Latent Variable Model for Scene-Consistent Motion Forecasting [78.74510891099395]
本稿では,センサデータから直接複雑な都市交通のシーン一貫性のある動き予測を学習することを目的とする。
我々は、シーンを相互作用グラフとしてモデル化し、強力なグラフニューラルネットワークを用いてシーンの分散潜在表現を学習する。
論文 参考訳(メタデータ) (2020-07-23T14:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。