論文の概要: Real-Time Fusion of Visual and Chart Data for Enhanced Maritime Vision
- arxiv url: http://arxiv.org/abs/2507.13880v1
- Date: Fri, 18 Jul 2025 12:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.288954
- Title: Real-Time Fusion of Visual and Chart Data for Enhanced Maritime Vision
- Title(参考訳): 海面視力向上のための視覚・チャートデータのリアルタイム融合
- Authors: Marten Kreis, Benjamin Kiefer,
- Abstract要約: 本稿では,海図情報とリアルタイム視覚データを融合させることにより,海洋視力を高める新しい手法を提案する。
本システムは,ブイ等の検出された航法補助具と,それに対応するグラフデータとを正確にマッチングすることにより,海図データをライブビデオフィードにオーバーレイする。
- 参考スコア(独自算出の注目度): 2.14769181770878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel approach to enhancing marine vision by fusing real-time visual data with chart information. Our system overlays nautical chart data onto live video feeds by accurately matching detected navigational aids, such as buoys, with their corresponding representations in chart data. To achieve robust association, we introduce a transformer-based end-to-end neural network that predicts bounding boxes and confidence scores for buoy queries, enabling the direct matching of image-domain detections with world-space chart markers. The proposed method is compared against baseline approaches, including a ray-casting model that estimates buoy positions via camera projection and a YOLOv7-based network extended with a distance estimation module. Experimental results on a dataset of real-world maritime scenes demonstrate that our approach significantly improves object localization and association accuracy in dynamic and challenging environments.
- Abstract(参考訳): 本稿では,リアルタイムの視覚データをチャート情報と融合させることにより,海洋視力を高める新しい手法を提案する。
本システムは,ブイ等の検出された航法補助具と,それに対応するグラフデータとを正確にマッチングすることにより,海図データをライブビデオフィードにオーバーレイする。
本研究では,ロバストな関連性を実現するために,ブイクエリのバウンディングボックスと信頼スコアを予測するトランスフォーマーに基づくエンドツーエンドニューラルネットワークを導入し,画像領域検出とワールドスペースチャートマーカーとの直接マッチングを可能にする。
提案手法は,カメラ投影によりブイ位置を推定するレイキャストモデルや,距離推定モジュールで拡張したYOLOv7ベースのネットワークなど,ベースラインアプローチと比較する。
実世界の海洋シーンのデータセットによる実験結果から,本手法は動的・挑戦的な環境における物体の局所化と相関精度を著しく向上することが示された。
関連論文リスト
- RelMap: Reliable Spatiotemporal Sensor Data Visualization via Imputative Spatial Interpolation [18.947107160943595]
本稿では、信頼性の高い結果を得るとともに、不確実性のある新しいヒートマップ表現を生成する、新しい短時間データパイプラインを提案する。
我々は、ニューラルネットワーク(GNN)の計算を利用して、可視化の信頼性と時間分解能を高める。
論文 参考訳(メタデータ) (2025-08-02T07:25:23Z) - Scalable Dynamic Origin-Destination Demand Estimation Enhanced by High-Resolution Satellite Imagery Data [1.735650011442274]
本研究では,マルチクラスメソスコピックネットワークモデルにおける動的起因決定需要推定(DODE)のための新しい枠組みを提案する。
ローカルセンサからの従来の交通データとともに高解像度衛星画像を利用する。
その結果,衛星から得られる密度で従来のデータを補うことで推定性能が大幅に向上した。
論文 参考訳(メタデータ) (2025-06-25T06:47:06Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Image and AIS Data Fusion Technique for Maritime Computer Vision
Applications [1.482087972733629]
本研究では,AIS(Automatic Identification System)データと画像に検出された容器を融合させてデータセットを作成する手法を開発した。
提案手法は, 距離と方位を推定することにより, 検出した船舶を対応するAISメッセージに関連付ける。
この技術は、水路交通管理、遭遇検知、監視のためのデータセットを作成するのに有用である。
論文 参考訳(メタデータ) (2023-12-07T20:54:49Z) - Velocity-Based Channel Charting with Spatial Distribution Map Matching [4.913210912019975]
指紋による位置決めによる位置決め性能の向上は,NLoS(N-line-of-sight)が室内環境を支配下に置く上での課題である。
チャネルチャーティングは、記録された無線信号と相対座標を暗黙的に関連付けるため、このラベル付けの労力を避ける。
モデルの最新状態を維持するために参照位置を必要としない新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-14T09:21:09Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - An Online Semantic Mapping System for Extending and Enhancing Visual
SLAM [2.538209532048867]
本稿では,2次元から3次元の物体検出パイプラインと,生成されたランドマークの高速なデータアソシエーションを用いた,移動型視覚システムのためのリアルタイムセマンティックマッピング手法を提案する。
我々のシステムは,65msの平均反復時間でリアルタイムに到達し,公開データセット上での最先端SLAMのポーズ推定を最大68%向上させることができる。
論文 参考訳(メタデータ) (2022-03-08T09:14:37Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Radar-based Dynamic Occupancy Grid Mapping and Object Detection [55.74894405714851]
近年、古典的占有グリッドマップのアプローチが動的占有グリッドマップに拡張されている。
本稿では,従来のアプローチのさらなる発展について述べる。
複数のレーダセンサのデータを融合し、グリッドベースの物体追跡・マッピング手法を適用する。
論文 参考訳(メタデータ) (2020-08-09T09:26:30Z) - A Neural Architecture for Detecting Confusion in Eye-tracking Data [1.8655840060559168]
我々は、RNNとCNNのサブモデルを並列に使用して、データの時間的・空間的側面を活用するアーキテクチャを提案する。
本モデルでは,Random Forestsをベースとした既存モデルよりも22%の感度・特異性が向上した。
論文 参考訳(メタデータ) (2020-03-13T18:20:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。