Fugu-MT 論文翻訳(概要): Fusing Monocular RGB Images with AIS Data to Create a 6D Pose Estimation Dataset for Marine Vessels

論文の概要: Fusing Monocular RGB Images with AIS Data to Create a 6D Pose Estimation Dataset for Marine Vessels

arxiv url: http://arxiv.org/abs/2508.14767v1
Date: Wed, 20 Aug 2025 15:16:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-21 16:52:41.495523
Title: Fusing Monocular RGB Images with AIS Data to Create a 6D Pose Estimation Dataset for Marine Vessels
Title（参考訳）: AISデータによる単眼RGB画像の融合による船舶用6次元空間推定データセットの作成
Authors: Fabian Holst, Emre Gülsoylu, Simone Frintrop,
Abstract要約: 本稿では,単眼RGB画像とAISデータとを融合させることで,海洋生物の6次元ポーズ推定データセットを作成する手法を提案する。提案手法は,手動のアノテーションを必要とせずに,6次元ポーズ推定データセットの作成を可能にする。ポーズ推定のための3Dバウンディングボックスアノテーションを備えた3753画像からなる公開データセットであるNordelbe Kehrwieder(BONK-pose)について紹介する。
参考スコア（独自算出の注目度）: 2.6654260060295134
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: The paper presents a novel technique for creating a 6D pose estimation dataset for marine vessels by fusing monocular RGB images with Automatic Identification System (AIS) data. The proposed technique addresses the limitations of relying purely on AIS for location information, caused by issues like equipment reliability, data manipulation, and transmission delays. By combining vessel detections from monocular RGB images, obtained using an object detection network (YOLOX-X), with AIS messages, the technique generates 3D bounding boxes that represent the vessels' 6D poses, i.e. spatial and rotational dimensions. The paper evaluates different object detection models to locate vessels in image space. We also compare two transformation methods (homography and Perspective-n-Point) for aligning AIS data with image coordinates. The results of our work demonstrate that the Perspective-n-Point (PnP) method achieves a significantly lower projection error compared to homography-based approaches used before, and the YOLOX-X model achieves a mean Average Precision (mAP) of 0.80 at an Intersection over Union (IoU) threshold of 0.5 for relevant vessel classes. We show indication that our approach allows the creation of a 6D pose estimation dataset without needing manual annotation. Additionally, we introduce the Boats on Nordelbe Kehrwieder (BONK-pose), a publicly available dataset comprising 3753 images with 3D bounding box annotations for pose estimation, created by our data fusion approach. This dataset can be used for training and evaluating 6D pose estimation networks. In addition we introduce a set of 1000 images with 2D bounding box annotations for ship detection from the same scene.
Abstract（参考訳）: 本稿では,単眼RGB画像にAIS(Automatic Identification System)データを加えることにより,海洋生物の6次元ポーズ推定データセットを作成する手法を提案する。提案手法は,機器の信頼性,データ操作,送信遅延といった問題に起因する位置情報に対するAISへの依存の限界に対処する。物体検出ネットワーク(YOLOX-X)を用いて得られた単眼RGB画像からの容器検出とAISメッセージを組み合わせることで、容器の6Dポーズ、すなわち空間次元と回転次元を表す3D境界ボックスを生成する。本論文は,画像空間内の容器の位置を特定するために,異なる物体検出モデルを評価する。また、AISデータを画像座標と整合させる2つの変換法(ホモグラフィーとパースペクティブ-n-Point)を比較した。本研究の結果から,PnP法はホモグラフィに基づく手法に比べてプロジェクション誤差が有意に小さく,YOLOX-Xモデルでは平均平均精度が0.80であり,IoU法では0.5の範囲で平均精度が0.80であることがわかった。提案手法は,手動のアノテーションを必要とせずに6次元ポーズ推定データセットを作成できることを示す。さらに,3次元境界ボックスアノテーションを付加した3753個の画像からなる公開データセットであるNordelbe Kehrwieder (BONK-pose) について紹介した。このデータセットは、6Dポーズ推定ネットワークのトレーニングと評価に使用することができる。また,同一シーンから船舶を検知するための2次元バウンディングボックスアノテーション付き1000枚の画像も紹介する。

関連論文リスト

Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。提案手法を5つの挑戦的データセットで評価する。
論文参考訳（メタデータ） (2025-03-24T13:46:21Z)
A Novel Convolution and Attention Mechanism-based Model for 6D Object Pose Estimation [49.1574468325115]
RGB画像から6Dオブジェクトのポーズを推定することは、深度情報の欠如が2次元投影から3次元構造を推定する必要があるため困難である。従来の手法はグリッドベースのデータ構造によるディープラーニングに頼っていることが多いが、抽出された機能間の複雑な依存関係を捉えるのに苦労している。本稿では,各画素の時間的特徴がノードとして機能し,それらの関係はノード接続や空間的相互作用を通じて定義される,画像から直接のグラフベース表現を提案する。
論文参考訳（メタデータ） (2024-12-31T18:47:54Z)
DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文参考訳（メタデータ） (2024-03-20T15:41:32Z)
Image and AIS Data Fusion Technique for Maritime Computer Vision Applications [1.482087972733629]
本研究では,AIS(Automatic Identification System)データと画像に検出された容器を融合させてデータセットを作成する手法を開発した。提案手法は, 距離と方位を推定することにより, 検出した船舶を対応するAISメッセージに関連付ける。この技術は、水路交通管理、遭遇検知、監視のためのデータセットを作成するのに有用である。
論文参考訳（メタデータ） (2023-12-07T20:54:49Z)
RGB-based Category-level Object Pose Estimation via Decoupled Metric Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文参考訳（メタデータ） (2023-09-19T02:20:26Z)
Pseudo Flow Consistency for Self-Supervised 6D Object Pose Estimation [14.469317161361202]
補助情報なしで純粋なRGB画像で訓練できる6次元オブジェクトポーズ推定法を提案する。提案手法を3つの挑戦的データセット上で評価し,最先端の自己管理手法よりも優れていることを示す。
論文参考訳（メタデータ） (2023-08-19T13:52:18Z)
PoET: Pose Estimation Transformer for Single-View, Multi-Object 6D Pose Estimation [6.860183454947986]
本稿では、RGB画像を入力とし、画像内の各オブジェクトに対する6Dポーズを予測するトランスフォーマーベースのアプローチを提案する。画像のほかに、深度マップや3Dオブジェクトモデルなどの追加情報も不要です。挑戦的なYCB-Vデータセットに対するRGBのみのアプローチの最先端結果を得る。
論文参考訳（メタデータ） (2022-11-25T14:07:14Z)
FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文参考訳（メタデータ） (2021-03-12T03:07:24Z)
L6DNet: Light 6 DoF Network for Robust and Precise Object Pose Estimation with Small Datasets [0.0]
1枚のRGB-D画像から6つのDoFオブジェクトのポーズ推定を行う新しい手法を提案する。データ駆動と幾何学という2段階のハイブリッドパイプラインを採用しています。私たちのアプローチは最先端の手法よりも堅牢で正確です。
論文参考訳（メタデータ） (2020-02-03T17:41:29Z)
Simultaneous 3D Object Segmentation and 6-DOF Pose Estimation [0.7252027234425334]
純粋な3次元点雲シーンにおける3次元オブジェクト分割と6-DOFポーズ推定を同時に行う手法を提案する。提案手法の重要な構成要素は,純3次元点群における3次元オブジェクト分割と6-DOFポーズ推定を同時に予測できるマルチタスクCNNアーキテクチャである。実験評価のために,Augmented Reality (AR) を用いた2つの最先端3Dオブジェクトデータセット citePLciteTLINEMOD のための拡張トレーニングデータを生成する。
論文参考訳（メタデータ） (2019-12-27T13:48:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。