Fugu-MT 論文翻訳(概要): Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset

論文の概要: Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset

arxiv url: http://arxiv.org/abs/2407.09005v1
Date: Fri, 12 Jul 2024 05:48:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-16 00:36:46.070697
Title: Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset
Title（参考訳）: VaDAの導入:新しいデータセットを用いた海上物体分割のための新しい画像分割モデル
Authors: Yongjin Kim, Jinbum Park, Sanha Kang, Hanguen Kim,
Abstract要約: 海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
参考スコア（独自算出の注目度）: 3.468621550644668
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The maritime shipping industry is undergoing rapid evolution driven by advancements in computer vision artificial intelligence (AI). Consequently, research on AI-based object recognition models for maritime transportation is steadily growing, leveraging advancements in sensor technology and computing performance. However, object recognition in maritime environments faces challenges such as light reflection, interference, intense lighting, and various weather conditions. To address these challenges, high-performance deep learning algorithms tailored to maritime imagery and high-quality datasets specialized for maritime scenes are essential. Existing AI recognition models and datasets have limited suitability for composing autonomous navigation systems. Therefore, in this paper, we propose a Vertical and Detail Attention (VaDA) model for maritime object segmentation and a new model evaluation method, the Integrated Figure of Calculation Performance (IFCP), to verify its suitability for the system in real-time. Additionally, we introduce a benchmark maritime dataset, OASIs (Ocean AI Segmentation Initiatives) to standardize model performance evaluation across diverse maritime environments. OASIs dataset and details are available at our website: https://www.navlue.com/dataset
Abstract（参考訳）: 海上輸送産業は、コンピュータビジョン人工知能(AI)の進歩によって急速に進化している。その結果、海上輸送のためのAIベースの物体認識モデルの研究は着実に増加しており、センサー技術とコンピュータ性能の進歩を活用している。しかし、海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面している。これらの課題に対処するためには、海洋画像に適した高性能ディープラーニングアルゴリズムと海洋シーンに特化した高品質データセットが不可欠である。既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。そこで本稿では,海洋オブジェクトセグメンテーションのためのVaDAモデルと新たなモデル評価手法であるIFCP(Integrated Figure of Compute Performance)を提案する。さらに、様々な海洋環境におけるモデルパフォーマンス評価を標準化するために、ベンチマーク海事データセットOASI(Ocean AI Segmentation Initiatives)を導入する。 OASIsデータセットと詳細は、私たちのWebサイトにある。

関連論文リスト

OceanGym: A Benchmark Environment for Underwater Embodied Agents [69.56465775825275]
OceanGymは、海洋水中のエンボディエージェントに関する最初の総合的なベンチマークである。それは、最も要求の多い現実世界環境の1つでAIを前進させるように設計されている。高忠実で厳格に設計されたプラットフォームを提供することで、OceanGymは堅牢なエンボディAIを開発するためのテストベッドを確立する。
論文参考訳（メタデータ） (2025-09-30T17:09:32Z)
Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.1960918379255]
Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。 X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文参考訳（メタデータ） (2025-09-25T04:59:02Z)
MVTD: A Benchmark Dataset for Maritime Visual Object Tracking [4.956066467858057]
海中視覚追跡データセット(MVTD)は182の高解像度ビデオシーケンスで構成され、合計で15万フレームである。 MVTDは、海洋環境の現実的な複雑さを反映して、さまざまな運用状況と海洋シナリオをキャプチャする。 MVTDベンチマークで14種類のSOTA追跡アルゴリズムを評価し, 汎用データセットの性能と比較すると, 大幅な性能劣化が見られた。
論文参考訳（メタデータ） (2025-06-03T13:30:11Z)
Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。従来の研究は、濁度や後方散乱に適応する手法を導入してきた。本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文参考訳（メタデータ） (2025-04-23T06:48:38Z)
Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。 EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文参考訳（メタデータ） (2025-04-09T15:13:26Z)
Domain Adaptation from Generated Multi-Weather Images for Unsupervised Maritime Object Classification [34.59086771834456]
我々は、多様な気象条件とバランスの取れたオブジェクトカテゴリを持つAIMOというデータセットを構築した。本稿では,AIMO(ソース・ドメイン)を活用してラベル付き限られたデータの問題に対処する新しいドメイン適応手法を提案する。実験の結果,提案手法は分類精度を著しく向上させることがわかった。
論文参考訳（メタデータ） (2025-01-26T12:27:54Z)
MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。 MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。 MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文参考訳（メタデータ） (2024-12-08T09:34:23Z)
FAFA: Frequency-Aware Flow-Aided Self-Supervision for Underwater Object Pose Estimation [65.01601309903971]
無人水中車両(UUV)の6次元ポーズ推定のための周波数認識フロー支援フレームワークであるFAFAを紹介する。我々のフレームワークは、3DモデルとRGB画像のみに依存しており、実際のポーズアノテーションや奥行きのような非モダリティデータの必要性を軽減しています。本研究では,一般的な水中オブジェクトポーズベンチマークにおけるFAFAの有効性を評価し,最先端手法と比較して顕著な性能向上を示した。
論文参考訳（メタデータ） (2024-09-25T03:54:01Z)
On Vision Transformers for Classification Tasks in Side-Scan Sonar Imagery [0.0]
サイドスキャンソナー (SSS) 画像は海底の人工物体の分類においてユニークな課題を呈している。本稿では、SSS画像のバイナリ分類タスクによく使用されるCNNアーキテクチャとともに、VTモデルの性能を厳格に比較する。 ViTベースのモデルは、f1スコア、精度、リコール、精度の指標で優れた分類性能を示す。
論文参考訳（メタデータ） (2024-09-18T14:36:50Z)
A Computer Vision Approach to Estimate the Localized Sea State [45.498315114762484]
本研究は, 船橋に設置した静止カメラ1台が捉えた運用用封筒内の海像の活用に焦点を当てた。収集した画像は、深層学習モデルを訓練し、ビューフォートスケールに基づいて海の状態を自動的に認識する。
論文参考訳（メタデータ） (2024-07-04T09:07:25Z)
Outlier detection in maritime environments using AIS data and deep recurrent architectures [5.399126243770847]
本稿では,海上監視のための深部再帰モデルに基づく手法を,公開可能な自動識別システム(AIS)データ上で提案する。このセットアップはディープ・リカレント・ニューラルネットワーク(RNN)ベースのモデルを使用して、観測された船の動きパターンを符号化し、再構築する。提案手法は,観測された動作パターンと再構成された動作パターンの計算誤差に対するしきい値決定機構に基づく。
論文参考訳（メタデータ） (2024-06-14T12:15:15Z)
BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。 BVSはシーンレベルで多数の調整可能なパラメータをサポートする。アプリケーションシナリオを3つ紹介する。
論文参考訳（メタデータ） (2024-05-15T17:57:56Z)
Multi-modal Perception Dataset of In-water Objects for Autonomous Surface Vehicles [10.732732686425308]
本稿では,自律航法のためのマルチモーダル認識データセットについて紹介する。自律型表面車両(ASV)の環境意識を高めるため、水中環境における水中障害物に焦点を当てている。
論文参考訳（メタデータ） (2024-04-29T04:00:19Z)
Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文参考訳（メタデータ） (2022-11-19T07:50:34Z)
SVAM: Saliency-guided Visual Attention Modeling by Autonomous Underwater Robots [16.242924916178282]
本稿では,自律型水中ロボットの視覚的注意モデル(SVAM)に対する総合的なアプローチを提案する。提案するSVAM-Netは,様々なスケールの深部視覚的特徴を統合し,自然水中画像に有効なSOD(Salient Object Detection)を実現する。
論文参考訳（メタデータ） (2020-11-12T08:17:21Z)
Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文参考訳（メタデータ） (2020-08-21T03:16:51Z)
Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文参考訳（メタデータ） (2020-07-01T17:52:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。