論文の概要: A comprehensive review of datasets and deep learning techniques for vision in Unmanned Surface Vehicles
- arxiv url: http://arxiv.org/abs/2412.01461v1
- Date: Mon, 02 Dec 2024 12:54:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:45:07.495704
- Title: A comprehensive review of datasets and deep learning techniques for vision in Unmanned Surface Vehicles
- Title(参考訳): 無人表面車両におけるビジョンのためのデータセットと深層学習手法の総合的レビュー
- Authors: Linh Trinh, Siegfried Mercelis, Ali Anwar,
- Abstract要約: 無人のSurface Vehicles (USV) は海上作戦における主要なプラットフォームとして登場した。
USVは、労働コストを削減し、安全性を高め、エネルギーを節約し、厳しい海洋環境下で困難な無人作業を可能にする。
USVの急速な発展に伴い、検出やセグメンテーションといった多くのビジョンタスクがますます重要になっている。
- 参考スコア(独自算出の注目度): 2.9109581496560044
- License:
- Abstract: Unmanned Surface Vehicles (USVs) have emerged as a major platform in maritime operations, capable of supporting a wide range of applications. USVs can help reduce labor costs, increase safety, save energy, and allow for difficult unmanned tasks in harsh maritime environments. With the rapid development of USVs, many vision tasks such as detection and segmentation become increasingly important. Datasets play an important role in encouraging and improving the research and development of reliable vision algorithms for USVs. In this regard, a large number of recent studies have focused on the release of vision datasets for USVs. Along with the development of datasets, a variety of deep learning techniques have also been studied, with a focus on USVs. However, there is a lack of a systematic review of recent studies in both datasets and vision techniques to provide a comprehensive picture of the current development of vision on USVs, including limitations and trends. In this study, we provide a comprehensive review of both USV datasets and deep learning techniques for vision tasks. Our review was conducted using a large number of vision datasets from USVs. We elaborate several challenges and potential opportunities for research and development in USV vision based on a thorough analysis of current datasets and deep learning techniques.
- Abstract(参考訳): 無人のSurface Vehicles (USV) は海上での運用において主要なプラットフォームとして登場し、幅広い用途をサポートすることができる。
USVは、労働コストを削減し、安全性を高め、エネルギーを節約し、厳しい海洋環境下で困難な無人作業を可能にする。
USVの急速な発展に伴い、検出やセグメンテーションといった多くのビジョンタスクがますます重要になっている。
データセットは、USVのための信頼性の高いビジョンアルゴリズムの研究と開発を奨励し、改善する上で重要な役割を果たしている。
この点において、近年の多くの研究は、USVのためのビジョンデータセットのリリースに焦点を当てている。
データセットの開発とともに、USVに焦点を当てたさまざまなディープラーニング技術も研究されている。
しかしながら、データセットとビジョン技術の両方における最近の研究の体系的なレビューが欠如しており、制限やトレンドを含むUSVのビジョンの現在の発展の包括的図を提供している。
本研究では,USVデータセットと視覚タスクのためのディープラーニング技術の両方を包括的にレビューする。
本稿では,USVからの多数の視覚データセットを用いてレビューを行った。
我々は、現在のデータセットとディープラーニング技術に関する詳細な分析に基づいて、USVビジョンにおける研究と開発のためのいくつかの課題と潜在的機会を詳述する。
関連論文リスト
- Vision-Language Models for Edge Networks: A Comprehensive Survey [32.05172973290599]
Vision Large Language Models (VLM)は、視覚的理解と自然言語処理を組み合わせることで、画像キャプション、視覚的質問応答、ビデオ分析などのタスクを可能にする。
VLMは、自動運転車、スマート監視、ヘルスケアといった分野にまたがる印象的な機能を示している。
リソース制約のあるエッジデバイスへのデプロイメントは、処理能力、メモリ、エネルギー制限のため、依然として困難である。
論文 参考訳(メタデータ) (2025-02-11T14:04:43Z) - UAV (Unmanned Aerial Vehicles): Diverse Applications of UAV Datasets in Segmentation, Classification, Detection, and Tracking [0.0]
無人航空機(UAV)は、さまざまな研究領域におけるデータの収集と分析のプロセスに革命をもたらした。
UAVデータセットは、衛星画像、ドローンが撮影した画像、ビデオなど、さまざまな種類のデータで構成されている。
これらのデータセットは、災害被害評価、航空監視、物体認識、追跡において重要な役割を果たす。
論文 参考訳(メタデータ) (2024-09-05T04:47:36Z) - Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs [61.143381152739046]
視覚中心のアプローチで設計したマルチモーダルLLM(MLLM)のファミリーであるCambrian-1を紹介する。
本研究は,様々な視覚表現を評価するためのインタフェースとして,LLMとビジュアルインストラクションチューニングを用いた。
モデルウェイト、コード、サポートツール、データセット、詳細なインストラクションチューニングと評価のレシピを提供しています。
論文 参考訳(メタデータ) (2024-06-24T17:59:42Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Collaborative Perception Datasets in Autonomous Driving: A Survey [0.0]
この論文は様々なデータセットを体系的に分析し、多様性、センサーの設定、品質、公開可用性、下流タスクへの適用性といった側面に基づいて比較する。
データセット開発におけるプライバシとセキュリティの懸念に対処することの重要性は、データ共有とデータセット生成に関して強調されている。
論文 参考訳(メタデータ) (2024-04-22T09:36:17Z) - SynDrone -- Multi-modal UAV Dataset for Urban Scenarios [11.338399194998933]
ピクセルレベルのアノテーションを持つ大規模な実際のデータセットの不足は、研究者にとって大きな課題となっている。
本研究では,複数の飛行高度で撮影された画像と3次元データを含むマルチモーダル合成データセットを提案する。
データセットは、UAVアプリケーションをターゲットにした新しいコンピュータビジョンメソッドの開発をサポートするために公開されます。
論文 参考訳(メタデータ) (2023-08-21T06:22:10Z) - Vision-Language Models for Vision Tasks: A Survey [62.543250338410836]
視覚言語モデル(VLM)は、Webスケールの画像テキストペアからリッチな視覚言語相関を学習する。
本稿では,視覚認知タスクにおける視覚言語モデルの体系的レビューを行う。
論文 参考訳(メタデータ) (2023-04-03T02:17:05Z) - Vision-Centric BEV Perception: A Survey [92.98068828762833]
視覚中心のBird's Eye View(BEV)の認識は、産業と学界の両方から大きな関心を集めている。
ディープラーニングの急速な進歩は、視覚中心のBEV知覚問題に対処する多くの方法の提案につながった。
本稿では、最新の知識をコンパイルし、整理し、一般的なアルゴリズムの体系的なレビューと要約を提供する。
論文 参考訳(メタデータ) (2022-08-04T17:53:17Z) - A Survey on RGB-D Datasets [69.73803123972297]
本稿では,深度情報を含む画像データセットをレビューし,分類した。
アクセス可能なデータを含む203のデータセットを収集し、それらをシーン/オブジェクト、ボディ、医療の3つのカテゴリに分類しました。
論文 参考訳(メタデータ) (2022-01-15T05:35:19Z) - Deep Learning for Embodied Vision Navigation: A Survey [108.13766213265069]
身体的視覚ナビゲーション」問題では、エージェントが3D環境をナビゲートする必要がある。
本稿では、総合的な文献調査を提供することで、視覚ナビゲーションの具体的分野における現在の研究の概要を確立することを試みる。
論文 参考訳(メタデータ) (2021-07-07T12:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。