論文の概要: AI for Maritime Security: Comparative Evaluation of CNN and Vision Transformer Architectures for Maritime Object Detection
- arxiv url: http://arxiv.org/abs/2606.14720v1
- Date: Thu, 28 May 2026 11:14:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.740782
- Title: AI for Maritime Security: Comparative Evaluation of CNN and Vision Transformer Architectures for Maritime Object Detection
- Title(参考訳): AI for Maritime Security:Maritime Object DetectionのためのCNNとVision Transformerアーキテクチャの比較評価
- Authors: Ismet Gocer, Zakirul Bhuiayn, Shakeel Ahmad, Raza Hasan,
- Abstract要約: 本研究は,高度な人工知能 (AI) とコンピュータビジョン (CV) 技術を用いて海上警備を強化することを目的とする。
異なるリアルタイム環境下で海面上の船の存在を検知できるインテリジェントな物体検出システムの設計と評価を行った。
- 参考スコア(独自算出の注目度): 0.47248250311484113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study aims to enhance maritime security by using advanced Artificial Intelligence (AI) and Computer Vision (CV) techniques. For this purpose, it was designed and assessed intelligent object detection systems that can detect the presence of ships on the sea surface under different real-time environments. To achieve this goal, a maritime image dataset with 6,468 images was used, covering different weather conditions like cloudy, foggy, rainy, and sunny environments. Six deep learning architectures were evaluated, including a base Convolutional Neural Network (CNN) model, four transfer learning models (Xception, VGG16, MobileNetV2, and EfficientNetV2L), and a Vision Transformer (ViT) model. The models were compared using multiple performance indicators, including accuracy, Type I and Type II errors, model size, and video processing time. The results show that model performance varies depending on computational constraints and deployment conditions. While lightweight architectures are suitable for resource-limited devices, the ViT achieved the best overall performance, reaching 100% accuracy with the lowest error rates and the fastest video processing time. The findings highlight the potential of AI-driven computer vision systems for maritime surveillance, border protection, and autonomous navigation.
- Abstract(参考訳): 本研究は,高度な人工知能 (AI) とコンピュータビジョン (CV) 技術を用いて海上警備を強化することを目的とする。
この目的のために、異なるリアルタイム環境下で海面上の船の存在を検知できるインテリジェントな物体検出システムの設計と評価を行った。
この目標を達成するために、6,468枚の画像を含む海洋画像データセットが使用され、曇り、霧、雨、晴れた環境といった異なる気象条件をカバーした。
基礎となる畳み込みニューラルネットワーク(CNN)モデル、4つの伝達学習モデル(Xception、VGG16、MobileNetV2、EfficientNetV2L)、ビジョントランスフォーマー(ViT)モデルを含む6つのディープラーニングアーキテクチャが評価された。
モデルは、精度、タイプIとタイプIIのエラー、モデルサイズ、ビデオ処理時間など、複数のパフォーマンス指標を用いて比較された。
その結果,モデルの性能は計算制約や配置条件によって異なることがわかった。
軽量アーキテクチャはリソース制限されたデバイスに向いているが、ViTは最高の全体的な性能を達成し、最も低いエラー率と最速のビデオ処理時間で100%の精度を達成した。
この発見は、海上監視、国境警備、自律ナビゲーションのためのAI駆動型コンピュータビジョンシステムの可能性を強調している。
関連論文リスト
- WUTDet: A 100K-Scale Ship Detection Dataset and Benchmarks with Dense Small Objects [68.44670476527155]
WUTDetは100,576イメージと381,378のアノテートされた船舶インスタンスを備えた大規模な船舶検出データセットである。
CNN, Transformer, Mambaの3つの主流検出アーキテクチャから20のベースラインモデルを体系的に評価した。
Ship-GENの結果は、WUTDetでトレーニングされたモデルは、異なるデータ分布下でより強力な一般化を示すことを示している。
論文 参考訳(メタデータ) (2026-04-09T03:28:05Z) - AI-Powered Deepfake Detection Using CNN and Vision Transformer Architectures [0.0]
3つのCNNと1つのVision Transformerで構成される4つのAIベースのモデルを評価した。
データ前処理と拡張技術により、さまざまなシナリオにおけるモデルパフォーマンスが改善された。
論文 参考訳(メタデータ) (2026-01-03T20:44:50Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - On Vision Transformers for Classification Tasks in Side-Scan Sonar Imagery [0.0]
サイドスキャンソナー (SSS) 画像は海底の人工物体の分類においてユニークな課題を呈している。
本稿では、SSS画像のバイナリ分類タスクによく使用されるCNNアーキテクチャとともに、VTモデルの性能を厳格に比較する。
ViTベースのモデルは、f1スコア、精度、リコール、精度の指標で優れた分類性能を示す。
論文 参考訳(メタデータ) (2024-09-18T14:36:50Z) - Combined CNN and ViT features off-the-shelf: Another astounding baseline for recognition [49.14350399025926]
本稿では,ImageNet Large Scale Visual Recognition Challengeのために開発された事前学習型アーキテクチャを,近視認識に適用する。
CNNとViTの中間層の特徴は、近視画像に基づいて個人を認識するのに適した方法である。
論文 参考訳(メタデータ) (2024-07-28T11:52:36Z) - Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している
海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。
既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文 参考訳(メタデータ) (2024-07-12T05:48:53Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Analysis and Adaptation of YOLOv4 for Object Detection in Aerial Images [0.0]
本研究は,空中画像中の物体とその位置を予測するためのYOLOv4フレームワークの適応性を示す。
トレーニングされたモデルは平均的な平均精度(mAP)が45.64%となり、推論速度はTesla K80 GPUで8.7FPSに達した。
いくつかの現代の空中物体検出器との比較研究により、YOLOv4はより優れた性能を示し、航空プラットフォームに組み込むのにより適した検出アルゴリズムが示唆された。
論文 参考訳(メタデータ) (2022-03-18T23:51:09Z) - On Deep Learning Techniques to Boost Monocular Depth Estimation for
Autonomous Navigation [1.9007546108571112]
画像の深さを推定することはコンピュータビジョンの分野における根本的な逆問題である。
本稿では,新しい特徴抽出モデルと組み合わせ,軽量で高速なCNNアーキテクチャを提案する。
また,SIDE問題を解くために,単純な幾何2.5D損失関数と組み合わせて効率的な表面正規化モジュールを導入する。
論文 参考訳(メタデータ) (2020-10-13T18:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。