論文の概要: Multi-label Video Classification for Underwater Ship Inspection
- arxiv url: http://arxiv.org/abs/2305.17338v1
- Date: Sat, 27 May 2023 02:38:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 20:14:27.029070
- Title: Multi-label Video Classification for Underwater Ship Inspection
- Title(参考訳): 水中船舶検査のためのマルチラベルビデオ分類
- Authors: Md Abulkalam Azad, Ahmed Mohammed, Maryna Waszak, Brian Elves{\ae}ter
and Martin Ludvigsen
- Abstract要約: 本稿では,ディープラーニングとコンピュータビジョンを用いた自動映像解析システムを提案する。
提案手法は有望な結果を示し,水中ビデオ船体検査における今後の研究・開発のためのベンチマークとして機能する。
- 参考スコア(独自算出の注目度): 2.537406035246369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Today ship hull inspection including the examination of the external coating,
detection of defects, and other types of external degradation such as corrosion
and marine growth is conducted underwater by means of Remotely Operated
Vehicles (ROVs). The inspection process consists of a manual video analysis
which is a time-consuming and labor-intensive process. To address this, we
propose an automatic video analysis system using deep learning and computer
vision to improve upon existing methods that only consider spatial information
on individual frames in underwater ship hull video inspection. By exploring the
benefits of adding temporal information and analyzing frame-based classifiers,
we propose a multi-label video classification model that exploits the
self-attention mechanism of transformers to capture spatiotemporal attention in
consecutive video frames. Our proposed method has demonstrated promising
results and can serve as a benchmark for future research and development in
underwater video inspection applications.
- Abstract(参考訳): 現在の船体検査は、外装の検査、欠陥の検出、腐食や海洋成長などの他の種類の外的劣化を遠隔操作車両(rovs)によって水中で行う。
検査プロセスは、時間消費かつ労働集約的なプロセスである手動のビデオ分析からなる。
そこで本研究では,深層学習とコンピュータビジョンを用いた自動映像解析システムを提案する。
時間情報の追加とフレームベース分類器の解析の利点を探究し,トランスフォーマの自己照査機構を利用して連続する映像フレームの時空間的注意を捉えるマルチラベルビデオ分類モデルを提案する。
提案手法は有望な結果を示し,水中ビデオ検査における今後の研究・開発のためのベンチマークとなる。
関連論文リスト
- Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - SeaDSC: A video-based unsupervised method for dynamic scene change
detection in unmanned surface vehicles [3.2716252389196288]
本稿では,無人表面車両(USV)の動的シーン変化を検出するためのアプローチについて概説する。
本研究の目的は,海中映像データのダイナミックなシーン,特に高い類似性を示すシーンに顕著な変化を見出すことである。
本研究では,動的シーン変化検出システムにおいて,教師なし学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T07:34:01Z) - Evaluating Deep Learning Assisted Automated Aquaculture Net Pens
Inspection Using ROV [0.27309692684728615]
魚は魚の養殖場から海に逃げ出す。
従来の検査システムは、専門家のダイバーやROVによる視覚検査に依存している。
本稿では,養殖網ペンを対象としたロボットによる自動網欠陥検出システムについて述べる。
論文 参考訳(メタデータ) (2023-08-26T09:35:49Z) - Context-Driven Detection of Invertebrate Species in Deep-Sea Video [11.38215488702246]
4つの水中基質と59種の水中無脊椎動物を時間的に局在させるためのベンチマークスイートについて検討した。
DUSIAは現在、ROVで30fpsで1080pで撮影された25の動画を10時間以上録画している。
いくつかのフレームには、無脊椎動物が興味を持つための正確な境界ボックスの位置がアノテートされている。
論文 参考訳(メタデータ) (2022-06-01T18:59:46Z) - Flow-Guided Sparse Transformer for Video Deblurring [124.11022871999423]
FlowGuided Sparse Transformer (F GST) はビデオデブリのためのフレームワークである。
FGSW-MSAは、推定光流のガイダンスを楽しみ、隣り合うフレームの同じシーンパッチに対応する、空間的にスパースな要素を世界中にサンプリングする。
提案するFGSTは,DVDおよびGOPROデータセットの最先端パッチよりも優れており,実際のビデオの劣化に対して,より視覚的に満足な結果が得られる。
論文 参考訳(メタデータ) (2022-01-06T02:05:32Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - Self-supervised Video Object Segmentation by Motion Grouping [79.13206959575228]
動きの手がかりを利用して物体をセグメンテーションできるコンピュータビジョンシステムを開発した。
本稿では,光フローフレームを一次オブジェクトと背景に分割するトランスフォーマーの簡単なバリエーションを紹介する。
提案したアーキテクチャを公開ベンチマーク(DAVIS2016, SegTrackv2, FBMS59)で評価する。
論文 参考訳(メタデータ) (2021-04-15T17:59:32Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Anomaly Detection in Video Data Based on Probabilistic Latent Space
Models [7.269230232703388]
可変オートエンコーダ(VAE)は、ビデオフレームの寸法を小さくするために用いられる。
離散的および連続的推論レベルで定義される適応マルコフジャンプ粒子フィルタを用いて、以下のフレームを予測する。
本手法は,半自律車両が閉じた環境下で一連のタスクを実行する場合の様々なビデオシナリオで評価する。
論文 参考訳(メタデータ) (2020-03-17T10:32:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。