論文の概要: Multi-Task Learning-Enabled Automatic Vessel Draft Reading for
Intelligent Maritime Surveillance
- arxiv url: http://arxiv.org/abs/2310.07212v1
- Date: Wed, 11 Oct 2023 05:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 00:15:57.715449
- Title: Multi-Task Learning-Enabled Automatic Vessel Draft Reading for
Intelligent Maritime Surveillance
- Title(参考訳): 知的海洋監視のためのマルチタスク学習型自動容器ドラフト読取
- Authors: Jingxiang Qu, Ryan Wen Liu, Chenjie Zhao, Yu Guo, Sendren Sheng-Dong
Xu, Fenghua Zhu, and Yisheng Lv
- Abstract要約: 信頼性の高いVDRを生成するマルチタスク学習型計算手法(MTL-VDR)を提案する。
特に,我々のMTL-VDRは,主に,ドラフトマーク検出,ドラフトスケール認識,容器/水のセグメンテーション,最終ドラフト深度推定の4つのコンポーネントから構成されている。
その結果、精度、堅牢性、効率の点で優れた性能を示した。
- 参考スコア(独自算出の注目度): 18.917133876750913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate and efficient vessel draft reading (VDR) is an important
component of intelligent maritime surveillance, which could be exploited to
assist in judging whether the vessel is normally loaded or overloaded. The
computer vision technique with an excellent price-to-performance ratio has
become a popular medium to estimate vessel draft depth. However, the
traditional estimation methods easily suffer from several limitations, such as
sensitivity to low-quality images, high computational cost, etc. In this work,
we propose a multi-task learning-enabled computational method (termed MTL-VDR)
for generating highly reliable VDR. In particular, our MTL-VDR mainly consists
of four components, i.e., draft mark detection, draft scale recognition,
vessel/water segmentation, and final draft depth estimation. We first construct
a benchmark dataset related to draft mark detection and employ a powerful and
efficient convolutional neural network to accurately perform the detection
task. The multi-task learning method is then proposed for simultaneous draft
scale recognition and vessel/water segmentation. To obtain more robust VDR
under complex conditions (e.g., damaged and stained scales, etc.), the accurate
draft scales are generated by an automatic correction method, which is
presented based on the spatial distribution rules of draft scales. Finally, an
adaptive computational method is exploited to yield an accurate and robust
draft depth. Extensive experiments have been implemented on the realistic
dataset to compare our MTL-VDR with state-of-the-art methods. The results have
demonstrated its superior performance in terms of accuracy, robustness, and
efficiency. The computational speed exceeds 40 FPS, which satisfies the
requirements of real-time maritime surveillance to guarantee vessel traffic
safety.
- Abstract(参考訳): 正確で効率的な船舶ドラフト読取(vdr)は、インテリジェントな海上監視の重要な要素であり、通常船が積み込まれているか過負荷であるかを判断するのに役立つ。
性能に優れたコンピュータビジョン技術は,容器のドラフト深さを推定するための一般的な媒体となっている。
しかし,従来の推定手法では,低画質画像に対する感度,高計算コストなど,いくつかの制約が容易に生じる。
本研究では,高度に信頼性の高いVDRを生成するマルチタスク学習型計算手法(MTL-VDR)を提案する。
特に,我々のMTL-VDRは,主に,ドラフトマーク検出,ドラフトスケール認識,容器/水のセグメンテーション,最終ドラフト深度推定の4つのコンポーネントから構成されている。
まず、ドラフトマーク検出に関するベンチマークデータセットを構築し、強力で効率的な畳み込みニューラルネットワークを用いて検出タスクを正確に実行する。
マルチタスク学習法は, 大規模認識と容器/水のセグメンテーションを同時に行うために提案される。
複雑な条件下でより堅牢なVDRを得る(例えば、損傷及び染色スケール等)ために、正確なドラフトスケールは、ドラフトスケールの空間分布規則に基づいて提示される自動補正法により生成される。
最後に,適応計算法を用いて高精度かつロバストなドラフト深さを得る。
mtl-vdrと最先端の手法を比較するために、現実的なデータセットで広範な実験が行われました。
その結果、精度、堅牢性、効率の点で優れた性能を示した。
計算速度は40 FPSを超え、船舶の交通安全を確保するためのリアルタイム海洋監視の要求を満たす。
関連論文リスト
- Highly Efficient and Unsupervised Framework for Moving Object Detection in Satellite Videos [0.2023650687546586]
本稿では,SVMODのための高度に効率的な非教師付きフレームワークを提案する。
提案手法は,1024倍画像上で秒間9フレームを処理できるだけでなく,フォアグラウンド・アート・パフォーマンスも実現可能であることを示す。
論文 参考訳(メタデータ) (2024-11-24T16:06:42Z) - MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [3.9974562667271507]
視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。
近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。
エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-07T15:36:49Z) - Centerness-based Instance-aware Knowledge Distillation with Task-wise Mutual Lifting for Object Detection on Drone Imagery [32.60564590897137]
本稿では,ドローン画像の物体検出に知識蒸留(KD)を適用した最初の試みについて述べる。
本稿では,Centerness-based Instance-aware Distillation (CID) 戦略を用いたタスクワイド・ミューチュアル・リフティング (Light-ML) モジュールを提案する。
VisDrone、UAVDT、COCOベンチマークの実験では、提案手法が既存のKD法と同等な計算条件の精度を高めることが示されている。
論文 参考訳(メタデータ) (2024-11-05T07:09:27Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Efficient Visual Fault Detection for Freight Train Braking System via
Heterogeneous Self Distillation in the Wild [8.062167870951706]
本稿では,検出精度と速度を確保するため,不均一な自己蒸留フレームワークを提案する。
我々は,学習効率を向上させるために,ラベル付近の値にネットワークを集中させる新たな損失関数を用いる。
我々のフレームワークは毎秒37フレーム以上を達成でき、従来の蒸留法と比較して高い精度を維持することができる。
論文 参考訳(メタデータ) (2023-07-03T01:27:39Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Visual-tactile sensing for Real-time liquid Volume Estimation in
Grasping [58.50342759993186]
変形性容器内の液体をリアルタイムに推定するためのビジュオ触覚モデルを提案する。
我々は、RGBカメラからの生の視覚入力と、特定の触覚センサーからの触覚手がかりの2つの感覚モードを融合する。
ロボットシステムは、推定モデルに基づいて、リアルタイムで適切に制御され、調整される。
論文 参考訳(メタデータ) (2022-02-23T13:38:31Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - A Unified Light Framework for Real-time Fault Detection of Freight Train
Images [16.721758280029302]
貨物列車のリアルタイム故障検出は、鉄道輸送の安全と最適運転を保証する上で重要な役割を担っている。
深層学習に基づくアプローチの有望な結果にもかかわらず、貨物列車画像におけるこれらの断層検出器の性能は精度と効率の両立には程遠い。
本稿では,リソース要求の少ないリアルタイム動作をサポートしながら,検出精度を向上させるための統一光フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-31T05:10:20Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。