論文の概要: Underwater Object Classification and Detection: first results and open
challenges
- arxiv url: http://arxiv.org/abs/2201.00977v1
- Date: Tue, 4 Jan 2022 04:54:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 20:51:53.461879
- Title: Underwater Object Classification and Detection: first results and open
challenges
- Title(参考訳): 水中物体の分類と検出:第一報と今後の課題
- Authors: Andre Jesus, Claudio Zito, Claudio Tortorici, Eloy Roura, Giulia De
Masi
- Abstract要約: 本研究は,水中環境における物体検出の問題点を概観する。
我々は、従来の最先端(SOTA)アルゴリズムの欠点を分析し、定量化する。
- 参考スコア(独自算出の注目度): 1.1549572298362782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work reviews the problem of object detection in underwater environments.
We analyse and quantify the shortcomings of conventional state-of-the-art
(SOTA) algorithms in the computer vision community when applied to this
challenging environment, as well as providing insights and general guidelines
for future research efforts. First, we assessed if pretraining with the
conventional ImageNet is beneficial when the object detector needs to be
applied to environments that may be characterised by a different feature
distribution. We then investigate whether two-stage detectors yields to better
performance with respect to single-stage detectors, in terms of accuracy,
intersection of union (IoU), floating operation per second (FLOPS), and
inference time. Finally, we assessed the generalisation capability of each
model to a lower quality dataset to simulate performance on a real scenario, in
which harsher conditions ought to be expected. Our experimental results provide
evidence that underwater object detection requires searching for "ad-hoc"
architectures than merely training SOTA architectures on new data, and that
pretraining is not beneficial.
- Abstract(参考訳): 本研究は,水中環境における物体検出の問題点を概観する。
我々は,この困難な環境に適用するコンピュータビジョンコミュニティにおける従来の最先端(sota)アルゴリズムの欠点を分析し,定量化するとともに,今後の研究に向けた洞察とガイドラインを提供する。
まず,物体検出装置を異なる特徴分布によって特徴付けられる環境に適用する必要がある場合に,従来のイメージネットによる事前学習が有用であるかどうかを評価する。
次に, 単段検出器について, 精度, 結合の交わり (IoU) , 浮動小数点演算 (FLOPS) , 推測時間の観点から, 2段検出器が良好な性能を発揮するかを検討した。
最後に、より厳しい条件を想定した実際のシナリオでの性能をシミュレートするために、各モデルの一般化能力を低品質データセットに評価した。
実験の結果, 水中物体検出には, 単にSOTAアーキテクチャを新しいデータで訓練するだけではなく, アドホックなアーキテクチャを探索する必要があるという証拠が得られた。
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications [7.022872089444935]
拡張現実(AR)におけるシーン分析と物体認識の役割
性能と処理時間を改善するために,検出・認識深層ネットワークを備えた配向境界ボックスを用いた新しい手法が提案されている。
その結果, 提案手法は, 試験条件のほとんどにおいて, 平均精度が向上し, 小型物体の精度が向上する傾向が示唆された。
論文 参考訳(メタデータ) (2023-06-29T09:17:58Z) - Boosting R-CNN: Reweighting R-CNN Samples by RPN's Error for Underwater
Object Detection [12.291063755824585]
本稿では,3つの主成分からなる2段式水中検出器「ブースティングR-CNN」を提案する。
まず、高品質な提案を提供するRetinaRPNという新しい領域提案ネットワークを提案する。
第2に、確率的推論パイプラインを導入し、第1ステージ前の不確実性と第2ステージの分類スコアを組み合わせる。
論文 参考訳(メタデータ) (2022-06-28T03:29:20Z) - Interactron: Embodied Adaptive Object Detection [18.644357684104662]
インタラクティブな環境下での適応オブジェクト検出手法であるInteractronを提案する。
私たちの考えは、推論中のトレーニングを継続し、環境との対話を通じて明確な監督なしに、テスト時にモデルを適応させることです。
論文 参考訳(メタデータ) (2022-02-01T18:56:14Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z) - Underwater object detection using Invert Multi-Class Adaboost with deep
learning [37.14538666012363]
小型物体検出のための新しいニューラルネットワークアーキテクチャであるSample-WeIghted hyPEr Network(SWIPENet)を提案する。
提案するSWIPENet+IMAフレームワークは,複数の最先端オブジェクト検出手法に対して,検出精度の向上を実現する。
論文 参考訳(メタデータ) (2020-05-23T15:30:38Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。