論文の概要: An Analysis of Deep Object Detectors For Diver Detection
- arxiv url: http://arxiv.org/abs/2012.05701v1
- Date: Wed, 25 Nov 2020 01:50:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 03:39:21.584630
- Title: An Analysis of Deep Object Detectors For Diver Detection
- Title(参考訳): ダイバー検出のための深部物体検出装置の解析
- Authors: Karin de Langis, Michael Fulton, Junaed Sattar
- Abstract要約: ビデオから得られたダイバーの注釈付き画像を約105,000枚作成する。
私たちは、Mobilenetを使ったSSD、Faster R-CNN、YOLOなど、オブジェクト検出のための最先端のディープニューラルネットワークをトレーニングしています。
この結果に基づき、ロボットのリアルタイム応用にTiny-YOLOv4を推奨する。
- 参考スコア(独自算出の注目度): 19.14344722263869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the end goal of selecting and using diver detection models to support
human-robot collaboration capabilities such as diver following, we thoroughly
analyze a large set of deep neural networks for diver detection. We begin by
producing a dataset of approximately 105,000 annotated images of divers sourced
from videos -- one of the largest and most varied diver detection datasets ever
created. Using this dataset, we train a variety of state-of-the-art deep neural
networks for object detection, including SSD with Mobilenet, Faster R-CNN, and
YOLO. Along with these single-frame detectors, we also train networks designed
for detection of objects in a video stream, using temporal information as well
as single-frame image information. We evaluate these networks on typical
accuracy and efficiency metrics, as well as on the temporal stability of their
detections. Finally, we analyze the failures of these detectors, pointing out
the most common scenarios of failure. Based on our results, we recommend SSDs
or Tiny-YOLOv4 for real-time applications on robots and recommend further
investigation of video object detection methods.
- Abstract(参考訳): ダイバー追跡などの人間とロボットのコラボレーション機能をサポートするためにダイバー検出モデルの選択と利用という最終目標は、ダイバー検出のための大規模なディープニューラルネットワークを徹底的に分析することにある。
まず、ビデオから派生したダイバーの約10万5000枚の注釈付き画像のデータセットを作成することから始めます。
このデータセットを使用して、Mobilenetを使ったSSD、Faster R-CNN、YOLOなど、さまざまな最先端のディープニューラルネットワークをトレーニングする。
これらの単一フレーム検出器とともに、時間情報と単一フレーム画像情報を用いて、ビデオストリーム内のオブジェクト検出用に設計されたネットワークを訓練する。
これらのネットワークを, 典型的な精度と効率の指標, 検出の時間的安定性について評価した。
最後に、これらの検出器の故障を分析し、最も一般的な障害シナリオを指摘する。
本結果から,ロボットのリアルタイムアプリケーションにはSSDやTiny-YOLOv4を推奨し,ビデオオブジェクト検出手法のさらなる検討を推奨する。
関連論文リスト
- Run-time Introspection of 2D Object Detection in Automated Driving
Systems Using Learning Representations [13.529124221397822]
ディープニューラルネットワーク(DNN)に基づく2次元物体検出のための新しいイントロスペクションソリューションを提案する。
KITTIとBDDのデータセットで評価された1段階および2段階のオブジェクト検出器を用いて,2次元オブジェクト検出におけるエラー検出のためのSOTAイントロスペクション機構を実装した。
性能評価の結果,提案手法はSOTA法より優れており,BDDデータセットのエラー率を9%から17%まで絶対的に削減できることがわかった。
論文 参考訳(メタデータ) (2024-03-02T10:56:14Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Semi-supervised 3D Object Detection via Temporal Graph Neural Networks [17.90796183565084]
3Dオブジェクト検出は、自動運転やその他のロボット工学応用において重要な役割を果たす。
本研究では,3次元物体検出器の半教師付き学習により,大量の未ラベルのクラウドビデオを活用することを提案する。
本手法は,難解な nuScenes と H3D ベンチマーク上での最先端検出性能を実現する。
論文 参考訳(メタデータ) (2022-02-01T02:06:54Z) - Finding Facial Forgery Artifacts with Parts-Based Detectors [73.08584805913813]
顔の個々の部分に焦点を絞った一連の偽造検知システムを設計する。
これらの検出器を用いて、FaceForensics++、Celeb-DF、Facebook Deepfake Detection Challengeデータセットの詳細な実験分析を行う。
論文 参考訳(メタデータ) (2021-09-21T16:18:45Z) - Parallel Detection for Efficient Video Analytics at the Edge [5.547133811014004]
ディープニューラルネットワーク(DNN)訓練対象検出器は、エッジでのリアルタイムビデオ分析のためにミッションクリティカルシステムに広くデプロイされている。
ミッションクリティカルエッジサービスにおける一般的なパフォーマンス要件は、エッジデバイス上でのオンラインオブジェクト検出のほぼリアルタイムレイテンシである。
本稿では,エッジシステムにおける高速物体検出のためのマルチモデルマルチデバイス検出並列性を利用して,これらの問題に対処する。
論文 参考訳(メタデータ) (2021-07-27T02:50:46Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Video Anomaly Detection Using Pre-Trained Deep Convolutional Neural Nets
and Context Mining [2.0646127669654835]
本稿では,事前学習した畳み込みニューラルネットモデルを用いて特徴抽出とコンテキストマイニングを行う方法について述べる。
我々は,高レベルの特徴から文脈特性を導出し,ビデオ異常検出法の性能をさらに向上させる。
論文 参考訳(メタデータ) (2020-10-06T00:26:14Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z) - Adaptive Anomaly Detection for IoT Data in Hierarchical Edge Computing [71.86955275376604]
本稿では,階層型エッジコンピューティング(HEC)システムに対する適応型異常検出手法を提案する。
本研究では,入力データから抽出した文脈情報に基づいてモデルを選択する適応的手法を設計し,異常検出を行う。
提案手法を実際のIoTデータセットを用いて評価し,検出タスクをクラウドにオフロードするのとほぼ同じ精度を維持しながら,検出遅延を84%削減できることを実証した。
論文 参考訳(メタデータ) (2020-01-10T05:29:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。