論文の概要: CDNet is all you need: Cascade DCN based underwater object detection
RCNN
- arxiv url: http://arxiv.org/abs/2111.12982v1
- Date: Thu, 25 Nov 2021 09:35:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 17:52:53.880648
- Title: CDNet is all you need: Cascade DCN based underwater object detection
RCNN
- Title(参考訳): CDNetは必要なものすべて:Cascade DCNベースの水中物体検出RCNN
- Authors: Di Chang
- Abstract要約: 本報告では,水中の光学画像と音響画像データセットに基づくカスケード-DCNに基づく手法について,工学的手法やオーグメンテーションの異なる手法を用いて検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection is a very important basic research direction in the field of
computer vision and a basic method for other advanced tasks in the field of
computer vision. It has been widely used in practical applications such as
object tracking, video behavior recognition and underwater robotics vision. The
Cascade-RCNN and Deformable Convolution Network are both classical and
excellent object detection algorithms. In this report, we evaluate our
Cascade-DCN based method on underwater optical image and acoustics image
datasets with different engineering tricks and augumentation.
- Abstract(参考訳): 物体検出はコンピュータビジョンの分野における重要な基礎研究の方向であり、コンピュータビジョンの分野における他の高度なタスクの基本的な方法である。
物体追跡、ビデオ行動認識、水中ロボットビジョンなどの実用的な用途で広く使われている。
Cascade-RCNNとDeformable Convolution Networkはどちらも古典的かつ優れたオブジェクト検出アルゴリズムである。
本報告では,水中光学画像と音響画像データセットを用いたカスケードdcnに基づく手法を,異なる工学的手法と重み付けを用いて評価する。
関連論文リスト
- Accelerating Object Detection with YOLOv4 for Real-Time Applications [0.276240219662896]
畳み込みニューラルネットワーク(CNN)は、ほとんどの問題に対して画像コンテンツとコンピュータビジョンアプローチを認識する強力なツールとして登場した。
本稿では、畳み込みニューラルネットワーク(CNN)のようなディープラーニングとオブジェクト検出フレームワークの簡単な紹介を紹介する。
論文 参考訳(メタデータ) (2024-10-17T17:44:57Z) - Human Activity Recognition from Wi-Fi CSI Data Using Principal
Component-Based Wavelet CNN [3.9533044769534444]
HAR(Human Activity Recognition)は、監視、セキュリティ、医療分野に応用された新興技術である。
実用リアルタイムアプリケーションにロバスト性と効率性を提供する新しいアプローチとして,主成分に基づくウェーブレット畳み込みニューラルネットワーク(PCWCNN)を提案する。
提案したPCWCNNモデルが,既存のアプローチよりも優れた実データセットで非常によく動作することを実証的に示す。
論文 参考訳(メタデータ) (2022-12-26T13:45:19Z) - 3D Cascade RCNN: High Quality Object Detection in Point Clouds [122.42455210196262]
本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
論文 参考訳(メタデータ) (2022-11-15T15:58:36Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Towards Improving Workers' Safety and Progress Monitoring of
Construction Sites Through Construction Site Understanding [0.0]
我々は,グローバルな特徴親和性関連に基づくチャネル関係を改善するために,軽量なOPモジュールを提案する。
OP-Netは、あらゆるディープニューラルネットワークにプラグインできる一般的なディープニューラルネットワークモジュールである。
SODAを用いたベンチマークテストでは、OP-Netが新しい最先端性能を精度良く達成できることを示した。
論文 参考訳(メタデータ) (2022-10-27T20:33:46Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Recent Trends in 2D Object Detection and Applications in Video Event
Recognition [0.76146285961466]
物体検出における先駆的な研究について論じるとともに,近年のディープラーニングを活用したブレークスルーも取り上げている。
本稿では、画像とビデオの両方で2次元物体検出のための最近のデータセットを強調し、様々な最先端物体検出技術の比較性能の概要を示す。
論文 参考訳(メタデータ) (2022-02-07T14:15:11Z) - NAS-FCOS: Efficient Search for Object Detection Architectures [113.47766862146389]
簡易なアンカーフリー物体検出器の特徴ピラミッドネットワーク (FPN) と予測ヘッドを探索し, より効率的な物体検出手法を提案する。
慎重に設計された検索空間、検索アルゴリズム、ネットワーク品質を評価するための戦略により、8つのV100 GPUを使用して、4日以内に最高のパフォーマンスの検知アーキテクチャを見つけることができる。
論文 参考訳(メタデータ) (2021-10-24T12:20:04Z) - On Deep Learning Techniques to Boost Monocular Depth Estimation for
Autonomous Navigation [1.9007546108571112]
画像の深さを推定することはコンピュータビジョンの分野における根本的な逆問題である。
本稿では,新しい特徴抽出モデルと組み合わせ,軽量で高速なCNNアーキテクチャを提案する。
また,SIDE問題を解くために,単純な幾何2.5D損失関数と組み合わせて効率的な表面正規化モジュールを導入する。
論文 参考訳(メタデータ) (2020-10-13T18:37:38Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。