論文の概要: A New Dataset, Poisson GAN and AquaNet for Underwater Object Grabbing
- arxiv url: http://arxiv.org/abs/2003.01446v2
- Date: Wed, 28 Jul 2021 01:32:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 22:51:52.153562
- Title: A New Dataset, Poisson GAN and AquaNet for Underwater Object Grabbing
- Title(参考訳): 水中グラビングのための新しいデータセット, Poisson GAN と AquaNet
- Authors: Chongwei Liu, Zhihui Wang, Shijie Wang, Tao Tang, Yulong Tao, Caifei
Yang, Haojie Li, Xing Liu, and Xin Fan
- Abstract要約: 本研究では,2,227枚の画像を含む3つのカテゴリ(サッカリ,ウニ,ヒノキ)からなる新しいデータセット(UDD)を提案する。
また,新しいPoisson-blending Generative Adversarial Network(Poisson GAN)とAquaNet(AquaNet)を提案する。
- 参考スコア(独自算出の注目度): 33.580474181751676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To boost the object grabbing capability of underwater robots for open-sea
farming, we propose a new dataset (UDD) consisting of three categories
(seacucumber, seaurchin, and scallop) with 2,227 images. To the best of our
knowledge, it is the first 4K HD dataset collected in a real open-sea farm. We
also propose a novel Poisson-blending Generative Adversarial Network (Poisson
GAN) and an efficient object detection network (AquaNet) to address two common
issues within related datasets: the class-imbalance problem and the problem of
mass small object, respectively. Specifically, Poisson GAN combines Poisson
blending into its generator and employs a new loss called Dual Restriction loss
(DR loss), which supervises both implicit space features and image-level
features during training to generate more realistic images. By utilizing
Poisson GAN, objects of minority class like seacucumber or scallop could be
added into an image naturally and annotated automatically, which could increase
the loss of minority classes during training detectors to eliminate the
class-imbalance problem; AquaNet is a high-efficiency detector to address the
problem of detecting mass small objects from cloudy underwater pictures. Within
it, we design two efficient components: a depth-wise-convolution-based
Multi-scale Contextual Features Fusion (MFF) block and a Multi-scale
Blursampling (MBP) module to reduce the parameters of the network to 1.3
million. Both two components could provide multi-scale features of small
objects under a short backbone configuration without any loss of accuracy. In
addition, we construct a large-scale augmented dataset (AUDD) and a
pre-training dataset via Poisson GAN from UDD. Extensive experiments show the
effectiveness of the proposed Poisson GAN, AquaNet, UDD, AUDD, and pre-training
dataset.
- Abstract(参考訳): 開海農業における水中ロボットの物体捕獲能力を高めるために,2,227枚の画像を含む3つのカテゴリ(サッカリ,ウニ,ヒノキ)からなる新しいデータセット(UDD)を提案する。
私たちの知る限りでは、実際のオープンシーファームで収集された最初の4K HDデータセットである。
また,Poisson-blending Generative Adversarial Network(Poisson GAN)とAquaNet(AquaNet)を新たに提案し,関連データセット内の2つの共通問題,すなわちクラス不均衡問題とマス小オブジェクトの問題に対処する。
具体的には、poisson ganはそのジェネレータにpoissonをブレンドし、トレーニング中に暗黙的な空間的特徴と画像レベルの特徴の両方を監督し、より現実的な画像を生成するデュアル制限損失(dr損失)と呼ばれる新しい損失を用いる。
Poisson GANを利用することで、シーキュウリやスカロップのようなマイノリティークラスのオブジェクトを自然に画像に加え、自動的に注釈を付けることができ、トレーニング検出器におけるマイノリティークラスの損失を増やすことで、クラスバランスの問題を排除することができる。
深さ方向の畳み込みに基づくマルチスケール・コンテクスト・フィーチャー・フュージョン(mff)ブロックと、ネットワークのパラメータを130万に縮小するマルチスケール・ボケサンプリング(mbp)モジュールの2つの効率的なコンポーネントを設計した。
2つのコンポーネントは、短いバックボーン構成の下で、精度を損なうことなく、小さなオブジェクトのマルチスケール機能を提供する。
さらに,UDDからPoisson GANを介して,大規模拡張現実データセット(AUDD)と事前学習データセットを構築する。
大規模な実験では、提案されたPoisson GAN、AquaNet、UDD、AUDD、事前トレーニングデータセットの有効性が示されている。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-04-09T10:03:44Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Boosting R-CNN: Reweighting R-CNN Samples by RPN's Error for Underwater
Object Detection [12.291063755824585]
本稿では,3つの主成分からなる2段式水中検出器「ブースティングR-CNN」を提案する。
まず、高品質な提案を提供するRetinaRPNという新しい領域提案ネットワークを提案する。
第2に、確率的推論パイプラインを導入し、第1ステージ前の不確実性と第2ステージの分類スコアを組み合わせる。
論文 参考訳(メタデータ) (2022-06-28T03:29:20Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - SWIPENET: Object detection in noisy underwater images [41.35601054297707]
本稿では,この2つの問題に対処するために,Sample-WeIghted hyPEr Network(SWIPENET)とCurriculum Multi-Class Adaboost(CMA)という堅牢なトレーニングパラダイムを提案する。
SWIPENETのバックボーンは、複数の高解像度かつセマンティックリッチなハイパーフィーチャーマップを生成し、小さなオブジェクト検出を大幅に改善する。
簡単な概念から難しい概念まで学習を促進する人間の教育プロセスに着想を得て,まず騒音の影響を受けないクリーンな検出器を訓練するCMA訓練パラダイムを提案する。
論文 参考訳(メタデータ) (2020-10-19T16:41:20Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Underwater object detection using Invert Multi-Class Adaboost with deep
learning [37.14538666012363]
小型物体検出のための新しいニューラルネットワークアーキテクチャであるSample-WeIghted hyPEr Network(SWIPENet)を提案する。
提案するSWIPENet+IMAフレームワークは,複数の最先端オブジェクト検出手法に対して,検出精度の向上を実現する。
論文 参考訳(メタデータ) (2020-05-23T15:30:38Z) - PENet: Object Detection using Points Estimation in Aerial Images [9.33900415971554]
これらの課題に対処するために,新しいネットワーク構造であるポイント推定ネットワーク(PENet)を提案する。
PENetはMask Resampling Module(MRM)を使用して、不均衡なデータセットを増大させ、粗いアンカーフリー検出器(CPEN)で小さなオブジェクトクラスタの中心点を効果的に予測し、微細なアンカーフリー検出器FPENで小さなオブジェクトの正確な位置を特定する。
航空データセット visDrone と UAVDT による実験により,PENet は既存の最先端手法よりも精度の高い結果を得た。
論文 参考訳(メタデータ) (2020-01-22T19:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。