論文の概要: Indiscernible Object Counting in Underwater Scenes
- arxiv url: http://arxiv.org/abs/2304.11677v1
- Date: Sun, 23 Apr 2023 15:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:04:51.614719
- Title: Indiscernible Object Counting in Underwater Scenes
- Title(参考訳): 水中シーンにおける識別不能物体数
- Authors: Guolei Sun, Zhaochong An, Yun Liu, Ce Liu, Christos Sakaridis,
Deng-Ping Fan, Luc Van Gool
- Abstract要約: 認識不能なオブジェクトのカウントは、その環境に対してブレンドされたオブジェクトをカウントすることである。
本稿では,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提案する。
- 参考スコア(独自算出の注目度): 91.86044762367945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, indiscernible scene understanding has attracted a lot of attention
in the vision community. We further advance the frontier of this field by
systematically studying a new challenge named indiscernible object counting
(IOC), the goal of which is to count objects that are blended with respect to
their surroundings. Due to a lack of appropriate IOC datasets, we present a
large-scale dataset IOCfish5K which contains a total of 5,637 high-resolution
images and 659,024 annotated center points. Our dataset consists of a large
number of indiscernible objects (mainly fish) in underwater scenes, making the
annotation process all the more challenging. IOCfish5K is superior to existing
datasets with indiscernible scenes because of its larger scale, higher image
resolutions, more annotations, and denser scenes. All these aspects make it the
most challenging dataset for IOC so far, supporting progress in this area. For
benchmarking purposes, we select 14 mainstream methods for object counting and
carefully evaluate them on IOCfish5K. Furthermore, we propose IOCFormer, a new
strong baseline that combines density and regression branches in a unified
framework and can effectively tackle object counting under concealed scenes.
Experiments show that IOCFormer achieves state-of-the-art scores on IOCfish5K.
- Abstract(参考訳): 最近、不可解なシーン理解が視覚コミュニティに多くの注目を集めている。
我々は,この分野のフロンティアをさらに進めるために,その周辺に混在する物体を数えることを目的とした,認識不能物体計数(IOC)という新たな課題を体系的に研究する。
適切なIOCデータセットがないため,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提示する。
我々のデータセットは、水中のシーンで認識できない多くの物体(主に魚)で構成されており、アノテーションプロセスはより困難である。
iocfish5kは、大きなスケール、高い解像度、より多くのアノテーション、より密集したシーンのため、識別不能なシーンを持つ既存のデータセットよりも優れている。
これらすべての側面により、IOCにとって最も難しいデータセットとなり、この分野の進歩を支えている。
ベンチマークのために,14の主流手法を選択し,IOCfish5K上で慎重に評価する。
さらに,集中型フレームワークにおける密度と回帰分岐を組み合わせた新しい強力なベースラインであるIOCFormerを提案し,隠れたシーン下でのオブジェクトカウントに効果的に取り組むことができる。
IOCFormerはIOCfish5Kで最先端のスコアを得る。
関連論文リスト
- MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - A Density-Guided Temporal Attention Transformer for Indiscernible Object
Counting in Underwater Video [27.329015161325962]
周囲に混在する対象の数を数えることを目的とした、識別不能な対象数カウントは、課題となっている。
本稿では,35の高精細ビデオを含むYoutubeFish-35という大規模データセットを提案する。
統合されたフレームワークにおいて、時間領域に沿って密度と回帰の分岐を結合した新しい強力なベースラインであるTransVidCountを提案する。
論文 参考訳(メタデータ) (2024-03-06T04:54:00Z) - Improving Underwater Visual Tracking With a Large Scale Dataset and
Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。
水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。
本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。
この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文 参考訳(メタデータ) (2023-08-30T07:41:26Z) - LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and
Benchmark [9.864996020621701]
我々は,湖沼,河川,海のシーンを特徴とする,最初の海洋パノビュータ障害物検出ベンチマークLaRSを提示する。
LaRSは1ピクセルあたり4000以上のラベル付きキーフレームと9つの前のフレームで構成され、時間的テクスチャの利用を可能にしている。
本稿では,27のセマンティック・パノプティック・セグメンテーション手法と,いくつかのパフォーマンスインサイトと今後の研究方向性について報告する。
論文 参考訳(メタデータ) (2023-08-18T15:21:15Z) - Cascade-DETR: Delving into High-Quality Universal Object Detection [99.62131881419143]
高品質な普遍物体検出のためのカスケードDETRを提案する。
本稿では,オブジェクト中心情報を検出デコーダに明示的に統合するカスケードアテンション層を提案する。
最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
論文 参考訳(メタデータ) (2023-07-20T17:11:20Z) - Densely Constrained Depth Estimator for Monocular 3D Object Detection [48.12271792836015]
モノクロ画像から物体の正確な3D位置を推定することは、深さが不足しているため難しい問題である。
任意の方向の端から高密度な射影制約を利用する手法を提案する。
提案手法は, KITTI および WOD ベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-20T17:24:22Z) - KOLOMVERSE: Korea open large-scale image dataset for object detection in the maritime universe [0.5732204366512352]
KRISO による海洋領域における物体検出のための大規模画像データセット KOLOMVERSE を提案する。
韓国の21の領海から撮影した5,845時間の動画データを収集した。
データセットには3840$times$2160ピクセルのイメージがあり、私たちの知る限り、海洋ドメインにおけるオブジェクト検出のための公開データセットとしては、これまでで最大のものである。
論文 参考訳(メタデータ) (2022-06-20T16:45:12Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - Concealed Object Detection [140.98738087261887]
隠蔽物体検出(COD)に関する最初の体系的研究を紹介します。
CODは、背景に「完全に」埋め込まれているオブジェクトを特定することを目指しています。
このタスクをより理解するために、cod10kと呼ばれる大規模なデータセットを収集します。
論文 参考訳(メタデータ) (2021-02-20T06:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。