論文の概要: Indiscernible Object Counting in Underwater Scenes
- arxiv url: http://arxiv.org/abs/2304.11677v1
- Date: Sun, 23 Apr 2023 15:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:04:51.614719
- Title: Indiscernible Object Counting in Underwater Scenes
- Title(参考訳): 水中シーンにおける識別不能物体数
- Authors: Guolei Sun, Zhaochong An, Yun Liu, Ce Liu, Christos Sakaridis,
Deng-Ping Fan, Luc Van Gool
- Abstract要約: 認識不能なオブジェクトのカウントは、その環境に対してブレンドされたオブジェクトをカウントすることである。
本稿では,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提案する。
- 参考スコア(独自算出の注目度): 91.86044762367945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, indiscernible scene understanding has attracted a lot of attention
in the vision community. We further advance the frontier of this field by
systematically studying a new challenge named indiscernible object counting
(IOC), the goal of which is to count objects that are blended with respect to
their surroundings. Due to a lack of appropriate IOC datasets, we present a
large-scale dataset IOCfish5K which contains a total of 5,637 high-resolution
images and 659,024 annotated center points. Our dataset consists of a large
number of indiscernible objects (mainly fish) in underwater scenes, making the
annotation process all the more challenging. IOCfish5K is superior to existing
datasets with indiscernible scenes because of its larger scale, higher image
resolutions, more annotations, and denser scenes. All these aspects make it the
most challenging dataset for IOC so far, supporting progress in this area. For
benchmarking purposes, we select 14 mainstream methods for object counting and
carefully evaluate them on IOCfish5K. Furthermore, we propose IOCFormer, a new
strong baseline that combines density and regression branches in a unified
framework and can effectively tackle object counting under concealed scenes.
Experiments show that IOCFormer achieves state-of-the-art scores on IOCfish5K.
- Abstract(参考訳): 最近、不可解なシーン理解が視覚コミュニティに多くの注目を集めている。
我々は,この分野のフロンティアをさらに進めるために,その周辺に混在する物体を数えることを目的とした,認識不能物体計数(IOC)という新たな課題を体系的に研究する。
適切なIOCデータセットがないため,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提示する。
我々のデータセットは、水中のシーンで認識できない多くの物体(主に魚)で構成されており、アノテーションプロセスはより困難である。
iocfish5kは、大きなスケール、高い解像度、より多くのアノテーション、より密集したシーンのため、識別不能なシーンを持つ既存のデータセットよりも優れている。
これらすべての側面により、IOCにとって最も難しいデータセットとなり、この分野の進歩を支えている。
ベンチマークのために,14の主流手法を選択し,IOCfish5K上で慎重に評価する。
さらに,集中型フレームワークにおける密度と回帰分岐を組み合わせた新しい強力なベースラインであるIOCFormerを提案し,隠れたシーン下でのオブジェクトカウントに効果的に取り組むことができる。
IOCFormerはIOCfish5Kで最先端のスコアを得る。
関連論文リスト
- A Density-Guided Temporal Attention Transformer for Indiscernible Object
Counting in Underwater Video [27.329015161325962]
周囲に混在する対象の数を数えることを目的とした、識別不能な対象数カウントは、課題となっている。
本稿では,35の高精細ビデオを含むYoutubeFish-35という大規模データセットを提案する。
統合されたフレームワークにおいて、時間領域に沿って密度と回帰の分岐を結合した新しい強力なベースラインであるTransVidCountを提案する。
論文 参考訳(メタデータ) (2024-03-06T04:54:00Z) - Improving Underwater Visual Tracking With a Large Scale Dataset and
Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。
水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。
本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。
この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文 参考訳(メタデータ) (2023-08-30T07:41:26Z) - LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and
Benchmark [9.864996020621701]
我々は,湖沼,河川,海のシーンを特徴とする,最初の海洋パノビュータ障害物検出ベンチマークLaRSを提示する。
LaRSは1ピクセルあたり4000以上のラベル付きキーフレームと9つの前のフレームで構成され、時間的テクスチャの利用を可能にしている。
本稿では,27のセマンティック・パノプティック・セグメンテーション手法と,いくつかのパフォーマンスインサイトと今後の研究方向性について報告する。
論文 参考訳(メタデータ) (2023-08-18T15:21:15Z) - KOLOMVERSE: Korea open large-scale image dataset for object detection in the maritime universe [0.5732204366512352]
KRISO による海洋領域における物体検出のための大規模画像データセット KOLOMVERSE を提案する。
韓国の21の領海から撮影した5,845時間の動画データを収集した。
データセットには3840$times$2160ピクセルのイメージがあり、私たちの知る限り、海洋ドメインにおけるオブジェクト検出のための公開データセットとしては、これまでで最大のものである。
論文 参考訳(メタデータ) (2022-06-20T16:45:12Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - ASOD60K: Audio-Induced Salient Object Detection in Panoramic Videos [79.05486554647918]
本研究では,パノラマビデオから有能な物体を分離する新しいタスクであるPV-SODを提案する。
既存の固定レベルやオブジェクトレベルの塩分濃度検出タスクとは対照的に,多モードの塩分濃度検出(SOD)に焦点を当てる。
AsOD60Kという,6レベル階層の4K解像度ビデオフレームを含む,最初の大規模データセットを収集する。
論文 参考訳(メタデータ) (2021-07-24T15:14:20Z) - Concealed Object Detection [140.98738087261887]
隠蔽物体検出(COD)に関する最初の体系的研究を紹介します。
CODは、背景に「完全に」埋め込まれているオブジェクトを特定することを目指しています。
このタスクをより理解するために、cod10kと呼ばれる大規模なデータセットを収集します。
論文 参考訳(メタデータ) (2021-02-20T06:49:53Z) - Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-08-28T03:47:49Z) - RPT: Learning Point Set Representation for Siamese Visual Tracking [15.04182251944942]
本稿では,より詳細な表現を代表点の集合として,対象状態を正確に推定する効率的な視覚追跡フレームワークを提案する。
提案手法は20FPS以上の動作中に新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2020-08-08T07:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。