Fugu-MT 論文翻訳(概要): Indiscernible Object Counting in Underwater Scenes

論文の概要: Indiscernible Object Counting in Underwater Scenes

arxiv url: http://arxiv.org/abs/2304.11677v1
Date: Sun, 23 Apr 2023 15:09:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-25 17:04:51.614719
Title: Indiscernible Object Counting in Underwater Scenes
Title（参考訳）: 水中シーンにおける識別不能物体数
Authors: Guolei Sun, Zhaochong An, Yun Liu, Ce Liu, Christos Sakaridis, Deng-Ping Fan, Luc Van Gool
Abstract要約: 認識不能なオブジェクトのカウントは、その環境に対してブレンドされたオブジェクトをカウントすることである。本稿では,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提案する。
参考スコア（独自算出の注目度）: 91.86044762367945
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, indiscernible scene understanding has attracted a lot of attention in the vision community. We further advance the frontier of this field by systematically studying a new challenge named indiscernible object counting (IOC), the goal of which is to count objects that are blended with respect to their surroundings. Due to a lack of appropriate IOC datasets, we present a large-scale dataset IOCfish5K which contains a total of 5,637 high-resolution images and 659,024 annotated center points. Our dataset consists of a large number of indiscernible objects (mainly fish) in underwater scenes, making the annotation process all the more challenging. IOCfish5K is superior to existing datasets with indiscernible scenes because of its larger scale, higher image resolutions, more annotations, and denser scenes. All these aspects make it the most challenging dataset for IOC so far, supporting progress in this area. For benchmarking purposes, we select 14 mainstream methods for object counting and carefully evaluate them on IOCfish5K. Furthermore, we propose IOCFormer, a new strong baseline that combines density and regression branches in a unified framework and can effectively tackle object counting under concealed scenes. Experiments show that IOCFormer achieves state-of-the-art scores on IOCfish5K.
Abstract（参考訳）: 最近、不可解なシーン理解が視覚コミュニティに多くの注目を集めている。我々は,この分野のフロンティアをさらに進めるために,その周辺に混在する物体を数えることを目的とした,認識不能物体計数(IOC)という新たな課題を体系的に研究する。適切なIOCデータセットがないため,5,637個の高解像度画像と659,024個の注釈付き中心点を含む大規模データセットIOCfish5Kを提示する。我々のデータセットは、水中のシーンで認識できない多くの物体(主に魚)で構成されており、アノテーションプロセスはより困難である。 iocfish5kは、大きなスケール、高い解像度、より多くのアノテーション、より密集したシーンのため、識別不能なシーンを持つ既存のデータセットよりも優れている。これらすべての側面により、IOCにとって最も難しいデータセットとなり、この分野の進歩を支えている。ベンチマークのために,14の主流手法を選択し,IOCfish5K上で慎重に評価する。さらに,集中型フレームワークにおける密度と回帰分岐を組み合わせた新しい強力なベースラインであるIOCFormerを提案し,隠れたシーン下でのオブジェクトカウントに効果的に取り組むことができる。 IOCFormerはIOCfish5Kで最先端のスコアを得る。

関連論文リスト

BoRe-Depth: Self-supervised Monocular Depth Estimation with Boundary Refinement for Embedded Systems [14.113247032011282]
本研究では, 単分子深度推定モデルBoRe-Depthを提案する。組込みシステム上での深度マップを正確に推定し、境界品質を大幅に向上させることができる。 BoRe-DepthはNVIDIA Jetson Orin上にデプロイされ、50.7 FPSで効率的に動作する。
論文参考訳（メタデータ） (2025-11-06T14:17:33Z)
Depth-Assisted Network for Indiscernible Marine Object Counting with Adaptive Motion-Differentiated Feature Encoding [2.3552699229345264]
識別不能な海洋生物の数え方は、水中のシーンの視認性に制限があるなど、多くの課題に遭遇する。我々は50の動画からなる新しいデータセットを開発し、そこから800のフレームを抽出し、約40のポイントワイドオブジェクトラベルで注釈付けした。このデータセットは、認識不能な海洋生物が周囲と複雑に統合された実際の水中環境を正確に表現する。
論文参考訳（メタデータ） (2025-03-11T08:08:04Z)
MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。 MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。 MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文参考訳（メタデータ） (2024-12-08T09:34:23Z)
A Density-Guided Temporal Attention Transformer for Indiscernible Object Counting in Underwater Video [27.329015161325962]
周囲に混在する対象の数を数えることを目的とした、識別不能な対象数カウントは、課題となっている。本稿では,35の高精細ビデオを含むYoutubeFish-35という大規模データセットを提案する。統合されたフレームワークにおいて、時間領域に沿って密度と回帰の分岐を結合した新しい強力なベースラインであるTransVidCountを提案する。
論文参考訳（メタデータ） (2024-03-06T04:54:00Z)
Improving Underwater Visual Tracking With a Large Scale Dataset and Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文参考訳（メタデータ） (2023-08-30T07:41:26Z)
LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and Benchmark [9.864996020621701]
我々は,湖沼,河川,海のシーンを特徴とする,最初の海洋パノビュータ障害物検出ベンチマークLaRSを提示する。 LaRSは1ピクセルあたり4000以上のラベル付きキーフレームと9つの前のフレームで構成され、時間的テクスチャの利用を可能にしている。本稿では,27のセマンティック・パノプティック・セグメンテーション手法と,いくつかのパフォーマンスインサイトと今後の研究方向性について報告する。
論文参考訳（メタデータ） (2023-08-18T15:21:15Z)
Cascade-DETR: Delving into High-Quality Universal Object Detection [99.62131881419143]
高品質な普遍物体検出のためのカスケードDETRを提案する。本稿では,オブジェクト中心情報を検出デコーダに明示的に統合するカスケードアテンション層を提案する。最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
論文参考訳（メタデータ） (2023-07-20T17:11:20Z)
Densely Constrained Depth Estimator for Monocular 3D Object Detection [48.12271792836015]
モノクロ画像から物体の正確な3D位置を推定することは、深さが不足しているため難しい問題である。任意の方向の端から高密度な射影制約を利用する手法を提案する。提案手法は, KITTI および WOD ベンチマーク上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-07-20T17:24:22Z)
KOLOMVERSE: Korea open large-scale image dataset for object detection in the maritime universe [0.5732204366512352]
KRISO による海洋領域における物体検出のための大規模画像データセット KOLOMVERSE を提案する。韓国の21の領海から撮影した5,845時間の動画データを収集した。データセットには3840$times$2160ピクセルのイメージがあり、私たちの知る限り、海洋ドメインにおけるオブジェクト検出のための公開データセットとしては、これまでで最大のものである。
論文参考訳（メタデータ） (2022-06-20T16:45:12Z)
Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文参考訳（メタデータ） (2022-03-06T20:09:19Z)
ASOD60K: Audio-Induced Salient Object Detection in Panoramic Videos [79.05486554647918]
本研究では,パノラマビデオから有能な物体を分離する新しいタスクであるPV-SODを提案する。既存の固定レベルやオブジェクトレベルの塩分濃度検出タスクとは対照的に,多モードの塩分濃度検出(SOD)に焦点を当てる。 AsOD60Kという,6レベル階層の4K解像度ビデオフレームを含む,最初の大規模データセットを収集する。
論文参考訳（メタデータ） (2021-07-24T15:14:20Z)
Concealed Object Detection [140.98738087261887]
隠蔽物体検出(COD)に関する最初の体系的研究を紹介します。 CODは、背景に「完全に」埋め込まれているオブジェクトを特定することを目指しています。このタスクをより理解するために、cod10kと呼ばれる大規模なデータセットを収集します。
論文参考訳（メタデータ） (2021-02-20T06:49:53Z)
Counting from Sky: A Large-scale Dataset for Remote Sensing Object Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文参考訳（メタデータ） (2020-08-28T03:47:49Z)
RPT: Learning Point Set Representation for Siamese Visual Tracking [15.04182251944942]
本稿では,より詳細な表現を代表点の集合として,対象状態を正確に推定する効率的な視覚追跡フレームワークを提案する。提案手法は20FPS以上の動作中に新しい最先端性能を実現する。
論文参考訳（メタデータ） (2020-08-08T07:42:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。