論文の概要: Dilated-Scale-Aware Attention ConvNet For Multi-Class Object Counting
- arxiv url: http://arxiv.org/abs/2012.08149v1
- Date: Tue, 15 Dec 2020 08:38:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 10:44:32.823715
- Title: Dilated-Scale-Aware Attention ConvNet For Multi-Class Object Counting
- Title(参考訳): マルチクラスオブジェクトカウントのためのDilated-Scale-Aware Attention ConvNet
- Authors: Wei Xu, Dingkang Liang, Yixiao Zheng, Zhanyu Ma
- Abstract要約: 多クラスオブジェクトカウントは、オブジェクトカウントタスクの適用範囲を広げる。
マルチターゲット検出タスクは、いくつかのシナリオでマルチクラスオブジェクトカウントを実現することができる。
ポイントレベルのアノテーションに基づく簡便かつ効率的なカウントネットワークを提案する。
- 参考スコア(独自算出の注目度): 18.733301622920102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object counting aims to estimate the number of objects in images. The leading
counting approaches focus on the single category counting task and achieve
impressive performance. Note that there are multiple categories of objects in
real scenes. Multi-class object counting expands the scope of application of
object counting task. The multi-target detection task can achieve multi-class
object counting in some scenarios. However, it requires the dataset annotated
with bounding boxes. Compared with the point annotations in mainstream object
counting issues, the coordinate box-level annotations are more difficult to
obtain. In this paper, we propose a simple yet efficient counting network based
on point-level annotations. Specifically, we first change the traditional
output channel from one to the number of categories to achieve multiclass
counting. Since all categories of objects use the same feature extractor in our
proposed framework, their features will interfere mutually in the shared
feature space. We further design a multi-mask structure to suppress harmful
interaction among objects. Extensive experiments on the challenging benchmarks
illustrate that the proposed method achieves state-of-the-art counting
performance.
- Abstract(参考訳): オブジェクトカウントは、画像内のオブジェクト数を推定することを目的としている。
主要なカウント手法は、単一のカテゴリカウントタスクに集中し、素晴らしいパフォーマンスを達成する。
実際のシーンには複数のカテゴリのオブジェクトがある。
多クラスオブジェクトカウントは、オブジェクトカウントタスクの適用範囲を広げる。
マルチターゲット検出タスクは、いくつかのシナリオでマルチクラスオブジェクトカウントを実現することができる。
しかし、バウンディングボックスにアノテートされたデータセットが必要である。
主流のオブジェクトカウント問題におけるポイントアノテーションと比較すると、座標ボックスレベルのアノテーションは入手が難しい。
本稿では,ポイントレベルのアノテーションに基づく簡易かつ効率的な計数ネットワークを提案する。
具体的には、まず従来の出力チャネルを1つから複数のカテゴリに変更し、マルチクラスカウントを実現する。
提案するフレームワークでは,オブジェクトのすべてのカテゴリが同じ特徴抽出器を使用するため,それらの特徴は共有特徴空間において相互に干渉する。
さらに,物体間の有害な相互作用を抑制するマルチマスク構造を設計する。
試行錯誤実験により,提案手法が最先端の計数性能を実現することを示す。
関連論文リスト
- Learning to Count Anything: Reference-less Class-agnostic Counting with
Weak Supervision [11.037585450795357]
カウントは、その中核として、反復認識タスクであることを示す。
我々は,自己監督型視覚変換器と軽量のカウントレグレッションヘッドを組み合わせることで,競合する結果が得られることを示した。
論文 参考訳(メタデータ) (2022-05-20T14:26:38Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Interactive Multi-Class Tiny-Object Detection [11.243831167773678]
本稿では,複数のクラスからの小さなオブジェクトの複数インスタンスに対して,インタラクティブなアノテーション手法を提案する。
我々のアプローチであるC3Detは、局所的およびグローバル的にアノテータ入力とフルイメージコンテキストを関連づける。
提案手法は対話的アノテーションにおいて既存の手法よりも優れており,より少ないクリックで高いmAPを実現する。
論文 参考訳(メタデータ) (2022-03-29T06:27:29Z) - Iterative Learning for Instance Segmentation [0.0]
最先端のディープニューラルネットワークモデルは、このタスクでうまく機能するために、大量のラベル付きデータを必要とする。
本稿では,複数の類似したオブジェクトからなるデータセットのインスタンスの検出,セグメント化,アノテーション化が可能な反復学習およびアノテーション手法を提案する。
2つの異なるデータセットの実験は、視覚検査に関連する異なるアプリケーションにおけるアプローチの有効性を示している。
論文 参考訳(メタデータ) (2022-02-18T10:25:02Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Object Counting: You Only Need to Look at One [28.49828300257672]
本稿では,ワンショットオブジェクトカウントの課題に取り組むことを目的とする。
以前は目に見えない新しいカテゴリオブジェクトを含むイメージが与えられた場合、タスクの目標は、希望するカテゴリのすべてのインスタンスを1つのサポートされたバウンディングボックスの例でカウントすることである。
ひとつのインスタンス(LaoNet)を見るだけでよいカウントモデルを提案する。
論文 参考訳(メタデータ) (2021-12-11T14:22:05Z) - Scaling up instance annotation via label propagation [69.8001043244044]
本稿では,オブジェクトセグメンテーションマスクを用いた大規模データセット構築のための高効率アノテーション手法を提案する。
セグメンテーションモデルによるマスク予測に階層的クラスタリングを用いることにより,これらの類似性を生かした。
総アノテーション時間はたった290時間である100万個のオブジェクトセグメンテーションマスクが得られた。
論文 参考訳(メタデータ) (2021-10-05T18:29:34Z) - Associating Objects with Transformers for Video Object Segmentation [74.51719591192787]
本稿では,複数のオブジェクトを一様に一致・復号化するためのAssociating Objects with Transformers (AOT)アプローチを提案する。
AOTは複数のターゲットを同一の高次元埋め込み空間に関連付けるための識別機構を用いる。
第3回大規模ビデオオブジェクトチャレンジでは1位にランクインした。
論文 参考訳(メタデータ) (2021-06-04T17:59:57Z) - Learning To Count Everything [16.1159048148031]
あらゆるカテゴリからオブジェクトを数えることに興味があります。つまり、そのカテゴリからいくつかのアノテーション付きインスタンスだけを与えられたカテゴリからオブジェクトを数えることです。
本稿では,クエリ画像からいくつかの例のオブジェクトとともにクエリ画像を抽出し,クエリ画像に注目するオブジェクトが存在する場合の密度マップを予測する手法を提案する。
また、テスト時に新しい視覚カテゴリにネットワークを適応させるための新しい適応戦略も提示し、この新しいカテゴリのほんの数例のオブジェクトのみを使用します。
論文 参考訳(メタデータ) (2021-04-16T22:45:58Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。