論文の概要: AFreeCA: Annotation-Free Counting for All
- arxiv url: http://arxiv.org/abs/2403.04943v2
- Date: Thu, 1 Aug 2024 18:55:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 18:23:26.682427
- Title: AFreeCA: Annotation-Free Counting for All
- Title(参考訳): AFreeCA: annotation-free Counting for all
- Authors: Adriano D'Alessandro, Ali Mahdavi-Amiri, Ghassan Hamarneh,
- Abstract要約: 対象物に関連する特徴を学習するための教師なしソート手法を導入する。
また,画像を確実にカウント可能な被写体を含むパッチに分割する密度分類器誘導方式を提案する。
- 参考スコア(独自算出の注目度): 17.581015609730017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object counting methods typically rely on manually annotated datasets. The cost of creating such datasets has restricted the versatility of these networks to count objects from specific classes (such as humans or penguins), and counting objects from diverse categories remains a challenge. The availability of robust text-to-image latent diffusion models (LDMs) raises the question of whether these models can be utilized to generate counting datasets. However, LDMs struggle to create images with an exact number of objects based solely on text prompts but they can be used to offer a dependable \textit{sorting} signal by adding and removing objects within an image. Leveraging this data, we initially introduce an unsupervised sorting methodology to learn object-related features that are subsequently refined and anchored for counting purposes using counting data generated by LDMs. Further, we present a density classifier-guided method for dividing an image into patches containing objects that can be reliably counted. Consequently, we can generate counting data for any type of object and count them in an unsupervised manner. Our approach outperforms other unsupervised and few-shot alternatives and is not restricted to specific object classes for which counting data is available. Code to be released upon acceptance.
- Abstract(参考訳): オブジェクトカウントメソッドは通常、手動でアノテートされたデータセットに依存します。
このようなデータセットを作成するコストは、特定のクラス(人間やペンギンなど)からオブジェクトをカウントするネットワークの汎用性を制限しており、さまざまなカテゴリからオブジェクトをカウントすることは依然として困難である。
堅牢なテキスト・ツー・イメージ遅延拡散モデル(LDM)が利用可能になったことで、これらのモデルがカウントデータセットの生成に利用できるかどうかという疑問が持ち上がった。
しかし、LCMはテキストプロンプトのみに基づいて、正確な数のオブジェクトを持つイメージを作成するのに苦労するが、イメージ内のオブジェクトの追加や削除によって、信頼性の高い \textit{sorting} シグナルを提供するために使用できる。
このデータを活用することで、最初はオブジェクト関連の特徴を学習するための教師なしのソート手法を導入し、その後、LCDによって生成されたカウントデータを用いて、カウントのために洗練され、アンロックされる。
さらに,画像を確実にカウント可能な被写体を含むパッチに分割する密度分類器誘導方式を提案する。
その結果、任意の種類のオブジェクトのカウントデータを生成し、教師なしの方法でカウントすることができる。
我々のアプローチは、他の教師なしおよび少数ショットの代替よりも優れており、データをカウントできる特定のオブジェクトクラスに限定されていません。
承認された時にリリースされるコード。
関連論文リスト
- NWPU-MOC: A Benchmark for Fine-grained Multi-category Object Counting in
Aerial Images [64.92809155168595]
本稿では,空中画像中の異なる物体の数を推定する多カテゴリオブジェクトカウントタスクを提案する。
このタスクのデータセットが存在しないことを考慮して、大規模なデータセットが収集され、解像度が1024$times$1024ピクセルの3,416のシーンで構成されている。
本稿では,RGB と NIR の特徴を融合させるために,デュアルアテンションモジュールを用いたマルチスペクトル・マルチカテゴリオブジェクトカウントフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-19T07:12:36Z) - Zero-Shot Object Counting with Language-Vision Models [50.1159882903028]
クラスに依存しないオブジェクトカウントは、テスト時に任意のクラスのオブジェクトインスタンスをカウントすることを目的としている。
現在の手法では、新しいカテゴリではしばしば利用できない入力として、人間に注釈をつけた模範を必要とする。
テスト期間中にクラス名のみを利用できる新しい設定であるゼロショットオブジェクトカウント(ZSC)を提案する。
論文 参考訳(メタデータ) (2023-09-22T14:48:42Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Learning from Pseudo-labeled Segmentation for Multi-Class Object
Counting [35.652092907690694]
CAC(Class-Agnostic counting)は、様々な領域にまたがる多くの潜在的な応用がある。
目標は、いくつかの注釈付き例に基づいて、テスト中に任意のカテゴリのオブジェクトを数えることである。
擬似ラベルマスクを用いて学習したセグメンテーションモデルは、任意のマルチクラス画像に対して効果的に対象をローカライズできることを示す。
論文 参考訳(メタデータ) (2023-07-15T01:33:19Z) - Linear Object Detection in Document Images using Multiple Object
Tracking [58.720142291102135]
線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:22:03Z) - Single Image Object Counting and Localizing using Active-Learning [4.56877715768796]
単一画像シナリオにおける反復オブジェクトのカウントとローカライズのための新しい手法を提案する。
本手法は,少数のアクティブ・ラーニング・イテレーションにおいて,入力画像から注意深く収集したラベルの小さなセットに対してCNNを訓練する。
既存のユーザ支援カウント法と比較すると,ユーザマウスのクリック数,ランニングタイムの計測と位置決めの精度の観点から,能動的学習が最先端のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2021-11-16T11:29:21Z) - Dilated-Scale-Aware Attention ConvNet For Multi-Class Object Counting [18.733301622920102]
多クラスオブジェクトカウントは、オブジェクトカウントタスクの適用範囲を広げる。
マルチターゲット検出タスクは、いくつかのシナリオでマルチクラスオブジェクトカウントを実現することができる。
ポイントレベルのアノテーションに基づく簡便かつ効率的なカウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T08:38:28Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z) - Rethinking Object Detection in Retail Stores [55.359582952686175]
そこで我々はLocountと略される新しいタスク、同時にオブジェクトのローカライゼーションとカウントを提案する。
Locountは、関心のあるオブジェクトのグループをインスタンス数でローカライズするアルゴリズムを必要とする。
大規模オブジェクトのローカライズと数えるデータセットを小売店で収集する。
論文 参考訳(メタデータ) (2020-03-18T14:01:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。