論文の概要: Single Image Object Counting and Localizing using Active-Learning
- arxiv url: http://arxiv.org/abs/2111.08383v1
- Date: Tue, 16 Nov 2021 11:29:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 15:03:37.438613
- Title: Single Image Object Counting and Localizing using Active-Learning
- Title(参考訳): アクティブラーニングによる単一画像オブジェクトのカウントと局所化
- Authors: Inbar Huberman-Spiegelglas and Raanan Fattal
- Abstract要約: 単一画像シナリオにおける反復オブジェクトのカウントとローカライズのための新しい手法を提案する。
本手法は,少数のアクティブ・ラーニング・イテレーションにおいて,入力画像から注意深く収集したラベルの小さなセットに対してCNNを訓練する。
既存のユーザ支援カウント法と比較すると,ユーザマウスのクリック数,ランニングタイムの計測と位置決めの精度の観点から,能動的学習が最先端のパフォーマンスを達成している。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The need to count and localize repeating objects in an image arises in
different scenarios, such as biological microscopy studies, production lines
inspection, and surveillance recordings analysis. The use of supervised
Convoutional Neural Networks (CNNs) achieves accurate object detection when
trained over large class-specific datasets. The labeling effort in this
approach does not pay-off when the counting is required over few images of a
unique object class.
We present a new method for counting and localizing repeating objects in
single-image scenarios, assuming no pre-trained classifier is available. Our
method trains a CNN over a small set of labels carefully collected from the
input image in few active-learning iterations. At each iteration, the latent
space of the network is analyzed to extract a minimal number of user-queries
that strives to both sample the in-class manifold as thoroughly as possible as
well as avoid redundant labels.
Compared with existing user-assisted counting methods, our active-learning
iterations achieve state-of-the-art performance in terms of counting and
localizing accuracy, number of user mouse clicks, and running-time. This
evaluation was performed through a large user study over a wide range of image
classes with diverse conditions of illumination and occlusions.
- Abstract(参考訳): 画像内の繰り返しオブジェクトを数えてローカライズする必要性は、生物顕微鏡の研究、生産ラインの検査、監視記録分析など、さまざまなシナリオで生じる。
教師付きConvoutional Neural Networks(CNN)の使用は、大規模なクラス固有のデータセットでトレーニングされた場合、正確なオブジェクト検出を実現する。
このアプローチにおけるラベル付けの取り組みは、ユニークなオブジェクトクラスの少数のイメージに対してカウントが要求される場合、報われない。
本稿では,事前学習済みの分類器がないことを前提として,単一画像シナリオにおける繰り返しオブジェクトのカウントとローカライズを行う新しい手法を提案する。
本手法は,少数のアクティブラーニングイテレーションにおいて,入力画像から注意深く収集したラベルセット上でcnnを訓練する。
各イテレーションで、ネットワークの潜在空間を分析して、クラス内の多様体を可能な限り徹底的にサンプリングし、冗長なラベルを避けるために、最小限のユーザクエリを抽出する。
既存のユーザ支援計数手法と比較して,アクティブラーニングの反復は,精度,マウスクリック数,実行時間といった面で最先端のパフォーマンスを実現している。
この評価は,照明条件や閉塞条件の多種多様な画像クラスを対象とした大規模なユーザ調査を通じて行われた。
関連論文リスト
- Zero-Shot Object Counting with Language-Vision Models [50.1159882903028]
クラスに依存しないオブジェクトカウントは、テスト時に任意のクラスのオブジェクトインスタンスをカウントすることを目的としている。
現在の手法では、新しいカテゴリではしばしば利用できない入力として、人間に注釈をつけた模範を必要とする。
テスト期間中にクラス名のみを利用できる新しい設定であるゼロショットオブジェクトカウント(ZSC)を提案する。
論文 参考訳(メタデータ) (2023-09-22T14:48:42Z) - Mixture of Self-Supervised Learning [2.191505742658975]
自己教師型学習は、特定のタスクに適用される前にモデル上でトレーニングされるプレテキストタスクを使用することで機能する。
従来の研究では、プリテキストタスクとして1つのタイプの変換しか使用されていなかった。
これにより、複数のプリテキストタスクが使用されているかどうか、すべてのプリテキストタスクを組み合わせるためにゲーティングネットワークを使用するかどうか、という疑問が持ち上がる。
論文 参考訳(メタデータ) (2023-07-27T14:38:32Z) - Disambiguation of One-Shot Visual Classification Tasks: A Simplex-Based
Approach [8.436437583394998]
本稿では,複数の物体の存在を検出するための戦略を提案する。
この戦略は、高次元空間における単純体の角を識別することに基づいている。
提案手法は,極端設定における精度をわずかながら統計的に向上させる能力を示す。
論文 参考訳(メタデータ) (2023-01-16T11:37:05Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Iterative Learning for Instance Segmentation [0.0]
最先端のディープニューラルネットワークモデルは、このタスクでうまく機能するために、大量のラベル付きデータを必要とする。
本稿では,複数の類似したオブジェクトからなるデータセットのインスタンスの検出,セグメント化,アノテーション化が可能な反復学習およびアノテーション手法を提案する。
2つの異なるデータセットの実験は、視覚検査に関連する異なるアプリケーションにおけるアプローチの有効性を示している。
論文 参考訳(メタデータ) (2022-02-18T10:25:02Z) - Experience feedback using Representation Learning for Few-Shot Object
Detection on Aerial Images [2.8560476609689185]
大規模なリモートセンシング画像データセットであるDOTAを用いて,本手法の性能評価を行った。
特に、数発のオブジェクト検出タスクの固有の弱点を強調します。
論文 参考訳(メタデータ) (2021-09-27T13:04:53Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。