論文の概要: DISCount: Counting in Large Image Collections with Detector-Based
Importance Sampling
- arxiv url: http://arxiv.org/abs/2306.03151v1
- Date: Mon, 5 Jun 2023 18:04:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 19:00:08.472917
- Title: DISCount: Counting in Large Image Collections with Detector-Based
Importance Sampling
- Title(参考訳): DisCount: インテグレータベースのインポートサンプリングによる大規模なイメージコレクションのカウント
- Authors: Gustavo Perez, Subhransu Maji, Daniel Sheldon
- Abstract要約: DISCountは、大規模な画像収集をカウントするための検出器ベースの重要なサンプリングフレームワークである。
これは、不完全な検知器とループ内のヒトスクリーニングを統合して、不偏のカウント推定を生成する。
- 参考スコア(独自算出の注目度): 32.522579550452484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many modern applications use computer vision to detect and count objects in
massive image collections. However, when the detection task is very difficult
or in the presence of domain shifts, the counts may be inaccurate even with
significant investments in training data and model development. We propose
DISCount -- a detector-based importance sampling framework for counting in
large image collections that integrates an imperfect detector with
human-in-the-loop screening to produce unbiased estimates of counts. We propose
techniques for solving counting problems over multiple spatial or temporal
regions using a small number of screened samples and estimate confidence
intervals. This enables end-users to stop screening when estimates are
sufficiently accurate, which is often the goal in a scientific study. On the
technical side we develop variance reduction techniques based on control
variates and prove the (conditional) unbiasedness of the estimators. DISCount
leads to a 9-12x reduction in the labeling costs over naive screening for tasks
we consider, such as counting birds in radar imagery or estimating damaged
buildings in satellite imagery, and also surpasses alternative covariate-based
screening approaches in efficiency.
- Abstract(参考訳): 現代の多くのアプリケーションはコンピュータビジョンを使って大量の画像コレクション中の物体を検出し、数えている。
しかし、検出タスクが非常に難しい場合や、ドメインシフトが存在する場合、トレーニングデータやモデル開発に多大な投資をしても、カウントは不正確である可能性がある。
DisCountは,不完全な検出器とループ内スクリーニングを統合した大規模な画像収集をカウントするための,検出に基づく重要度サンプリングフレームワークである。
少数のスクリーニングサンプルと推定信頼区間を用いて,複数の空間的・時間的領域にまたがる数え上げ問題の解法を提案する。
これにより、評価が十分に正確であれば、エンドユーザーがスクリーニングを止めることができる。
技術面では,制御変動に基づく分散低減手法を開発し,推定器の(条件付き)不偏性を証明する。
ディスカウントは、レーダー画像における鳥の計数や衛星画像における損傷した建物の推定など、私たちが検討するタスクのナイーブなスクリーニングよりも9〜12倍のラベリングコストを削減し、また、効率の面では、他の共変量に基づくスクリーニングアプローチを上回っている。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.461109095311546]
ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文 参考訳(メタデータ) (2024-09-27T12:20:29Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - DAVE -- A Detect-and-Verify Paradigm for Low-Shot Counting [10.461109095311546]
ローショットカウンタは、画像の例の少ないものまたは全くないものに基づいて、選択されたカテゴリに対応するオブジェクトの数を推定する。
現在の最先端技術では、対象位置密度マップの合計として総計を見積もっているが、個々の対象位置と大きさは提供していない。
本稿では,検出と検証のパラダイムに基づく低ショットカウンタであるDAVEを提案する。
論文 参考訳(メタデータ) (2024-04-25T14:07:52Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - MMNet: Multi-Collaboration and Multi-Supervision Network for Sequential
Deepfake Detection [81.59191603867586]
シークエンシャルディープフェイク検出は、回復のための正しいシーケンスで偽の顔領域を特定することを目的としている。
偽画像の復元には、逆変換を実装するための操作モデルの知識が必要である。
顔画像の空間スケールや逐次順列化を扱うマルチコラボレーション・マルチスーパービジョンネットワーク(MMNet)を提案する。
論文 参考訳(メタデータ) (2023-07-06T02:32:08Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - IS-COUNT: Large-scale Object Counting from Satellite Images with
Covariate-based Importance Sampling [90.97859312029615]
本研究では,大規模地形におけるオブジェクト数統計をサンプリングによって推定する手法を提案する。
提案手法は,米国とアフリカ,ケニアの自動車,バングラデシュのレンガキルン,米国のスイミングプールの建物数の推定において,高い性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-12-16T18:59:29Z) - Filtering Empty Camera Trap Images in Embedded Systems [0.0]
本稿では,動物認識モデルの比較研究を行い,エッジデバイス上での精度と推論遅延のトレードオフを解析する。
実験の結果、同じ画像をトレーニングに使用すると、検出器の性能が向上することがわかった。
検出問題のラベルを生成するコストが高いことを考えると、分類にラベル付けされた大量の画像が存在する場合、分類器は検出器に匹敵する結果が得られるが、半分のレイテンシを持つ。
論文 参考訳(メタデータ) (2021-04-18T13:56:22Z) - Localizing Grouped Instances for Efficient Detection in Low-Resource
Scenarios [27.920304852537534]
可変物体の大きさや密度に適応するフレキシブルな検出手法を提案する。
我々は検出段階の連続に頼り、それぞれが個人だけでなく、対象の群を予測できる能力を持っている。
本稿では,2つの航空画像データセットの実験結果について報告し,提案手法が標準単発検出器よりも精度が高く,計算効率も高いことを示す。
論文 参考訳(メタデータ) (2020-04-27T07:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。