論文の概要: Counting in the 2020s: Binned Representations and Inclusive Performance
Measures for Deep Crowd Counting Approaches
- arxiv url: http://arxiv.org/abs/2204.04653v1
- Date: Sun, 10 Apr 2022 11:02:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 17:40:57.329532
- Title: Counting in the 2020s: Binned Representations and Inclusive Performance
Measures for Deep Crowd Counting Approaches
- Title(参考訳): 2020年代のカウント: ディープ・クラウド・カウンティング・アプローチにおけるバインディング表現と包括的パフォーマンス対策
- Authors: Sravya Vardhani Shivapuja, Ashwin Gopinath, Ayush Gupta, Ganesh
Ramakrishnan, Ravi Kiran Sarvadevabhatla
- Abstract要約: データセットスキューの知識に合わせてトレーニングパイプラインを変更します。
原理的およびバランスの取れたミニバッチサンプリングを実現するために,新しいスムーズなベイズビンニング手法を提案する。
我々は、より包括的で、ディープネットワークの様々な比較パフォーマンス面に光を当てる、さらなるパフォーマンス対策を導入する。
- 参考スコア(独自算出の注目度): 21.595568866609067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The data distribution in popular crowd counting datasets is typically heavy
tailed and discontinuous. This skew affects all stages within the pipelines of
deep crowd counting approaches. Specifically, the approaches exhibit
unacceptably large standard deviation wrt statistical measures (MSE, MAE). To
address such concerns in a holistic manner, we make two fundamental
contributions. Firstly, we modify the training pipeline to accommodate the
knowledge of dataset skew. To enable principled and balanced minibatch
sampling, we propose a novel smoothed Bayesian binning approach. More
specifically, we propose a novel cost function which can be readily
incorporated into existing crowd counting deep networks to encourage bin-aware
optimization. As the second contribution, we introduce additional performance
measures which are more inclusive and throw light on various comparative
performance aspects of the deep networks. We also show that our binning-based
modifications retain their superiority wrt the newly proposed performance
measures. Overall, our contributions enable a practically useful and
detail-oriented characterization of performance for crowd counting approaches.
- Abstract(参考訳): 一般的な群集カウントデータセットのデータ分布は、通常、重く尾ばいで不連続である。
このスキューは、深い群衆カウントアプローチのパイプライン内のすべてのステージに影響する。
特に、これらの手法は許容できないほど大きな標準偏差Wrt統計測度(MSE, MAE)を示す。
このような懸念に包括的に対処するために、我々は2つの基本的な貢献をする。
まず、データセットスキューの知識に対応するために、トレーニングパイプラインを変更します。
原理的かつバランスの取れたミニバッチサンプリングを実現するために,新しいスムーズなベイズビンニング手法を提案する。
より具体的には,既存の計算深層ネットワークに容易に組み込むことができ,ビンアウェア最適化を促進する新しいコスト関数を提案する。
第2の貢献として,より包括的なパフォーマンス指標を導入し,ディープネットワークのさまざまな比較パフォーマンス側面に光を当てる。
また,新たに提案した性能対策の優位性を維持していることを示す。
全体として、我々のコントリビューションは、クラウドカウントアプローチにおけるパフォーマンスの実用的で詳細な評価を可能にする。
関連論文リスト
- Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-11T13:44:49Z) - Robust Unsupervised Crowd Counting and Localization with Adaptive
Resolution SAM [61.10712338956455]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Adaptive End-to-End Metric Learning for Zero-Shot Cross-Domain Slot
Filling [2.6056468338837457]
スロットフィリングは、トレーニング中にサンプルを見ることのない新しいドメインを扱う上で重要な課題である。
ほとんどの先行研究は、メートル法学習に基づく2パスパイプライン方式でこの問題に対処している。
そこで本研究では,ゼロショットスロットの補充に挑戦する手法として,適応的なエンドツーエンドの計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-23T19:01:16Z) - Adaptive Cross Batch Normalization for Metric Learning [75.91093210956116]
メトリクス学習はコンピュータビジョンの基本的な問題である。
蓄積した埋め込みが最新であることを保証することは、同様に重要であることを示す。
特に、蓄積した埋め込みと現在のトレーニングイテレーションにおける特徴埋め込みとの間の表現的ドリフトを回避する必要がある。
論文 参考訳(メタデータ) (2023-03-30T03:22:52Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Wisdom of (Binned) Crowds: A Bayesian Stratification Paradigm for Crowd
Counting [16.09823718637455]
本研究は,ストラタレベルの標準データセットとアグリゲーション単位での群集カウント手法の性能を解析する。
我々の貢献は、群衆カウントの手法における、微妙な、統計的にバランスのとれた、きめ細かな性能評価を表現している。
論文 参考訳(メタデータ) (2021-08-19T16:50:31Z) - Multi-Resolution Fusion and Multi-scale Input Priors Based Crowd
Counting [20.467558675556173]
本稿では,マルチレゾリューション・フュージョンに基づくエンドツーエンドのクラウドカウントネットワークを提案する。
PRMモジュールの効率的な代替として、3つの入力先が導入された。
提案手法は, クロスデータセット実験において, 最適な結果を得るために, より優れた一般化能力を有する。
論文 参考訳(メタデータ) (2020-10-04T19:30:13Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - Robust model training and generalisation with Studentising flows [22.757298187704745]
本稿では、ロバストな(特に耐性のある)統計からの洞察に基づいて、これらの手法をさらに改善する方法について論じる。
本稿では, ガウス分布の簡易なドロップイン置換として, 太い尾の潜伏分布を持つフローベースモデルを提案する。
いくつかの異なるデータセットの実験により、提案手法の有効性が確認された。
論文 参考訳(メタデータ) (2020-06-11T16:47:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。