論文の概要: SSR-HEF: Crowd Counting with Multi-Scale Semantic Refining and Hard
Example Focusing
- arxiv url: http://arxiv.org/abs/2204.07406v1
- Date: Fri, 15 Apr 2022 10:01:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 18:15:20.144288
- Title: SSR-HEF: Crowd Counting with Multi-Scale Semantic Refining and Hard
Example Focusing
- Title(参考訳): SSR-HEF: マルチスケールセマンティック精錬による集団カウントとハードケースフォーカス
- Authors: Jiwei Chen, Kewei Wang, Wen Su, Zengfu Wang
- Abstract要約: 群集カウントの回帰タスクに対するHard Example Focusing(HEF)アルゴリズムを提案する。
HEFアルゴリズムは、簡単なサンプルの寄与を減らし、ハードサンプルに迅速にフォーカスする。
提案手法を検証するため,6つのベンチマークデータセットについて広範な実験を行った。
- 参考スコア(独自算出の注目度): 21.326958308285114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Crowd counting based on density maps is generally regarded as a regression
task.Deep learning is used to learn the mapping between image content and crowd
density distribution. Although great success has been achieved, some
pedestrians far away from the camera are difficult to be detected. And the
number of hard examples is often larger. Existing methods with simple Euclidean
distance algorithm indiscriminately optimize the hard and easy examples so that
the densities of hard examples are usually incorrectly predicted to be lower or
even zero, which results in large counting errors. To address this problem, we
are the first to propose the Hard Example Focusing(HEF) algorithm for the
regression task of crowd counting. The HEF algorithm makes our model rapidly
focus on hard examples by attenuating the contribution of easy examples.Then
higher importance will be given to the hard examples with wrong estimations.
Moreover, the scale variations in crowd scenes are large, and the scale
annotations are labor-intensive and expensive. By proposing a multi-Scale
Semantic Refining (SSR) strategy, lower layers of our model can break through
the limitation of deep learning to capture semantic features of different
scales to sufficiently deal with the scale variation. We perform extensive
experiments on six benchmark datasets to verify the proposed method. Results
indicate the superiority of our proposed method over the state-of-the-art
methods. Moreover, our designed model is smaller and faster.
- Abstract(参考訳): 密度マップに基づく群衆カウントは一般に回帰課題と見なされ,画像内容と群衆密度分布のマッピングを学ぶために深層学習が用いられる。
かなりの成功を収めているが、カメラから遠く離れた歩行者を検知することは困難である。
そして、ハードな例の数は多くなります。
単純なユークリッド距離アルゴリズムによる既存の手法は、ハードと簡単な例を区別せずに最適化し、ハードの例の密度が誤って低いかゼロであると予測される。
この問題に対処するため,我々はまず,群集カウントの回帰タスクに対するHard Example Focusing(HEF)アルゴリズムを提案する。
hefアルゴリズムは簡単な例の寄与を弱め、ハードな例に素早く焦点を合わせます。
また、群衆シーンのスケールのバリエーションは多様であり、スケールアノテーションは労働集約的で高価である。
マルチスケールセマンティック精錬(SSR)戦略を提案することで、モデルの下位層はディープラーニングの限界を突破し、異なるスケールのセマンティックな特徴を捉え、スケールの変動に十分対処することができる。
提案手法を検証するため,6つのベンチマークデータセットについて広範な実験を行った。
その結果,提案手法が最先端手法よりも優れていることがわかった。
さらに、設計モデルはより小さく、より高速です。
関連論文リスト
- Robust compressive tracking via online weighted multiple instance learning [0.6813925418351435]
本稿では,スパース表現と重み付きマルチインスタンス学習(WMIL)アルゴリズムに基づく粗い検索戦略を統合することで,ビジュアルオブジェクト追跡アルゴリズムを提案する。
提案手法は,他のトラッカーと比較して,粗大な探索法によりより複雑度が低く,重要なサンプルの重み付けも可能である。
論文 参考訳(メタデータ) (2024-06-14T10:48:17Z) - Combating Representation Learning Disparity with Geometric Harmonization [50.29859682439571]
本稿では,表現学習におけるカテゴリレベルの均一性を促進するために,新しい幾何調和法を提案する。
我々の提案はSSLの設定を変更せず、低コストで既存のメソッドに容易に統合できる。
論文 参考訳(メタデータ) (2023-10-26T17:41:11Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - Learning Large Scale Sparse Models [6.428186644949941]
サンプルの数や特徴次元が数百万から数十億にも達する大規模環境でスパースモデルを学習することを検討する。
ラッソのようなスパースモデルをオンライン的に学習し、ランダムに選択されたサンプルが1つだけ露呈してスパース勾配を更新することを提案する。
これにより、メモリコストはサンプルサイズに依存しず、1つのサンプルの勾配評価が効率的となる。
論文 参考訳(メタデータ) (2023-01-26T06:29:49Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - When in Doubt, Summon the Titans: Efficient Inference with Large Models [80.2673230098021]
本稿では,大規模モデルのモデル化の利点を実現する蒸留に基づく2段階の枠組みを提案する。
簡単な"例のサブセットでのみ正確な予測を行うために、私たちは、大きな教師モデルを使用して、軽量な学生モデルをガイドします。
提案した蒸留法は, 簡単な事例のみを扱うため, 学生規模でより積極的なトレードオフが可能であり, 推論の償却コストを低減できる。
論文 参考訳(メタデータ) (2021-10-19T22:56:49Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Robust and On-the-fly Dataset Denoising for Image Classification [72.10311040730815]
On-the-fly Data Denoising (ODD)は、間違ったラベルの例に対して堅牢だが、通常のトレーニングと比べて計算オーバーヘッドはほぼゼロである。
ODDはWebVisionやClothing1Mといった現実世界のデータセットを含む、幅広いデータセットで最先端の結果を達成することができる。
論文 参考訳(メタデータ) (2020-03-24T03:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。