論文の概要: Cross-head Supervision for Crowd Counting with Noisy Annotations
- arxiv url: http://arxiv.org/abs/2303.09245v1
- Date: Thu, 16 Mar 2023 11:45:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:50:39.030890
- Title: Cross-head Supervision for Crowd Counting with Noisy Annotations
- Title(参考訳): ノイズアノテートによる群集カウントのクロスヘッド・スーパービジョン
- Authors: Mingliang Dai, Zhizhong Huang, Jiaqi Gao, Hongming Shan and Junping
Zhang
- Abstract要約: ノイズの多いアノテーションはモデルのトレーニング、特に密度マップベースのメソッドに大きく影響します。
本研究では, 1つの畳み込み頭部と1つの変圧器頭部を有する群集カウントモデルを提案する。
結果のモデルであるCHS-Netは、様々な種類の帰納バイアスを相乗化して、より良いカウントを行うことができる。
- 参考スコア(独自算出の注目度): 37.542109747496376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy annotations such as missing annotations and location shifts often exist
in crowd counting datasets due to multi-scale head sizes, high occlusion, etc.
These noisy annotations severely affect the model training, especially for
density map-based methods. To alleviate the negative impact of noisy
annotations, we propose a novel crowd counting model with one convolution head
and one transformer head, in which these two heads can supervise each other in
noisy areas, called Cross-Head Supervision. The resultant model, CHS-Net, can
synergize different types of inductive biases for better counting. In addition,
we develop a progressive cross-head supervision learning strategy to stabilize
the training process and provide more reliable supervision. Extensive
experimental results on ShanghaiTech and QNRF datasets demonstrate superior
performance over state-of-the-art methods. Code is available at
https://github.com/RaccoonDML/CHSNet.
- Abstract(参考訳): 複数スケールのヘッドサイズや高いオクルージョンなどにより、群衆計数データセットには、アノテーションの欠如や位置シフトなどの騒がしいアノテーションがしばしば存在する。
これらのノイズの多いアノテーションはモデルトレーニング、特に密度マップベースの手法に大きく影響します。
そこで我々は,この2つの頭部が互いにノイズの多い領域(クロスヘッドスーパービジョン)で相互に監視できる,1つの畳み込みヘッドと1つのトランスフォーマーヘッドを持つ新規な群集カウントモデルを提案する。
結果のモデルであるCHS-Netは、様々な種類の帰納バイアスを相乗化して、より良いカウントを行うことができる。
さらに,訓練過程を安定させ,より信頼性の高い監督を行うための,漸進的なクロスヘッド指導学習戦略を開発する。
上海技術とQNRFデータセットの大規模な実験結果は、最先端の手法よりも優れた性能を示している。
コードはhttps://github.com/RaccoonDML/CHSNetで入手できる。
関連論文リスト
- Towards Practical Plug-and-Play Diffusion Models [19.846094740800254]
拡散に基づく生成モデルは、画像生成において顕著な成功を収めた。
市販の市販オフザシェルフモデルのガイダンスへの直接的使用は、ノイズの多い入力のパフォーマンスが低かったために失敗する。
既存のプラクティスは、ノイズで汚染されたラベル付きデータでガイダンスモデルを微調整することです。
論文 参考訳(メタデータ) (2022-12-12T15:29:46Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - Semi-supervised Crowd Counting via Density Agency [57.3635501421658]
我々は、学習可能な補助構造、すなわち密度エージェンシーを構築し、認識された前景の地域特徴を対応する密度サブクラスに近づける。
第2に,バックボーン特徴抽出器を統合するために,密度誘導型コントラスト学習損失を提案する。
第3に,前景の機能を改良するためにトランス構造を用いて回帰ヘッドを構築する。
論文 参考訳(メタデータ) (2022-09-07T06:34:00Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Semi-Supervised Wide-Angle Portraits Correction by Multi-Scale
Transformer [17.455782652441187]
広角画像補正のための半教師付きネットワークを提案する。
我々のネットワークはMulti-Scale Swin-Unet(MS-Unet)と呼ばれ、MSTB(Multi-scale Swin-Unet)上に構築されている。
論文 参考訳(メタデータ) (2021-09-14T09:40:25Z) - Crowd Counting via Perspective-Guided Fractional-Dilation Convolution [75.36662947203192]
本稿では,PFDNetと呼ばれる新しい畳み込みニューラルネットワークを用いた群集カウント手法を提案する。
連続スケールの変動をモデル化することにより、提案したPFDNetは、異なる空間位置に対応するための適切な分数拡張カーネルを選択することができる。
これは、個々の代表スケールのみを考慮した最先端技術の柔軟性を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-08T07:57:00Z) - Robust Unsupervised Multi-Object Tracking in Noisy Environments [5.409476600348953]
頑健なマルチオブジェクト追跡(MOT)モデルである AttU-Net を導入する。
提案したシングルヘッドアテンションモデルは、異なるセグメントスケールでの視覚的表現を学習することで、ノイズの負の影響を制限するのに役立つ。
本手法をMNISTとAtariゲームビデオベンチマークで評価する。
論文 参考訳(メタデータ) (2021-05-20T19:38:03Z) - Temporal Calibrated Regularization for Robust Noisy Label Learning [60.90967240168525]
ディープニューラルネットワーク(DNN)は、大規模な注釈付きデータセットの助けを借りて、多くのタスクで大きな成功を収めている。
しかし、大規模なデータのラベル付けは非常にコストがかかりエラーが発生しやすいため、アノテーションの品質を保証することは困難である。
本稿では,従来のラベルと予測を併用したTCR(Temporal Calibrated Regularization)を提案する。
論文 参考訳(メタデータ) (2020-07-01T04:48:49Z) - Learning to Generate Noise for Multi-Attack Robustness [126.23656251512762]
対人学習は、対人摂動に対する既存の方法の感受性を回避できる手法の1つとして登場した。
安全クリティカルなアプリケーションでは、攻撃者は様々な敵を採用してシステムを騙すことができるため、これらの手法は極端に便利である。
本稿では,複数種類の攻撃に対するモデルの堅牢性を改善するために,ノイズ発生を明示的に学習するメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T10:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。