論文の概要: Cross-head Supervision for Crowd Counting with Noisy Annotations
- arxiv url: http://arxiv.org/abs/2303.09245v1
- Date: Thu, 16 Mar 2023 11:45:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:50:39.030890
- Title: Cross-head Supervision for Crowd Counting with Noisy Annotations
- Title(参考訳): ノイズアノテートによる群集カウントのクロスヘッド・スーパービジョン
- Authors: Mingliang Dai, Zhizhong Huang, Jiaqi Gao, Hongming Shan and Junping
Zhang
- Abstract要約: ノイズの多いアノテーションはモデルのトレーニング、特に密度マップベースのメソッドに大きく影響します。
本研究では, 1つの畳み込み頭部と1つの変圧器頭部を有する群集カウントモデルを提案する。
結果のモデルであるCHS-Netは、様々な種類の帰納バイアスを相乗化して、より良いカウントを行うことができる。
- 参考スコア(独自算出の注目度): 37.542109747496376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Noisy annotations such as missing annotations and location shifts often exist
in crowd counting datasets due to multi-scale head sizes, high occlusion, etc.
These noisy annotations severely affect the model training, especially for
density map-based methods. To alleviate the negative impact of noisy
annotations, we propose a novel crowd counting model with one convolution head
and one transformer head, in which these two heads can supervise each other in
noisy areas, called Cross-Head Supervision. The resultant model, CHS-Net, can
synergize different types of inductive biases for better counting. In addition,
we develop a progressive cross-head supervision learning strategy to stabilize
the training process and provide more reliable supervision. Extensive
experimental results on ShanghaiTech and QNRF datasets demonstrate superior
performance over state-of-the-art methods. Code is available at
https://github.com/RaccoonDML/CHSNet.
- Abstract(参考訳): 複数スケールのヘッドサイズや高いオクルージョンなどにより、群衆計数データセットには、アノテーションの欠如や位置シフトなどの騒がしいアノテーションがしばしば存在する。
これらのノイズの多いアノテーションはモデルトレーニング、特に密度マップベースの手法に大きく影響します。
そこで我々は,この2つの頭部が互いにノイズの多い領域(クロスヘッドスーパービジョン)で相互に監視できる,1つの畳み込みヘッドと1つのトランスフォーマーヘッドを持つ新規な群集カウントモデルを提案する。
結果のモデルであるCHS-Netは、様々な種類の帰納バイアスを相乗化して、より良いカウントを行うことができる。
さらに,訓練過程を安定させ,より信頼性の高い監督を行うための,漸進的なクロスヘッド指導学習戦略を開発する。
上海技術とQNRFデータセットの大規模な実験結果は、最先端の手法よりも優れた性能を示している。
コードはhttps://github.com/RaccoonDML/CHSNetで入手できる。
関連論文リスト
- Scale-Aware Crowd Count Network with Annotation Error Correction [19.036693336902662]
従来のクラウドカウントネットワークは、プール層を通じてフィーチャーマップがダウンサイズされると、情報損失に悩まされる。
本稿では,ノイズの多いアノテーションの誤り訂正機能を備えたスケール・アウェア・アーキテクチャを導入するスケール・アウェア・クラウドカウンティング・ネットワーク(SACC-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-28T01:36:38Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - Semi-Supervised Crowd Counting with Contextual Modeling: Facilitating Holistic Understanding of Crowd Scenes [19.987151025364067]
本稿では,信頼度の高い群集カウントモデルをトレーニングするための,新しい半教師付き手法を提案する。
モデルの本質的な'サブタイズ'能力を育み、領域の数を正確に見積もることができる。
提案手法は,従来の手法を,挑戦的ベンチマークにおいて大きな差で上回り,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-16T12:42:43Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Crowd Counting via Perspective-Guided Fractional-Dilation Convolution [75.36662947203192]
本稿では,PFDNetと呼ばれる新しい畳み込みニューラルネットワークを用いた群集カウント手法を提案する。
連続スケールの変動をモデル化することにより、提案したPFDNetは、異なる空間位置に対応するための適切な分数拡張カーネルを選択することができる。
これは、個々の代表スケールのみを考慮した最先端技術の柔軟性を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-08T07:57:00Z) - Robust Unsupervised Multi-Object Tracking in Noisy Environments [5.409476600348953]
頑健なマルチオブジェクト追跡(MOT)モデルである AttU-Net を導入する。
提案したシングルヘッドアテンションモデルは、異なるセグメントスケールでの視覚的表現を学習することで、ノイズの負の影響を制限するのに役立つ。
本手法をMNISTとAtariゲームビデオベンチマークで評価する。
論文 参考訳(メタデータ) (2021-05-20T19:38:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。