論文の概要: Tolerating Annotation Displacement in Dense Object Counting via Point
Annotation Probability Map
- arxiv url: http://arxiv.org/abs/2308.00530v2
- Date: Wed, 8 Nov 2023 07:43:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 19:25:40.365567
- Title: Tolerating Annotation Displacement in Dense Object Counting via Point
Annotation Probability Map
- Title(参考訳): ポイントアノテーション確率マップを用いた高密度物体カウントにおけるアノテーション配置の許容
- Authors: Yuehai Chen, Jing Yang, Badong Chen, Hua Gang, Shaoyi Du
- Abstract要約: 混雑したシーンでオブジェクトをカウントすることは、コンピュータビジョンにとって依然として難しい課題だ。
学習目標点アノテーション確率マップ(PAPM)を提案する。
また,適応学習型PAPM法(AL-PAPM)を提案する。
- 参考スコア(独自算出の注目度): 25.203803417049528
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Counting objects in crowded scenes remains a challenge to computer vision.
The current deep learning based approach often formulate it as a Gaussian
density regression problem. Such a brute-force regression, though effective,
may not consider the annotation displacement properly which arises from the
human annotation process and may lead to different distributions. We conjecture
that it would be beneficial to consider the annotation displacement in the
dense object counting task. To obtain strong robustness against annotation
displacement, generalized Gaussian distribution (GGD) function with a tunable
bandwidth and shape parameter is exploited to form the learning target point
annotation probability map, PAPM. Specifically, we first present a
hand-designed PAPM method (HD-PAPM), in which we design a function based on GGD
to tolerate the annotation displacement. For end-to-end training, the
hand-designed PAPM may not be optimal for the particular network and dataset.
An adaptively learned PAPM method (AL-PAPM) is proposed. To improve the
robustness to annotation displacement, we design an effective transport cost
function based on GGD. The proposed PAPM is capable of integration with other
methods. We also combine PAPM with P2PNet through modifying the matching cost
matrix, forming P2P-PAPM. This could also improve the robustness to annotation
displacement of P2PNet. Extensive experiments show the superiority of our
proposed methods.
- Abstract(参考訳): 混雑したシーンでオブジェクトを数えることは、コンピュータビジョンにとって課題である。
現在のディープラーニングに基づくアプローチは、しばしばガウス密度回帰問題として定式化する。
このようなブルートフォース回帰は有効ではあるが、人間のアノテーションプロセスから生じるアノテーションの変位を適切に考慮せず、異なる分布に繋がる可能性がある。
我々は、高密度オブジェクトカウントタスクにおけるアノテーションの変位を考慮することは有益であると推測する。
アノテーションの変位に対する強い堅牢性を得るために、調整可能な帯域幅と形状パラメータを持つ一般化ガウス分布(GGD)関数を利用して学習目標点アノテーション確率マップ、PAPMを形成する。
具体的には,まず手書きのPAPM法(HD-PAPM)を提案し,GGDに基づく関数を設計し,アノテーションの変位を許容する。
エンドツーエンドのトレーニングでは、ハンドデザインのPAPMは特定のネットワークやデータセットに最適ではないかもしれない。
適応学習型PAPM法(AL-PAPM)を提案する。
アノテーションの変位に対するロバスト性を改善するため,GGDに基づく効率的な輸送コスト関数を設計する。
提案したPAPMは他の手法と統合できる。
また,PAPMとP2PNetを組み合わせることで,P2P-PAPMを形成する。
これにより、P2PNetのアノテーション変位に対する堅牢性も向上する。
大規模な実験により提案手法の優位性を示した。
関連論文リスト
- CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - Regressor-Segmenter Mutual Prompt Learning for Crowd Counting [70.49246560246736]
本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。
実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
論文 参考訳(メタデータ) (2023-12-04T07:53:59Z) - Robust Face Anti-Spoofing with Dual Probabilistic Modeling [49.14353429234298]
本稿では、DPM-LQ(ラベル品質認識学習)とDPM-DQ(データ品質認識学習)という2つの専用モジュールを備えたDPM(Dual Probabilistic Modeling)という統合フレームワークを提案する。
DPM-LQは、ノイズのあるセマンティックラベルの分布に過度に適合することなく、ロバストな特徴表現を生成することができる。
DPM-DQは、その品質分布に基づいてノイズデータの予測信頼度を補正することにより、推論中のFalse Reject'およびFalse Accept'からデータノイズを除去することができる。
論文 参考訳(メタデータ) (2022-04-27T03:44:18Z) - Partial Wasserstein Adversarial Network for Non-rigid Point Set
Registration [33.70389309762202]
2つの点集合が与えられた場合、登録の問題は一方が他方と一致する変換を回復することである。
登録問題を部分分布マッチング(PDM)問題として定式化し,その目的は距離空間内の点集合で表される分布を部分的に一致させることである。
本稿では,ニューラルネットワークによるPW差分を近似し,勾配降下により最小化できる部分的ワッサーシュタイン対向ネットワーク(PWAN)を提案する。
論文 参考訳(メタデータ) (2022-03-04T10:23:48Z) - Layout-to-Image Translation with Double Pooling Generative Adversarial
Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。
また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文 参考訳(メタデータ) (2021-08-29T19:55:14Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。