論文の概要: Point Annotation Probability Map: Towards Dense Object Counting by
Tolerating Annotation Noise
- arxiv url: http://arxiv.org/abs/2308.00530v1
- Date: Sat, 29 Jul 2023 04:46:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 14:01:29.709584
- Title: Point Annotation Probability Map: Towards Dense Object Counting by
Tolerating Annotation Noise
- Title(参考訳): 点アノテーション確率マップ : tolerating annotation noise による密接なオブジェクトの数え上げに向けて
- Authors: Yuehai Chen
- Abstract要約: 混雑したシーンでオブジェクトをカウントすることは、コンピュータビジョンにとって依然として難しい課題だ。
本稿では,学習目標点アノテーション確率マップ,PAPMを提案する。
適応学習型PAPM法(AL-PAPM)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Counting objects in crowded scenes remains a challenge to computer vision.
The current deep learning based approach often formulate it as a Gaussian
density regression problem. Such a brute-force regression, though effective,
may not consider the annotation noise properly which arises from the human
annotation process and may lead to different distributions. We conjecture that
it would be beneficial to consider the annotation noise in the dense object
counting task. To obtain strong robustness against annotation noise,
generalized Gaussian distribution (GGD) function with a tunable bandwidth and
shape parameter is exploited to form the learning target point annotation
probability map, PAPM. Specifically, we first present a hand-designed PAPM
method (HD-PAPM), in which we design a function based on GGD to tolerate the
annotation noise. For end-to-end training, the hand-designed PAPM may not be
optimal for the particular network and dataset. An adaptively learned PAPM
method (AL-PAPM) is proposed. To improve the robustness to annotation noise, we
design an effective transport cost function based on GGD. With such transport
cost constraints, a better PAPM presentation could be adaptively learned with
an optimal transport framework from point annotation in an end-to-end manner.
Extensive experiments show the superiority of our proposed methods.
- Abstract(参考訳): 混雑したシーンでオブジェクトを数えることは、コンピュータビジョンにとって課題である。
現在のディープラーニングに基づくアプローチは、しばしばガウス密度回帰問題として定式化する。
このようなブルートフォース回帰は効果的ではあるが、人間のアノテーションプロセスから生じるアノテーションノイズを適切に考慮せず、異なる分布に導く可能性がある。
我々は,濃密なオブジェクトカウントタスクにおいて,アノテーションノイズを考慮することが有益であると推測する。
アノテーションノイズに対する強いロバスト性を得るために、調整可能な帯域幅と形状パラメータを持つ一般化ガウス分布(GGD)関数を利用して学習目標点アノテーション確率マップ、PAPMを形成する。
具体的には、まず手書きのPAPM法(HD-PAPM)を提案し、GGDに基づく関数を設計し、アノテーションノイズを許容する。
エンドツーエンドのトレーニングでは、ハンドデザインのPAPMは特定のネットワークやデータセットに最適ではないかもしれない。
適応学習型PAPM法(AL-PAPM)を提案する。
アノテーションノイズに対するロバスト性を改善するため,GGDに基づく効率的な輸送コスト関数を設計する。
このようなトランスポートコストの制約により、より優れたpapmプレゼンテーションは、ポイントアノテーションからエンドツーエンドの方法で最適なトランスポートフレームワークで適応的に学習することができる。
大規模な実験により提案手法の優位性を示した。
関連論文リスト
- PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection [14.396629790635474]
単一点教師付きオブジェクト指向オブジェクト検出が注目され、コミュニティ内で最初の進歩を遂げた。
本稿では,よりシンプルで高速で,より強力な手法であるPointOBB-v2を提案する。
論文 参考訳(メタデータ) (2024-10-10T17:59:56Z) - CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - Regressor-Segmenter Mutual Prompt Learning for Crowd Counting [70.49246560246736]
本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。
実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
論文 参考訳(メタデータ) (2023-12-04T07:53:59Z) - Robust Face Anti-Spoofing with Dual Probabilistic Modeling [49.14353429234298]
本稿では、DPM-LQ(ラベル品質認識学習)とDPM-DQ(データ品質認識学習)という2つの専用モジュールを備えたDPM(Dual Probabilistic Modeling)という統合フレームワークを提案する。
DPM-LQは、ノイズのあるセマンティックラベルの分布に過度に適合することなく、ロバストな特徴表現を生成することができる。
DPM-DQは、その品質分布に基づいてノイズデータの予測信頼度を補正することにより、推論中のFalse Reject'およびFalse Accept'からデータノイズを除去することができる。
論文 参考訳(メタデータ) (2022-04-27T03:44:18Z) - Partial Wasserstein Adversarial Network for Non-rigid Point Set
Registration [33.70389309762202]
2つの点集合が与えられた場合、登録の問題は一方が他方と一致する変換を回復することである。
登録問題を部分分布マッチング(PDM)問題として定式化し,その目的は距離空間内の点集合で表される分布を部分的に一致させることである。
本稿では,ニューラルネットワークによるPW差分を近似し,勾配降下により最小化できる部分的ワッサーシュタイン対向ネットワーク(PWAN)を提案する。
論文 参考訳(メタデータ) (2022-03-04T10:23:48Z) - Layout-to-Image Translation with Double Pooling Generative Adversarial
Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。
また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文 参考訳(メタデータ) (2021-08-29T19:55:14Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。