Fugu-MT 論文翻訳(概要): Tolerating Annotation Displacement in Dense Object Counting via Point Annotation Probability Map

論文の概要: Tolerating Annotation Displacement in Dense Object Counting via Point Annotation Probability Map

arxiv url: http://arxiv.org/abs/2308.00530v2
Date: Wed, 8 Nov 2023 07:43:06 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-09 19:25:40.365567
Title: Tolerating Annotation Displacement in Dense Object Counting via Point Annotation Probability Map
Title（参考訳）: ポイントアノテーション確率マップを用いた高密度物体カウントにおけるアノテーション配置の許容
Authors: Yuehai Chen, Jing Yang, Badong Chen, Hua Gang, Shaoyi Du
Abstract要約: 混雑したシーンでオブジェクトをカウントすることは、コンピュータビジョンにとって依然として難しい課題だ。学習目標点アノテーション確率マップ(PAPM)を提案する。また,適応学習型PAPM法(AL-PAPM)を提案する。
参考スコア（独自算出の注目度）: 25.203803417049528
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Counting objects in crowded scenes remains a challenge to computer vision. The current deep learning based approach often formulate it as a Gaussian density regression problem. Such a brute-force regression, though effective, may not consider the annotation displacement properly which arises from the human annotation process and may lead to different distributions. We conjecture that it would be beneficial to consider the annotation displacement in the dense object counting task. To obtain strong robustness against annotation displacement, generalized Gaussian distribution (GGD) function with a tunable bandwidth and shape parameter is exploited to form the learning target point annotation probability map, PAPM. Specifically, we first present a hand-designed PAPM method (HD-PAPM), in which we design a function based on GGD to tolerate the annotation displacement. For end-to-end training, the hand-designed PAPM may not be optimal for the particular network and dataset. An adaptively learned PAPM method (AL-PAPM) is proposed. To improve the robustness to annotation displacement, we design an effective transport cost function based on GGD. The proposed PAPM is capable of integration with other methods. We also combine PAPM with P2PNet through modifying the matching cost matrix, forming P2P-PAPM. This could also improve the robustness to annotation displacement of P2PNet. Extensive experiments show the superiority of our proposed methods.
Abstract（参考訳）: 混雑したシーンでオブジェクトを数えることは、コンピュータビジョンにとって課題である。現在のディープラーニングに基づくアプローチは、しばしばガウス密度回帰問題として定式化する。このようなブルートフォース回帰は有効ではあるが、人間のアノテーションプロセスから生じるアノテーションの変位を適切に考慮せず、異なる分布に繋がる可能性がある。我々は、高密度オブジェクトカウントタスクにおけるアノテーションの変位を考慮することは有益であると推測する。アノテーションの変位に対する強い堅牢性を得るために、調整可能な帯域幅と形状パラメータを持つ一般化ガウス分布(GGD)関数を利用して学習目標点アノテーション確率マップ、PAPMを形成する。具体的には,まず手書きのPAPM法(HD-PAPM)を提案し,GGDに基づく関数を設計し,アノテーションの変位を許容する。エンドツーエンドのトレーニングでは、ハンドデザインのPAPMは特定のネットワークやデータセットに最適ではないかもしれない。適応学習型PAPM法(AL-PAPM)を提案する。アノテーションの変位に対するロバスト性を改善するため,GGDに基づく効率的な輸送コスト関数を設計する。提案したPAPMは他の手法と統合できる。また,PAPMとP2PNetを組み合わせることで,P2P-PAPMを形成する。これにより、P2PNetのアノテーション変位に対する堅牢性も向上する。大規模な実験により提案手法の優位性を示した。

関連論文リスト

Point-to-Region Loss for Semi-Supervised Point-Based Crowd Counting [49.165960263166966]
ポイント・ツー・ポイント(P2P)監視スキームを通じて、カウンターを訓練することで、混雑したシーンの歩行者を見つけるためにポイント検出が開発された。我々は、擬似ラベルに基づく半教師付きカウントフレームワークにポイントベースのメソッドを統合する。実装中、擬似ラベルに対する信頼度はP2Pを介して背景画素に伝達されない。本稿では,歩行者に対応する地点を検出するのではなく,地域を分割するP2Pを代替するP2R方式を提案する。
論文参考訳（メタデータ） (2025-05-28T03:53:08Z)
PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection [14.396629790635474]
単一点教師付きオブジェクト指向オブジェクト検出が注目され、コミュニティ内で最初の進歩を遂げた。本稿では,よりシンプルで高速で,より強力な手法であるPointOBB-v2を提案する。
論文参考訳（メタデータ） (2024-10-10T17:59:56Z)
CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。 CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。 CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文参考訳（メタデータ） (2024-01-30T17:38:48Z)
Regressor-Segmenter Mutual Prompt Learning for Crowd Counting [70.49246560246736]
本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
論文参考訳（メタデータ） (2023-12-04T07:53:59Z)
Robust Face Anti-Spoofing with Dual Probabilistic Modeling [49.14353429234298]
本稿では、DPM-LQ(ラベル品質認識学習)とDPM-DQ(データ品質認識学習)という2つの専用モジュールを備えたDPM(Dual Probabilistic Modeling)という統合フレームワークを提案する。 DPM-LQは、ノイズのあるセマンティックラベルの分布に過度に適合することなく、ロバストな特徴表現を生成することができる。 DPM-DQは、その品質分布に基づいてノイズデータの予測信頼度を補正することにより、推論中のFalse Reject'およびFalse Accept'からデータノイズを除去することができる。
論文参考訳（メタデータ） (2022-04-27T03:44:18Z)
Partial Wasserstein Adversarial Network for Non-rigid Point Set Registration [33.70389309762202]
2つの点集合が与えられた場合、登録の問題は一方が他方と一致する変換を回復することである。登録問題を部分分布マッチング(PDM)問題として定式化し,その目的は距離空間内の点集合で表される分布を部分的に一致させることである。本稿では,ニューラルネットワークによるPW差分を近似し,勾配降下により最小化できる部分的ワッサーシュタイン対向ネットワーク(PWAN)を提案する。
論文参考訳（メタデータ） (2022-03-04T10:23:48Z)
Layout-to-Image Translation with Double Pooling Generative Adversarial Networks [76.83075646527521]
入力レイアウトからフォトリアリスティックでセマンティックに一貫性のある結果を生成するための新しいDouble Pooing GAN(DPGAN)を提案する。また,角形プールモジュール (SPM) と矩形プールモジュール (RPM) からなる新しい二重プールモジュール (DPM) を提案する。
論文参考訳（メタデータ） (2021-08-29T19:55:14Z)
Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文参考訳（メタデータ） (2021-03-10T16:45:22Z)
Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文参考訳（メタデータ） (2020-03-17T03:52:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。