Fugu-MT 論文翻訳(概要): Regressor-Segmenter Mutual Prompt Learning for Crowd Counting

論文の概要: Regressor-Segmenter Mutual Prompt Learning for Crowd Counting

arxiv url: http://arxiv.org/abs/2312.01711v3
Date: Wed, 3 Jan 2024 09:35:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-04 16:20:10.468105
Title: Regressor-Segmenter Mutual Prompt Learning for Crowd Counting
Title（参考訳）: 群衆カウントのためのレグレッサー・セグメンタ相互学習
Authors: Mingyue Guo, Li Yuan, Zhaoyi Yan, Binghui Chen, Yaowei Wang, Qixiang Ye
Abstract要約: 本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
参考スコア（独自算出の注目度）: 70.49246560246736
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Crowd counting has achieved significant progress by training regressors to predict instance positions. In heavily crowded scenarios, however, regressors are challenged by uncontrollable annotation variance, which causes density map bias and context information inaccuracy. In this study, we propose mutual prompt learning (mPrompt), which leverages a regressor and a segmenter as guidance for each other, solving bias and inaccuracy caused by annotation variance while distinguishing foreground from background. In specific, mPrompt leverages point annotations to tune the segmenter and predict pseudo head masks in a way of point prompt learning. It then uses the predicted segmentation masks, which serve as spatial constraint, to rectify biased point annotations as context prompt learning. mPrompt defines a way of mutual information maximization from prompt learning, mitigating the impact of annotation variance while improving model accuracy. Experiments show that mPrompt significantly reduces the Mean Average Error (MAE), demonstrating the potential to be general framework for down-stream vision tasks.
Abstract（参考訳）: 群衆のカウントは、レグレッサーを訓練してインスタンスの位置を予測することで大きな進歩を遂げた。しかし、密集したシナリオでは、回帰器は制御不能なアノテーションのばらつきに悩まされ、密度マップバイアスや文脈情報の不正確さを引き起こす。本研究では,前景と背景を区別しながら,アノテーションの差によるバイアスや不正確さを解消し,レグレシタとセグメンタを相互に指導する相互プロンプト学習(mPrompt)を提案する。具体的には、mPromptはポイントアノテーションを利用してセグメンタをチューニングし、ポイントプロンプト学習の方法で擬似ヘッドマスクを予測する。予測されたセグメンテーションマスクを空間的制約として使用し、バイアスのある点アノテーションを文脈即興学習として修正する。 mPromptは、素早い学習から相互情報の最大化を定義し、モデル精度を改善しながらアノテーションの分散の影響を緩和する。実験によれば、mpromptは平均平均エラー(mae)を大幅に削減し、ダウンストリームビジョンタスクの汎用フレームワークとなる可能性を示している。

関連論文リスト

Understanding Annotation Error Propagation and Learning an Adaptive Policy for Expert Intervention in Barrett's Video Segmentation [5.967409746468654]
我々は,小誤差の蓄積と精度の低下について検討し,専門家のレビューと修正を必要とした。我々は、いつどこで専門家の入力を求めるかを学習するコスト認識フレームワークであるL2RP(Learning-to-Re-Prompt)を提案する。プライベートなBarrettのdysplasiaデータセットとパブリックなSUN-SEGベンチマークの実験では、時間的一貫性と優れたパフォーマンスが向上した。
論文参考訳（メタデータ） (2026-02-25T12:30:54Z)
Let Samples Speak: Mitigating Spurious Correlation by Exploiting the Clusterness of Samples [11.727747752958436]
ディープラーニングモデルは、トレーニング中にクラスラベルと急激な相関関係を持つ機能を学ぶが、予測タスクとは無関係である。既存の手法は通常、潜在的なスパイラルな属性を注釈付けしたり、経験的な仮定に基づいてスパイラルな特徴をフィルタリングすることでこの問題に対処する。本稿では,深層学習モデルにおける突発的相関を緩和するデータ指向手法を提案する。
論文参考訳（メタデータ） (2025-12-28T10:54:51Z)
Enhancing Consistency and Mitigating Bias: A Data Replay Approach for Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文参考訳（メタデータ） (2024-01-12T12:51:12Z)
Point Cloud Semantic Segmentation with Sparse and Inhomogeneous Annotations [38.678301947144305]
弱教師付き学習におけるアノテーション間隔と不均一性の影響を解析するために、勾配サンプリング近似法に確率密度関数を導入する。任意に分散されたスパースアノテーションで頑健に学習できる適応分布ネットワークを提案する。
論文参考訳（メタデータ） (2023-12-11T09:57:09Z)
ADEPT: A DEbiasing PrompT Framework [64.54665501064659]
ファインタニングは文脈化された単語の埋め込みを曖昧にするための応用手法である。意味的な意味を持つ個別のプロンプトは、タスクを乱すのに有効であることが示されている。本稿では, PLM をデバイアス化する方法であるADEPT を提案し, バイアス除去と表現能力の確保の微妙なバランスを維持しながら, 即時チューニングによる PLM のデバイアス化手法を提案する。
論文参考訳（メタデータ） (2022-11-10T08:41:40Z)
Bayesian Prompt Learning for Image-Language Model Generalization [64.50204877434878]
我々はベイズ法の正規化能力を用いて、変分推論問題としてプロンプト学習をフレーム化する。提案手法は,プロンプト空間を正規化し,目に見えないプロンプトへの過剰適合を低減し,目に見えないプロンプトのプロンプト一般化を改善する。ベイジアン・プロンプト学習がプロンプト空間の適切なカバレッジを提供する15のベンチマークを実証的に示す。
論文参考訳（メタデータ） (2022-10-05T17:05:56Z)
End-to-End Label Uncertainty Modeling in Speech Emotion Recognition using Bayesian Neural Networks and Label Distribution Learning [0.0]
本稿では,アノテーションの分布をトレーニングし,主観性に基づくラベルの不確かさを捕捉するエンド・ツー・エンドのベイズニューラルネットワークを提案する。提案手法は, 音声の感情認識において, 最先端の不確実性モデリング結果が得られることを示す。
論文参考訳（メタデータ） (2022-09-30T12:55:43Z)
Rethinking the Learning Paradigm for Facial Expression Recognition [56.050738381526116]
既存のトレーニングパラダイムを再考し、弱い教師付き戦略を用いて、オリジナルの曖昧なアノテーションでFERモデルをトレーニングする方がよいと提案する。本稿では、弱教師付き戦略を用いて、オリジナルの曖昧なアノテーションでFERモデルを訓練した方がよいと論じる。
論文参考訳（メタデータ） (2022-09-30T12:00:54Z)
Learning Debiased and Disentangled Representations for Semantic Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文参考訳（メタデータ） (2021-10-31T16:15:09Z)
Variance-reduced Language Pretraining via a Mask Proposal Network [5.819397109258169]
自己指導型学習(英: self-supervised learning, a.k.a.)は、自然言語処理において重要である。本稿では,勾配分散低減の観点から問題に取り組む。そこで我々は,マスク提案の最適分布を近似したMAsk Network(MAPNet)を導入した。
論文参考訳（メタデータ） (2020-08-12T14:12:32Z)
Deep Semi-supervised Knowledge Distillation for Overlapping Cervical Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文参考訳（メタデータ） (2020-07-21T13:27:09Z)
PointMask: Towards Interpretable and Bias-Resilient Point Cloud Processing [16.470806722781333]
PointMaskは、ポイントクラウドモデルにおける属性に対する、モデルに依存しない解釈可能なインフォメーション・ブートネックアプローチである。任意のモデルとPointMask層を結合することで、入力空間の点を識別し、予測スコアに最も寄与することを示す。
論文参考訳（メタデータ） (2020-07-09T03:06:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。