論文の概要: STEERER: Resolving Scale Variations for Counting and Localization via
Selective Inheritance Learning
- arxiv url: http://arxiv.org/abs/2308.10468v1
- Date: Mon, 21 Aug 2023 05:09:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 14:57:00.475634
- Title: STEERER: Resolving Scale Variations for Counting and Localization via
Selective Inheritance Learning
- Title(参考訳): STEERER:選択的継承学習によるカウントとローカライゼーションのためのスケール変動の解消
- Authors: Tao Han, Lei Bai, Lingbo Liu, Wanli Ouyang
- Abstract要約: スケールの変動はオブジェクトカウントにおける根深い問題であり、既存のスケールアウェアアルゴリズムでは効果的に対処されていない。
本稿では,オブジェクトカウントにおけるスケール変動の問題に対処する,STEERERと呼ばれる新しい手法を提案する。
STEERERは、特徴抽出を促進するために、パッチオブジェクトに最も適したスケールを選択し、下位から上位までの識別的特徴のみを徐々に継承する。
- 参考スコア(独自算出の注目度): 74.2343877907438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scale variation is a deep-rooted problem in object counting, which has not
been effectively addressed by existing scale-aware algorithms. An important
factor is that they typically involve cooperative learning across
multi-resolutions, which could be suboptimal for learning the most
discriminative features from each scale. In this paper, we propose a novel
method termed STEERER (\textbf{S}elec\textbf{T}iv\textbf{E}
inh\textbf{ER}itance l\textbf{E}a\textbf{R}ning) that addresses the issue of
scale variations in object counting. STEERER selects the most suitable scale
for patch objects to boost feature extraction and only inherits discriminative
features from lower to higher resolution progressively. The main insights of
STEERER are a dedicated Feature Selection and Inheritance Adaptor (FSIA), which
selectively forwards scale-customized features at each scale, and a Masked
Selection and Inheritance Loss (MSIL) that helps to achieve high-quality
density maps across all scales. Our experimental results on nine datasets with
counting and localization tasks demonstrate the unprecedented scale
generalization ability of STEERER. Code is available at
\url{https://github.com/taohan10200/STEERER}.
- Abstract(参考訳): スケールの変動はオブジェクトカウントにおける根深い問題であり、既存のスケールアウェアアルゴリズムでは効果的に対処されていない。
重要な要素は、それらは典型的に複数の解像度で協調学習を伴い、それは各スケールから最も差別的な特徴を学ぶのに最適である。
本稿では,STEER(\textbf{S}elec\textbf{T}iv\textbf{E} inh\textbf{ER}itance l\textbf{E}a\textbf{R}ning)と呼ばれる新しい手法を提案する。
STEERERは、特徴抽出を促進するためにパッチオブジェクトに最も適したスケールを選択し、下位から上位までの識別的特徴のみを徐々に継承する。
STEERERの主な洞察は、各スケールでスケールカスタマイズされた機能を選択的に転送するFSIA(Feature Selection and Inheritance Adaptor)と、すべてのスケールにわたる高品質な密度マップの実現を支援するMasked Selection and Inheritance Loss(MSIL)である。
カウントおよびローカライゼーションタスクを含む9つのデータセットに対する実験結果から,STEERERのスケール一般化能力は前例のないものとなった。
コードは \url{https://github.com/taohan10200/STEERER} で入手できる。
関連論文リスト
- Layer-wise Customized Weak Segmentation Block and AIoU Loss for Accurate
Object Detection [7.3179451998143605]
そこで本研究では,各層におけるスケールカスタマイズオブジェクト特徴学習のために,画素レベルのSCWSブロックを提案する。
SCWSブロックを単発検出器に統合することにより、スケール認識オブジェクト検出器(SCOD)を構築し、異なるサイズのオブジェクトを自然かつ正確に検出する。
論文 参考訳(メタデータ) (2021-08-25T02:42:28Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Towards Better Object Detection in Scale Variation with Adaptive Feature
Selection [3.5352273012717044]
チャネル次元の多レベル表現を融合する方法を自動学習する新しい適応的特徴選択モジュール(AFSM)を提案する。
これは、特徴ピラミッド構造を持つ検出器の性能を著しく向上させる。
クラス不均衡問題に対処するために,クラス対応サンプリング機構(CASM)を提案する。
論文 参考訳(メタデータ) (2020-12-06T13:41:20Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。