論文の概要: SQLNet: Scale-Modulated Query and Localization Network for Few-Shot
Class-Agnostic Counting
- arxiv url: http://arxiv.org/abs/2311.10011v1
- Date: Thu, 16 Nov 2023 16:50:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 13:26:38.254808
- Title: SQLNet: Scale-Modulated Query and Localization Network for Few-Shot
Class-Agnostic Counting
- Title(参考訳): SQLNet: Few-Shot Class-Agnostic Countingのためのスケール変調クエリとローカライゼーションネットワーク
- Authors: Hefeng Wu, Yandong Chen, Lingbo Liu, Tianshui Chen, Keze Wang, Liang
Lin
- Abstract要約: CAC(class-agnostic counting)タスクは、最近、任意のクラスの全てのオブジェクトを、入力画像にいくつかの例を付与してカウントする問題を解くために提案されている。
我々は、スケール変調クエリーおよびローカライズネットワーク(Net)と呼ばれる、新しいローカライズベースのCACアプローチを提案する。
クエリとローカライゼーションの段階において、模範者のスケールを完全に探求し、各オブジェクトを正確に位置付けし、その近似サイズを予測することで、効果的なカウントを実現している。
- 参考スコア(独自算出の注目度): 71.38754976584009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The class-agnostic counting (CAC) task has recently been proposed to solve
the problem of counting all objects of an arbitrary class with several
exemplars given in the input image. To address this challenging task, existing
leading methods all resort to density map regression, which renders them
impractical for downstream tasks that require object locations and restricts
their ability to well explore the scale information of exemplars for
supervision. To address the limitations, we propose a novel localization-based
CAC approach, termed Scale-modulated Query and Localization Network (SQLNet).
It fully explores the scales of exemplars in both the query and localization
stages and achieves effective counting by accurately locating each object and
predicting its approximate size. Specifically, during the query stage, rich
discriminative representations of the target class are acquired by the
Hierarchical Exemplars Collaborative Enhancement (HECE) module from the few
exemplars through multi-scale exemplar cooperation with equifrequent size
prompt embedding. These representations are then fed into the Exemplars-Unified
Query Correlation (EUQC) module to interact with the query features in a
unified manner and produce the correlated query tensor. In the localization
stage, the Scale-aware Multi-head Localization (SAML) module utilizes the query
tensor to predict the confidence, location, and size of each potential object.
Moreover, a scale-aware localization loss is introduced, which exploits
flexible location associations and exemplar scales for supervision to optimize
the model performance. Extensive experiments demonstrate that SQLNet
outperforms state-of-the-art methods on popular CAC benchmarks, achieving
excellent performance not only in counting accuracy but also in localization
and bounding box generation. Our codes will be available at
https://github.com/HCPLab-SYSU/SQLNet
- Abstract(参考訳): CAC(class-agnostic counting)タスクは、最近、任意のクラスの全てのオブジェクトを、入力画像にいくつかの例を付与してカウントする問題を解くために提案されている。
この課題に対処するために、既存のリーディングメソッドはすべて密度マップ回帰に依存しており、オブジェクトの位置を必要とするダウンストリームタスクでは非現実的であり、監視のためにexemplarsのスケール情報を正確に探索する能力を制限する。
この制限に対処するため,我々は,SQLNet(Scale-modulated Query and Localization Network)と呼ばれる,新しいローカライゼーションベースのCACアプローチを提案する。
クエリとローカライズの両方のステージにおける例題のスケールを徹底的に検討し、各オブジェクトを正確に位置決めし、その近似サイズを予測することで、効果的なカウントを実現している。
具体的には,問合せ段階において,階層型exemplars collaborative enhancement (hece)モジュールによって,複数個のexemplarモジュールから,同等の大きさの簡易埋め込みによるマルチスケールのexemplar協調により,対象クラスのリッチな判別表現を取得する。
これらの表現はExemplars-Unified Query correlation (EUQC)モジュールに入力され、統一された方法でクエリ機能と対話し、関連するクエリテンソルを生成する。
ローカライゼーション段階では、SAML(Scale-aware Multi-head Localization)モジュールはクエリテンソルを使用して、各潜在的オブジェクトの信頼性、位置、サイズを予測する。
さらに、フレキシブルな位置関連と模範的なスケールを利用してモデル性能を最適化するスケールアウェアのローカライゼーション損失が導入された。
大規模な実験では、SQLNetは一般的なCACベンチマークで最先端のメソッドよりも優れており、精度だけでなく、ローカライゼーションやバウンディングボックス生成でも優れたパフォーマンスを実現している。
私たちのコードはhttps://github.com/HCPLab-SYSU/SQLNetで公開されます。
関連論文リスト
- Few-shot Object Localization [37.347898735345574]
本稿では,Few-Shot Object Localization (FSOL) という新しいタスクを定義する。
限られたサンプルで正確な位置決めを実現することを目的としている。
本課題は、少数のラベル付きサポートサンプルを利用して、対応する画像内のオブジェクトの位置情報をクエリすることで、一般化されたオブジェクトのローカライゼーションを実現する。
実験の結果,FSOLタスクにおけるアプローチの大幅な性能向上が示され,さらなる研究のための効率的なベンチマークが確立された。
論文 参考訳(メタデータ) (2024-03-19T05:50:48Z) - Transferability Metrics for Object Detection [0.0]
Transfer Learningは、既存のトレーニング済みモデルを最大限に活用して、限られたデータシナリオで新しいタスクのパフォーマンスを向上させることを目的としている。
我々は、ROI-Align と TLogME を用いて、転送可能性のメトリクスをオブジェクト検出に拡張する。
我々は,TLogMEが転送性能とロバストな相関を示し,局所的およびグローバルなレベルの特性で他の転送可能性指標より優れていることを示す。
論文 参考訳(メタデータ) (2023-06-27T08:49:31Z) - GCNet: Probing Self-Similarity Learning for Generalized Counting Network [24.09746233447471]
一般カウントネットワーク(GCNet)は、画像全体の適応的な例を認識するために開発された。
GCNetは、慎重に設計された自己相似学習戦略を通じてそれらを適応的にキャプチャすることができる。
既存の例によるメソッドと同等に動作し、クラウド固有のデータセット上で、驚くべきクロスデータセットの汎用性を示している。
論文 参考訳(メタデータ) (2023-02-10T09:31:37Z) - Learning to Evaluate Performance of Multi-modal Semantic Localization [9.584659231769416]
セマンティックローカライゼーション(Semantic Localization、SeLo)とは、テキストなどの意味情報を用いて、大規模リモートセンシング(RS)画像の最も関連性の高い位置を求めるタスクである。
本稿では、この分野を徹底的に研究し、SeLoタスクを進めるためのメトリクスとテストデータの観点から完全なベンチマークを提供する。
論文 参考訳(メタデータ) (2022-09-14T09:39:03Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - CREPO: An Open Repository to Benchmark Credal Network Algorithms [78.79752265884109]
クレダルネットワークは、確率質量関数の集合であるクレダルに基づく不正確な確率的グラフィカルモデルである。
CREMAと呼ばれるJavaライブラリが最近リリースされ、クレダルネットワークをモデル化し、処理し、クエリする。
我々は,これらのモデル上での推論タスクの正確な結果とともに,合成クレダルネットワークのオープンリポジトリであるcrrepoを提案する。
論文 参考訳(メタデータ) (2021-05-10T07:31:59Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。