論文の概要: Learning Spatial Similarity Distribution for Few-shot Object Counting
- arxiv url: http://arxiv.org/abs/2405.11770v1
- Date: Mon, 20 May 2024 04:15:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-21 14:13:43.651946
- Title: Learning Spatial Similarity Distribution for Few-shot Object Counting
- Title(参考訳): ファウショットオブジェクトカウントのための空間的類似度分布の学習
- Authors: Yuanwu Xu, Feifan Song, Haofeng Zhang,
- Abstract要約: Few-shot Object counting は、クエリイメージ内のオブジェクトの数を、与えられた模範画像と同じクラスに属するものとしてカウントすることを目的としている。
既存の手法では、2次元空間領域におけるクエリ画像と例間の類似性を計算し、回帰してカウント数を求める。
本稿では,空間的特徴の空間的構造を保存した少数のオブジェクトカウントのためのネットワーク学習型空間的類似度分布(SSD)を提案する。
- 参考スコア(独自算出の注目度): 17.28147599627954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot object counting aims to count the number of objects in a query image that belong to the same class as the given exemplar images. Existing methods compute the similarity between the query image and exemplars in the 2D spatial domain and perform regression to obtain the counting number. However, these methods overlook the rich information about the spatial distribution of similarity on the exemplar images, leading to significant impact on matching accuracy. To address this issue, we propose a network learning Spatial Similarity Distribution (SSD) for few-shot object counting, which preserves the spatial structure of exemplar features and calculates a 4D similarity pyramid point-to-point between the query features and exemplar features, capturing the complete distribution information for each point in the 4D similarity space. We propose a Similarity Learning Module (SLM) which applies the efficient center-pivot 4D convolutions on the similarity pyramid to map different similarity distributions to distinct predicted density values, thereby obtaining accurate count. Furthermore, we also introduce a Feature Cross Enhancement (FCE) module that enhances query and exemplar features mutually to improve the accuracy of feature matching. Our approach outperforms state-of-the-art methods on multiple datasets, including FSC-147 and CARPK. Code is available at https://github.com/CBalance/SSD.
- Abstract(参考訳): Few-shot Object counting は、クエリイメージ内のオブジェクトの数を、与えられた模範画像と同じクラスに属する数にカウントすることを目的としている。
既存の手法では、2次元空間領域におけるクエリ画像と例間の類似性を計算し、回帰してカウント数を求める。
しかし、これらの手法は、類似性の空間分布に関する豊富な情報を見落とし、マッチング精度に大きな影響を及ぼす。
この問題に対処するために,従来の特徴の空間構造を保存し,クエリ特徴と類似特徴の点間を4D類似度ピラミッドで計算し,各点の完全な分布情報を4D類似度空間で取得する,数ショットオブジェクトカウントのためのネットワーク学習空間類似度分布(SSD)を提案する。
本研究では, 類似度分布を予測密度の異なる値にマッピングし, 精度の高い数値を得るために, 類似度ピラミッド上に効率の良い中心ピボット4D畳み込みを適用した類似度学習モジュール(SLM)を提案する。
さらに,FCE(Feature Cross Enhancement)モジュールも導入し,クエリの強化と特徴マッチングの精度向上を図る。
提案手法は,FSC-147やCARPKなど,複数のデータセット上で最先端の手法より優れている。
コードはhttps://github.com/CBalance/SSDで入手できる。
関連論文リスト
- Layer-Wise Feature Metric of Semantic-Pixel Matching for Few-Shot Learning [14.627378118194933]
Few-Shot Learningでは、伝統的なメトリクスベースのアプローチは、しばしば類似性を計算するためにグローバルなメトリクスに依存する。
自然界では、キーインスタンスの空間配置は画像間で矛盾することが多い。
本稿では,セマンティック・ピクチャー・マッチングのレイヤワイズ特徴量と呼ばれる新しい手法を提案し,より詳細な比較を行う。
論文 参考訳(メタデータ) (2024-11-10T05:12:24Z) - Out of Sight, Out of Mind: A Source-View-Wise Feature Aggregation for
Multi-View Image-Based Rendering [26.866141260616793]
本稿では,ソースビューワイドな特徴集約手法を提案し,コンセンサスをロバストな方法で把握する。
提案手法を,合成画像や実画像を含む様々なベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2022-06-10T07:06:05Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Similarity-Aware Fusion Network for 3D Semantic Segmentation [87.51314162700315]
本研究では,3次元セマンティックセグメンテーションのための2次元画像と3次元点雲を適応的に融合する類似性認識融合ネットワーク(SAFNet)を提案する。
我々は、入力とバックプロジェクションされた(2Dピクセルから)点雲の間の幾何学的および文脈的類似性を初めて学習する、後期融合戦略を採用している。
SAFNetは、様々なデータ完全性にまたがって、既存の最先端の核融合ベースのアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2021-07-04T09:28:18Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Multi-level Metric Learning for Few-shot Image Recognition [5.861206243996454]
我々は、クエリイメージが3レベルの類似度メトリクスによって同時に分類できるなら、クラス内のクエリイメージはより小さな機能空間でより強く分散することができると主張する。
そこで本研究では,画素レベルの類似性だけでなく,部分レベルの特徴の類似性や分布の類似性も考慮した,マルチレベル・メトリック・ラーニング(MML)手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T12:49:07Z) - BSNet: Bi-Similarity Network for Few-shot Fine-grained Image
Classification [35.50808687239441]
いわゆるtextitBi-Similarity Network (textitBSNet) を提案する。
両相似モジュールは、多様な特性の2つの類似度尺度に従って特徴写像を学習する。
このようにして、モデルはより差別的で類似度に富んだ特徴を、よりきめ細かい画像の少ないショットから学習することができる。
論文 参考訳(メタデータ) (2020-11-29T08:38:17Z) - SimPropNet: Improved Similarity Propagation for Few-shot Image
Segmentation [14.419517737536706]
最近のディープニューラルネットワークに基づくFSS法は,サポート画像の前景特徴とクエリ画像特徴との高次元的特徴類似性を生かしている。
我々は,サポート機能とクエリ機能との共有を強制するために,サポートとクエリマスクを共同で予測することを提案する。
提案手法は,PASCAL-5iデータセット上での1ショットと5ショットのセグメンテーションに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-04-30T17:56:48Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。