論文の概要: Independently Keypoint Learning for Small Object Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2404.02678v1
- Date: Wed, 3 Apr 2024 12:21:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 17:31:03.076125
- Title: Independently Keypoint Learning for Small Object Semantic Correspondence
- Title(参考訳): 小物体意味対応のための独立的キーポイント学習
- Authors: Hailong Jin, Huiying Li,
- Abstract要約: キーポイントバウンディングボックス中心クロッピング法の提案
KBCNetはCSFAモジュールと効率的な4D畳み込みデコーダを備える。
提案手法はSPair-71kデータセットの7.5%の性能向上を示す。
- 参考スコア(独自算出の注目度): 7.3866687886529805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic correspondence remains a challenging task for establishing correspondences between a pair of images with the same category or similar scenes due to the large intra-class appearance. In this paper, we introduce a novel problem called 'Small Object Semantic Correspondence (SOSC).' This problem is challenging due to the close proximity of keypoints associated with small objects, which results in the fusion of these respective features. It is difficult to identify the corresponding key points of the fused features, and it is also difficult to be recognized. To address this challenge, we propose the Keypoint Bounding box-centered Cropping (KBC) method, which aims to increase the spatial separation between keypoints of small objects, thereby facilitating independent learning of these keypoints. The KBC method is seamlessly integrated into our proposed inference pipeline and can be easily incorporated into other methodologies, resulting in significant performance enhancements. Additionally, we introduce a novel framework, named KBCNet, which serves as our baseline model. KBCNet comprises a Cross-Scale Feature Alignment (CSFA) module and an efficient 4D convolutional decoder. The CSFA module is designed to align multi-scale features, enriching keypoint representations by integrating fine-grained features and deep semantic features. Meanwhile, the 4D convolutional decoder, based on efficient 4D convolution, ensures efficiency and rapid convergence. To empirically validate the effectiveness of our proposed methodology, extensive experiments are conducted on three widely used benchmarks: PF-PASCAL, PF-WILLOW, and SPair-71k. Our KBC method demonstrates a substantial performance improvement of 7.5\% on the SPair-71K dataset, providing compelling evidence of its efficacy.
- Abstract(参考訳): セマンティック対応は、クラス内の大きな外観のため、同じカテゴリまたは類似のシーンを持つ一対のイメージ間の対応を確立する上で、依然として困難な課題である。
本稿では,「Small Object Semantic Correspondence (SOSC)」という新しい問題を紹介する。
この問題は、小さなオブジェクトに関連付けられたキーポイントが近づき、それぞれの特徴が融合するからである。
融合特徴の対応する要点を特定することは困難であり、認識も困難である。
この課題に対処するために,小型オブジェクトのキーポイント間の空間的分離を向上し,これらのキーポイントの独立学習を容易にするキーポイントバウンディングボックス中心クロップ法(KBC)を提案する。
KBC法は提案した推論パイプラインにシームレスに統合され,他の手法に容易に組み込むことができるため,性能が大幅に向上する。
さらに、KBCNetという新しいフレームワークを導入し、ベースラインモデルとして機能します。
KBCNetはCSFAモジュールと効率的な4D畳み込みデコーダを備える。
CSFAモジュールは、マルチスケールの機能の整合を図り、きめ細かい機能と深いセマンティック機能を統合することでキーポイント表現を充実させるように設計されている。
一方、効率的な4D畳み込みに基づく4D畳み込みデコーダは、効率と迅速な収束を保証する。
提案手法の有効性を実証的に検証するために,PF-PASCAL,PF-WILLOW,SPair-71kの3つの広く利用されているベンチマークを用いて広範囲な実験を行った。
KBC法はSPair-71Kデータセットの7.5\%の性能向上を示し,その有効性を示す。
関連論文リスト
- Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - PointDSC: Robust Point Cloud Registration using Deep Spatial Consistency [38.93610732090426]
本稿では,空間的整合性を明確に組み込んだ新しいディープニューラルネットワークであるPointDSCを提案する。
本手法は,いくつかの実世界のデータセットにおいて,最先端の手作りおよび学習に基づく異常者拒絶アプローチを上回っている。
論文 参考訳(メタデータ) (2021-03-09T14:56:08Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - CoKe: Localized Contrastive Learning for Robust Keypoint Detection [24.167397429511915]
特徴空間における3種類の距離を最適化するためにキーポイントカーネルを選択することができることを示す。
我々は、教師付きコントラスト学習を含むフレームワーク内で、この最適化プロセスを定式化する。
CoKeは、すべてのキーポイントを論理的に共同で表現するアプローチと比較して、最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-29T16:00:43Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Correspondence Networks with Adaptive Neighbourhood Consensus [22.013820169455812]
適応近傍コンセンサスネットワーク(ANC-Net)と呼ばれる畳み込みニューラルネットワークアーキテクチャを提案する。
ANC-Netは、この課題に対処するために、疎いキーポイントアノテーションでエンドツーエンドにトレーニングすることができる。
提案手法の有効性を様々なベンチマークで徹底的に評価し,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-03-26T17:58:09Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。