論文の概要: SiLK -- Simple Learned Keypoints
- arxiv url: http://arxiv.org/abs/2304.06194v1
- Date: Wed, 12 Apr 2023 23:56:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 15:58:25.923076
- Title: SiLK -- Simple Learned Keypoints
- Title(参考訳): SiLK -- 簡単な学習キーポイント
- Authors: Pierre Gleize, Weiyao Wang, Matt Feiszli
- Abstract要約: キーポイント検出と記述子は、画像マッチング、3D再構成、視覚計測といったコンピュータビジョンタスクのための基礎技術である。
最近の学習に基づく手法は、実験的な設定と設計の選択肢を多種多様に採用している。
我々は、各コンポーネントを第一原理から再設計し、完全微分可能で軽量でフレキシブルなSimple Learned Keypoints (SiLK)を提案する。
- 参考スコア(独自算出の注目度): 11.208547877814574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keypoint detection & descriptors are foundational tech-nologies for computer
vision tasks like image matching, 3D reconstruction and visual odometry.
Hand-engineered methods like Harris corners, SIFT, and HOG descriptors have
been used for decades; more recently, there has been a trend to introduce
learning in an attempt to improve keypoint detectors. On inspection however,
the results are difficult to interpret; recent learning-based methods employ a
vast diversity of experimental setups and design choices: empirical results are
often reported using different backbones, protocols, datasets, types of
supervisions or tasks. Since these differences are often coupled together, it
raises a natural question on what makes a good learned keypoint detector. In
this work, we revisit the design of existing keypoint detectors by
deconstructing their methodologies and identifying the key components. We
re-design each component from first-principle and propose Simple Learned
Keypoints (SiLK) that is fully-differentiable, lightweight, and flexible.
Despite its simplicity, SiLK advances new state-of-the-art on Detection
Repeatability and Homography Estimation tasks on HPatches and 3D Point-Cloud
Registration task on ScanNet, and achieves competitive performance to
state-of-the-art on camera pose estimation in 2022 Image Matching Challenge and
ScanNet.
- Abstract(参考訳): keypoint detection & descriptorは、画像マッチング、3d再構成、視覚オドメトリーなどのコンピュータビジョンタスクのための基礎技術である。
harris corners、sift、hog descriptorといった手作りの手法は数十年にわたって使われてきたが、最近ではキーポイント検出器を改善するために学習を導入する傾向がある。
最近の学習ベースの方法は、実験的なセットアップと設計の選択を多種多様に採用している。 経験的な結果は、バックボーン、プロトコル、データセット、監督の種類、タスクを使用して報告されることが多い。
これらの差はしばしば結合されるため、良い学習キーポイント検出器を何にするかという自然な疑問が提起される。
本研究では,既存のキーポイント検出器の設計について,その手法を分解し,キーコンポーネントを同定することによって再検討する。
我々は、各コンポーネントを第一原理から再設計し、完全微分可能で軽量でフレキシブルなSimple Learned Keypoints (SiLK)を提案する。
その単純さにもかかわらず、SiLKはHPatches上の検出再現性とホログラフィー推定タスクとScanNet上の3Dポイントクラウド登録タスクを新たに改善し、2022年のImage Matching ChallengeとScanNetにおける最先端のカメラポーズ推定に対する競合性能を達成する。
関連論文リスト
- Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - Enhancing Deformable Local Features by Jointly Learning to Detect and
Describe Keypoints [8.390939268280235]
局所特徴抽出は、画像マッチングや検索といった重要なタスクに対処するためのコンピュータビジョンにおける標準的なアプローチである。
鍵点を共同で検出・記述する新しい変形認識ネットワークであるDALFを提案する。
提案手法は、変形可能なオブジェクト検索と、非剛性な3次元表面登録という、2つの実世界のアプリケーションの性能を向上させる。
論文 参考訳(メタデータ) (2023-04-02T18:01:51Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。
ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。
提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-19T02:26:07Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - PP-ShiTu: A Practical Lightweight Image Recognition System [5.400569330093269]
本稿では,以下の3つのモジュールからなる実用軽量画像認識システムPP-ShiTuを提案する。
本稿では,距離学習,深度ハッシュ,知識蒸留,モデル定量化といった一般的な手法を導入し,精度と推論速度を向上させる。
異なるデータセットとベンチマークの実験により、システムは画像認識の異なる領域で広く有効であることが示された。
論文 参考訳(メタデータ) (2021-11-01T09:04:54Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。