論文の概要: Revisiting Binary Local Image Description for Resource Limited Devices
- arxiv url: http://arxiv.org/abs/2108.08380v1
- Date: Wed, 18 Aug 2021 20:42:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-21 04:33:24.605729
- Title: Revisiting Binary Local Image Description for Resource Limited Devices
- Title(参考訳): 資源限定デバイスにおけるバイナリローカル画像記述の再検討
- Authors: Iago Su\'arez, Jos\'e M. Buenaposada, Luis Baumela
- Abstract要約: 本稿では,三重項ランキングの損失,強負のマイニング,アンカースワップによる新たなバイナリ画像記述子を提案する。
BadとHashSIFTは、最先端の精度とリソースのトレードオフ曲線で新しい運用ポイントを確立する。
- 参考スコア(独自算出の注目度): 2.470815298095903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of a panoply of resource limited devices opens up new challenges
in the design of computer vision algorithms with a clear compromise between
accuracy and computational requirements. In this paper we present new binary
image descriptors that emerge from the application of triplet ranking loss,
hard negative mining and anchor swapping to traditional features based on pixel
differences and image gradients. These descriptors, BAD (Box Average
Difference) and HashSIFT, establish new operating points in the
state-of-the-art's accuracy vs.\ resources trade-off curve. In our experiments
we evaluate the accuracy, execution time and energy consumption of the proposed
descriptors. We show that BAD bears the fastest descriptor implementation in
the literature while HashSIFT approaches in accuracy that of the top deep
learning-based descriptors, being computationally more efficient. We have made
the source code public.
- Abstract(参考訳): リソース制限装置の出現により、コンピュータビジョンアルゴリズムの設計における新たな課題が開き、精度と計算要求の間に明確な妥協がもたらされる。
本稿では,三重項ランキングの損失,ハード負のマイニング,アンカースワッピングを画素差と画像勾配に基づく従来の特徴に応用した,新たなバイナリ画像記述子を提案する。
これらの記述子、BAD (Box Average difference) と HashSIFT は、最先端の精度とリソースのトレードオフ曲線の新しい演算点を確立する。
本実験では,提案するディスクリプタの精度,実行時間,エネルギー消費量を評価する。
この結果から,hashsift は深層学習に基づく記述子よりも精度が高く,計算効率が向上しているのに対し,bad は文献における記述子実装が最速であることが分かる。
ソースコードを公開しました。
関連論文リスト
- BEBLID: Boosted efficient binary local image descriptor [2.8538628855541397]
本稿では,効率の良いバイナリ画像記述子であるBEBLIDを紹介する。
以前の実数値ディスクリプタであるBELIDを改善して,マッチングと精度の向上を実現しています。
実験では BEBLID は SIFT に近い精度で ORB よりも計算効率が良い。
論文 参考訳(メタデータ) (2024-02-07T00:14:32Z) - Residual Learning for Image Point Descriptors [56.917951170421894]
本稿では,手作りの検出器とディスクリプタを用いて局所画像記述子を学習する,非常にシンプルで効果的な手法を提案する。
我々は,手書き記述子にすでに存在する知識を活用することで,最終記述子を最適化する。
本手法は,非微分関数を用いたアンサンブル学習や学習に応用できる可能性がある。
論文 参考訳(メタデータ) (2023-12-24T12:51:30Z) - Illumination-insensitive Binary Descriptor for Visual Measurement Based
on Local Inter-patch Invariance [32.758878779207365]
既存のバイナリディスクリプタは、照度変化に対する感度のため、長期的な視覚計測タスクではうまく機能しない可能性がある。
本研究では,複数の空間的粒度に現れる局所的パッチ間不変性を利用して,照明不感二分法(IIB)記述器を提案する。
自然と合成の両方のデータセットに関する数値実験により、提案したIIBディスクリプタは最先端のバイナリディスクリプタより優れていることが明らかになった。
論文 参考訳(メタデータ) (2023-05-13T15:15:18Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - Learning Weighting Map for Bit-Depth Expansion within a Rational Range [64.15915577164894]
ビット深化(BDE)は、低ビット深化(LBD)ソースから高ビット深化(HBD)画像を表示する新興技術の1つである。
既存のBDEメソッドは、様々なBDE状況に対して統一的なソリューションを持っていない。
我々は,各画素の重みを求めるためにビット復元ネットワーク(BRNet)を設計し,補充値の比率を合理的範囲内で示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:39Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Local Quadruple Pattern: A Novel Descriptor for Facial Image Recognition
and Retrieval [20.77994516381]
顔画像の認識と検索のために手作りの局所四重項パターン(LQPAT)を提案する。
提案された記述子は、四重空間における隣人間の関係を符号化する。
提案するデクリプタの検索と認識精度を,ベンチマークデータベース上の手作りデクリプタの状態と比較した。
論文 参考訳(メタデータ) (2022-01-03T08:04:38Z) - Pixel-wise Dense Detector for Image Inpainting [34.721991959357425]
近年のGANベースの画像インパインティング手法では,画像の識別とスカラー出力に平均的手法が採用されている。
本稿では, 画像インパインティングのための新たな検出ベース生成フレームワークを提案し, 逆方向のプロセスにおいてmin-max戦略を採用する。
複数の公開データセットの実験は、提案したフレームワークの優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-11-04T13:45:27Z) - Blind Face Restoration via Deep Multi-scale Component Dictionaries [75.02640809505277]
劣化した観測の復元過程をガイドするディープフェイス辞書ネットワーク(DFDNet)を提案する。
DFDNetは高品質な画像から知覚的に重要な顔成分のディープ辞書を生成する。
コンポーネントAdaINは、入力機能と辞書機能の間のスタイルの多様性を取り除くために利用される。
論文 参考訳(メタデータ) (2020-08-02T07:02:07Z) - Learning Feature Descriptors using Camera Pose Supervision [101.56783569070221]
本稿では,画像間の相対的なカメラポーズからのみ特徴記述子を学習可能な,弱教師付きフレームワークを提案する。
ピクセルレベルの地上通信はもはや不要なので、我々のフレームワークは、より大きく、より多様なデータセットのトレーニングを、より良い、偏見のない記述子に開放する。
論文 参考訳(メタデータ) (2020-04-28T06:35:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。