論文の概要: Improving the HardNet Descriptor
- arxiv url: http://arxiv.org/abs/2007.09699v2
- Date: Mon, 23 Nov 2020 23:02:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 00:24:13.874291
- Title: Improving the HardNet Descriptor
- Title(参考訳): HardNetディスクリプタの改良
- Authors: Milan Pultar
- Abstract要約: 本稿では,HardNetディスクリプタに着目した幅広いベースラインステレオのための局所的特徴記述子学習の問題点について考察する。
AMOS Patchesデータセットが導入され、照明と外観の変化に対する堅牢性が改善されている。
パッチデータセット作成プロセスについてレコメンデーションを提供し、異なるモダリティのデータに基づいてトレーニングされたHardNetを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the thesis we consider the problem of local feature descriptor learning
for wide baseline stereo focusing on the HardNet descriptor, which is close to
state-of-the-art. AMOS Patches dataset is introduced, which improves robustness
to illumination and appearance changes. It is based on registered images from
selected cameras from the AMOS dataset. We provide recommendations on the patch
dataset creation process and evaluate HardNet trained on data of different
modalities. We also introduce a dataset combination and reduction methods, that
allow comparable performance on a significantly smaller dataset.
HardNet8, consistently outperforming the original HardNet, benefits from the
architectural choices made: connectivity pattern, final pooling, receptive
field, CNN building blocks found by manual or automatic search algorithms --
DARTS. We show impact of overlooked hyperparameters such as batch size and
length of training on the descriptor quality. PCA dimensionality reduction
further boosts performance and also reduces memory footprint.
Finally, the insights gained lead to two HardNet8 descriptors: one performing
well on a variety of benchmarks -- HPatches, AMOS Patches and IMW Phototourism,
the other is optimized for IMW Phototourism.
- Abstract(参考訳): 本論文では,最新に近いハードネットディスクリプタに着目した,幅広いベースラインステレオを対象とした局所特徴記述子学習の問題を考える。
AMOS Patchesデータセットが導入され、照明と外観の変化に対する堅牢性が改善されている。
AMOSデータセットから選択したカメラの登録画像に基づいている。
我々は,パッチデータセット作成プロセスに関するレコメンデーションを提供し,異なるモダリティのデータに基づいてトレーニングされたハードネットを評価する。
また,より小さなデータセットで同等の性能を実現するために,データセットの組み合わせと削減手法も導入した。
HardNet8はオリジナルのHardNetを一貫して上回り、接続パターン、最終的なプーリング、受信フィールド、手動または自動検索アルゴリズムで見つかるCNNビルディングブロック、DARTSというアーキテクチャ上の選択の恩恵を受けている。
バッチサイズやトレーニング長といった見過ごされたハイパーパラメータがディスクリプタの品質に与える影響を示す。
PCA次元の削減はパフォーマンスをさらに向上させ、メモリフットプリントも削減する。
ひとつは、hpatches、amosパッチ、imwフォトツーリズムといった様々なベンチマークでうまく動作し、もうひとつはimwフォトツーリズムに最適化されている。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Dynamic Pre-training: Towards Efficient and Scalable All-in-One Image Restoration [100.54419875604721]
オールインワン画像復元は、各分解に対してタスク固有の非ジェネリックモデルを持たずに、統一されたモデルで異なるタイプの劣化に対処する。
我々は、オールインワン画像復元タスクのためのエンコーダデコーダ方式で設計されたネットワークの動的ファミリであるDyNetを提案する。
我々のDyNetは、よりバルク化と軽量化をシームレスに切り替えることができるので、効率的なモデルデプロイメントのための柔軟性を提供します。
論文 参考訳(メタデータ) (2024-04-02T17:58:49Z) - AADNet: Attention aware Demoiréing Network [2.1626093085892144]
モアレパターンは、モバイルデバイスやデジタルカメラで撮影された写真にしばしば現れる。
本稿では,高解像度画像復号化のための新しい軽量アーキテクチャであるAADNetを提案する。
論文 参考訳(メタデータ) (2024-03-13T09:48:11Z) - A Modular System for Enhanced Robustness of Multimedia Understanding
Networks via Deep Parametric Estimation [30.904034138920057]
マルチメディア理解タスクでは、破損したサンプルは、機械学習モデルにフィードされるとパフォーマンスが低下するので、重要な課題となる。
我々はSyMPIEを提案し、最小の計算コストで下流マルチメディア理解のための入力データを強化する。
私たちの重要な洞察は、ほとんどの入力汚職は、画像の色チャネルや小さなカーネルを持つ空間フィルタのグローバルな操作によってモデル化できるということです。
論文 参考訳(メタデータ) (2024-02-28T15:24:58Z) - Bridging Vision and Language Encoders: Parameter-Efficient Tuning for
Referring Image Segmentation [72.27914940012423]
画像セグメンテーションの参照における効率的なチューニング問題について検討する。
クロスモーダル情報交換を容易にするBridgerと呼ばれる新しいアダプタを提案する。
画像分割のための軽量デコーダも設計する。
論文 参考訳(メタデータ) (2023-07-21T12:46:15Z) - Non-pooling Network for medical image segmentation [11.956054700035326]
本稿では,非プールネットワーク(NPNet)を提案する。
NPNetのセマンティックセマンティックセグメンテーションモデルを,w i t h多重状態(SOTA)モデルと比較した3つのベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2023-02-21T02:49:16Z) - Learning and Crafting for the Wide Multiple Baseline Stereo [4.7210697296108926]
この論文は、広い多重ベースラインステレオ(WxBS)問題を導入している。
WxBSは複数の画像取得因子が異なる画像のマッチングを考える。
基礎的真理、評価基準、ベースラインを備えた新しいデータセットが導入された。
論文 参考訳(メタデータ) (2021-12-22T16:52:55Z) - Combined Depth Space based Architecture Search For Person
Re-identification [70.86236888223569]
個人再識別(ReID)のための軽量で適切なネットワークの設計を目指しています。
本研究では,CDNetと呼ばれる効率的なネットワークアーキテクチャの探索に基づく,複合深さ空間(Componed Depth Space, CDS)と呼ばれる新しい検索空間を提案する。
そこで我々はTop-k Sample Search戦略という低コストの検索戦略を提案し、検索空間をフル活用し、局所的な最適結果のトラップを避ける。
論文 参考訳(メタデータ) (2021-04-09T02:40:01Z) - Searching Efficient Model-guided Deep Network for Image Denoising [61.65776576769698]
モデルガイド設計とNAS(MoD-NAS)をつなぐ新しいアプローチを提案する。
MoD-NASは、再利用可能な幅探索戦略と密結合された探索ブロックを用いて、各層の操作を自動的に選択する。
いくつかの一般的なデータセットに対する実験結果から、我々のMoD-NASは現在の最先端手法よりもPSNR性能が向上していることが示された。
論文 参考訳(メタデータ) (2021-04-06T14:03:01Z) - Bottleneck Transformers for Visual Recognition [97.16013761605254]
視覚タスクに自己注意を組み込んだ強力なバックボーンアーキテクチャであるBoTNetを提案する。
我々は、ImageNetベンチマークにおいて84.7%のトップ1の精度で高いパフォーマンスを達成するモデルを提案する。
私たちのシンプルで効果的なアプローチが、将来のビジョンのための自己注意モデル研究の強力なベースラインになることを期待しています。
論文 参考訳(メタデータ) (2021-01-27T18:55:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。