論文の概要: ScaleNet: A Shallow Architecture for Scale Estimation
- arxiv url: http://arxiv.org/abs/2112.04846v1
- Date: Thu, 9 Dec 2021 11:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 20:21:12.041337
- Title: ScaleNet: A Shallow Architecture for Scale Estimation
- Title(参考訳): ScaleNet: スケール推定のための浅層アーキテクチャ
- Authors: Axel Barroso-Laguna, Yurun Tian and Krystian Mikolajczyk
- Abstract要約: 我々は、画像間のスケールを予測するために、拡張畳み込みと自己および相互相関レイヤを利用する新しいアーキテクチャであるScaleNetを設計する。
本研究では, カメラポーズ推定, 3次元再構成, あるいは密度幾何マッチングを改善するために, 局所的特徴と密接な通信網を組み合わせる方法を示す。
- 参考スコア(独自算出の注目度): 25.29257353644138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we address the problem of estimating scale factors between
images. We formulate the scale estimation problem as a prediction of a
probability distribution over scale factors. We design a new architecture,
ScaleNet, that exploits dilated convolutions as well as self and
cross-correlation layers to predict the scale between images. We demonstrate
that rectifying images with estimated scales leads to significant performance
improvements for various tasks and methods. Specifically, we show how ScaleNet
can be combined with sparse local features and dense correspondence networks to
improve camera pose estimation, 3D reconstruction, or dense geometric matching
in different benchmarks and datasets. We provide an extensive evaluation on
several tasks and analyze the computational overhead of ScaleNet. The code,
evaluation protocols, and trained models are publicly available at
https://github.com/axelBarroso/ScaleNet.
- Abstract(参考訳): 本稿では,画像間のスケール係数を推定する問題に対処する。
スケール推定問題を,スケール因子上の確率分布の予測として定式化する。
我々は、画像間のスケールを予測するために、拡張畳み込みと自己および相互相関レイヤを利用する新しいアーキテクチャであるScaleNetを設計する。
推定スケールによる画像の修正により,様々なタスクや手法の性能が大幅に向上することが実証された。
具体的には,カメラのポーズ推定,3次元再構成,多彩な幾何学的マッチングを異なるベンチマークやデータセットで改善するために,scalenetと疎局所的特徴と密接な対応ネットワークを組み合わせる方法を示す。
本論文では,複数のタスクについて広範囲な評価を行い,ScaleNetの計算オーバーヘッドを解析する。
コード、評価プロトコル、トレーニングされたモデルはhttps://github.com/axelbarroso/scalenetで公開されている。
関連論文リスト
- SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers [0.42028553027796633]
従来のディープラーニングベースのオブジェクト検出ネットワークは、データ前処理の段階でイメージをリサイズし、特徴マップの均一なサイズとスケールを達成する。
本研究では,複数の表現部分空間からコンテキスト情報を抽出し学習するために,位置対応型マルチヘッドCriss-Cross Imageryを導入する。
このアプローチにより、大きさやスケールの異なる画像が一様次元の特徴写像を生成でき、特徴写像の伝搬に利用できる。
論文 参考訳(メタデータ) (2024-04-05T15:48:36Z) - Scale-Equivariant Deep Learning for 3D Data [44.52688267348063]
畳み込みニューラルネットワーク(CNN)は、画像の位置に関係なく物体を認識する。
本稿では,3次元データに対するスケール・等価な畳み込みネットワーク層を提案する。
本実験は,3次元医用画像解析の尺度等式化における提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-04-12T13:56:12Z) - Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatial
Representation Learning [55.762840052788945]
本研究では,異なるスケールでデータ間の関係を明示的に学習する事前学習手法であるScale-MAEを提案する。
その結果,低周波画像と高周波画像の両方を再構成することで,リモートセンシング画像のマルチスケール表現が堅牢になることがわかった。
論文 参考訳(メタデータ) (2022-12-30T03:15:34Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - Scale-Net: Learning to Reduce Scale Differences for Large-Scale
Invariant Image Matching [7.297352404640492]
局所特徴抽出に先立って画像スケールの差を小さくするSDAIM(Scale-Difference-Aware Image matching method)を提案する。
スケール比を正確に推定するために,CVARM (Comvisibility-attention-reinforceed matching module) を提案し,その後,スケールネットと呼ばれる新しいニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2021-12-20T12:35:36Z) - Pixel-Perfect Structure-from-Motion with Featuremetric Refinement [96.73365545609191]
複数視点からの低レベル画像情報を直接アライメントすることで、動きからの2つの重要なステップを洗練する。
これにより、様々なキーポイント検出器のカメラポーズとシーン形状の精度が大幅に向上する。
本システムは,大規模な画像コレクションに容易にスケールできるので,クラウドソースによる大規模なローカライゼーションを実現することができる。
論文 参考訳(メタデータ) (2021-08-18T17:58:55Z) - Scale-covariant and scale-invariant Gaussian derivative networks [0.0]
本稿では,大規模空間論と深層学習のハイブリッドアプローチとして,カスケード内のパラメータ化スケール空間演算を結合してディープラーニングアーキテクチャを構築する。
その結果,学習データに存在しない大規模パターンの分類に優れた性能が得られた。
論文 参考訳(メタデータ) (2020-11-30T13:15:10Z) - Weighing Counts: Sequential Crowd Counting by Reinforcement Learning [84.39624429527987]
我々は、逐次決定問題としてカウントを定式化し、深層強化学習により解ける新しい群集カウントモデルを提案する。
本稿では,LibraNetと呼ばれる新しい「カウントスケール」を提案する。
LibraNetは、LibraNetがアクションの選択方法を決定する過程を可視化することで、正確にスケール計測を実装していることを示す。
論文 参考訳(メタデータ) (2020-07-16T11:16:12Z) - On the Predictability of Pruning Across Scales [29.94870276983399]
等級決定ネットワークの誤差は、アーキテクチャやタスクに依存する解釈可能な係数を持つスケーリング法則を経験的に従うことを示す。
ニューラルネットワークがより大きく、訓練にコストがかかるようになるにつれて、我々の発見は、非構造化プルーニングの標準的な方法に関する概念的かつ分析的な推論の枠組みを示唆している。
論文 参考訳(メタデータ) (2020-06-18T15:41:46Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。