論文の概要: Towards Keypoint Guided Self-Supervised Depth Estimation
- arxiv url: http://arxiv.org/abs/2011.03091v1
- Date: Thu, 5 Nov 2020 20:45:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 12:16:17.520847
- Title: Towards Keypoint Guided Self-Supervised Depth Estimation
- Title(参考訳): キーポイント誘導自己教師付き深さ推定に向けて
- Authors: Kristijan Bartol and David Bojanic and Tomislav Petkovic and Tomislav
Pribanic and Yago Diez Donoso
- Abstract要約: 入力画像の集合から深度マップ推定を学習するために,キーポイントを自己スーパービジョンの手がかりとして利用する。
キーポイント抽出手法を使わずに深度モデルを学習することにより,キーポイントを用いて深度推定学習を改善することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes to use keypoints as a self-supervision clue for learning
depth map estimation from a collection of input images. As ground truth depth
from real images is difficult to obtain, there are many unsupervised and
self-supervised approaches to depth estimation that have been proposed. Most of
these unsupervised approaches use depth map and ego-motion estimations to
reproject the pixels from the current image into the adjacent image from the
image collection. Depth and ego-motion estimations are evaluated based on pixel
intensity differences between the correspondent original and reprojected
pixels. Instead of reprojecting the individual pixels, we propose to first
select image keypoints in both images and then reproject and compare the
correspondent keypoints of the two images. The keypoints should describe the
distinctive image features well. By learning a deep model with and without the
keypoint extraction technique, we show that using the keypoints improve the
depth estimation learning. We also propose some future directions for
keypoint-guided learning of structure-from-motion problems.
- Abstract(参考訳): 本稿では,入力画像の集合から深度マップ推定を学習するための自己超越的手がかりとしてキーポイントを用いることを提案する。
実画像からの地中真理深度を求めることは困難であるため,多くの教師なし・自己監督的な手法が提案されている。
これらの教師なしアプローチのほとんどは、深度マップとエゴモーション推定を使用して、現在の画像から画像収集から隣接画像へ画素を再投影する。
対応する原画素と再投影画素の画素強度差に基づいて深度とエゴモーションの推定を行う。
個々の画素を再投影する代わりに、まず両画像のキーポイントを選択し、次に対応する2つの画像のキーポイントを比較して比較する。
キーポイントは、特徴的なイメージの特徴をうまく記述するべきです。
キーポイント抽出手法を使わずに深層モデルを学ぶことで,キーポイントを用いた奥行き推定学習が向上することを示す。
また,キーポイント誘導型運動学習の今後の方向性について述べる。
関連論文リスト
- Self-Supervised Keypoint Detection with Distilled Depth Keypoint Representation [0.8136541584281987]
Distill-DKPは,キーポイント検出のためのクロスモーダルな知識蒸留フレームワークである。
Distill-DKPは、深度に基づく教師モデルから埋め込みレベルの知識を抽出し、画像に基づく学生モデルを指導する。
実験により、Distill-DKPは従来の教師なし手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-10-04T22:14:08Z) - GMM-IKRS: Gaussian Mixture Models for Interpretable Keypoint Refinement and Scoring [9.322937309882022]
キーポイントには、品質に応じてスコアをランク付けできるスコアが付属する。
学習されたキーポイントは手作りのものよりも優れた特性を示すことが多いが、それらのスコアは容易に解釈できない。
本稿では,どの手法でも抽出したキーポイントを解釈可能なスコアで特徴付けることができるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-30T09:39:59Z) - Pixel-level Correspondence for Self-Supervised Learning from Video [56.24439897867531]
ピクセルレベルの対応 (PiCo) はビデオから高密度なコントラスト学習を行う方法である。
標準的なベンチマークでPiCoを検証し、複数の高密度予測タスクで自己教師付きベースラインを上回ります。
論文 参考訳(メタデータ) (2022-07-08T12:50:13Z) - Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。
ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。
提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-19T02:26:07Z) - Weakly Supervised Keypoint Discovery [27.750244813890262]
画像レベルの監視を用いた2次元画像からのキーポイント発見手法を提案する。
本手法は,弱い教師付き学習アプローチに動機付けられ,画像レベルの監視を利用して識別部品を識別する。
本手法は,限られた監督シナリオにおけるキーポイント推定タスクの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-28T01:26:53Z) - Pixel-Perfect Structure-from-Motion with Featuremetric Refinement [96.73365545609191]
複数視点からの低レベル画像情報を直接アライメントすることで、動きからの2つの重要なステップを洗練する。
これにより、様々なキーポイント検出器のカメラポーズとシーン形状の精度が大幅に向上する。
本システムは,大規模な画像コレクションに容易にスケールできるので,クラウドソースによる大規模なローカライゼーションを実現することができる。
論文 参考訳(メタデータ) (2021-08-18T17:58:55Z) - End-to-End Learning of Keypoint Representations for Continuous Control
from Images [84.8536730437934]
教師なしの事前学習、デコーダ、追加の損失を必要とせずに、エンドツーエンドで効率的なキーポイント表現を学習できることが示される。
提案アーキテクチャは,ソフトアクター・クリティカルエージェントに直接座標を供給するキーポイント抽出器で構成されている。
論文 参考訳(メタデータ) (2021-06-15T09:17:06Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z) - Simple Multi-Resolution Representation Learning for Human Pose
Estimation [2.1904965822605433]
ディープラーニングの発展により,人間のキーポイント予測の精度が向上する。
本稿では,人間のキーポイント予測のためのマルチレゾリューション表現学習と呼ばれる新しいネットワーク構造を提案する。
私たちのアーキテクチャはシンプルで効果的で、優れたパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-14T09:03:16Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。