論文の概要: Movement-induced Priors for Deep Stereo
- arxiv url: http://arxiv.org/abs/2010.09105v1
- Date: Sun, 18 Oct 2020 21:02:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 04:24:15.902099
- Title: Movement-induced Priors for Deep Stereo
- Title(参考訳): 深部ステレオの運動誘発前兆
- Authors: Yuxin Hou, Muhammad Kamran Janjua, Juho Kannala, Arno Solin
- Abstract要約: 移動誘導事前情報を用いたステレオ不均質推定手法を提案する。
本稿では,3つのガウスプロセスカーネルの階層構造について述べる。
提案手法が2つの最先端のディープステレオ手法とどのように組み合わせられるかを示す。
- 参考スコア(独自算出の注目度): 27.098315663348814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method for fusing stereo disparity estimation with
movement-induced prior information. Instead of independent inference
frame-by-frame, we formulate the problem as a non-parametric learning task in
terms of a temporal Gaussian process prior with a movement-driven kernel for
inter-frame reasoning. We present a hierarchy of three Gaussian process kernels
depending on the availability of motion information, where our main focus is on
a new gyroscope-driven kernel for handheld devices with low-quality MEMS
sensors, thus also relaxing the requirement of having full 6D camera poses
available. We show how our method can be combined with two state-of-the-art
deep stereo methods. The method either work in a plug-and-play fashion with
pre-trained deep stereo networks, or further improved by jointly training the
kernels together with encoder-decoder architectures, leading to consistent
improvement.
- Abstract(参考訳): 移動誘導事前情報を用いたステレオ不均質推定手法を提案する。
独立なフレーム・バイ・フレームではなく、フレーム間推論のための移動駆動カーネルで時間的ガウス過程によって非パラメトリック学習タスクとして問題を定式化する。
そこでは,低品質のMEMSセンサを備えたハンドヘルドデバイス用のジャイロスコープ駆動型カーネルを主眼とし,フル6Dカメラの撮影要件を緩和する。
本手法を2つの最先端の深層ステレオ法と組み合わせる方法を示す。
この方法は、事前訓練されたディープステレオネットワークでプラグイン・アンド・プレイ方式で動作するか、エンコーダ・デコーダアーキテクチャと共同でカーネルをトレーニングすることでさらに改善され、一貫した改善をもたらす。
関連論文リスト
- A Two-Stage Progressive Pre-training using Multi-Modal Contrastive Masked Autoencoders [5.069884983892437]
本稿では,RGB-Dデータセットを利用した画像理解タスクのプログレッシブ事前学習手法を提案する。
第一段階では、コントラスト学習を用いてモデルを事前学習し、クロスモーダル表現を学習する。
第2段階では、マスク付きオートエンコーディングと雑音予測を用いてモデルをさらに事前訓練する。
我々のアプローチはスケーラブルで堅牢で、RGB-Dデータセットを事前学習するのに適しています。
論文 参考訳(メタデータ) (2024-08-05T05:33:59Z) - Hierarchical Temporal Context Learning for Camera-based Semantic Scene Completion [57.232688209606515]
カメラによるセマンティックシーンの補完を改善するための,新たな時間的文脈学習パラダイムであるHTCLを提案する。
提案手法は,Semantic KITTIベンチマークで1st$をランク付けし,mIoUの点でLiDARベースの手法を超えている。
論文 参考訳(メタデータ) (2024-07-02T09:11:17Z) - SkelFormer: Markerless 3D Pose and Shape Estimation using Skeletal Transformers [57.46911575980854]
マルチビュー人間のポーズと形状推定のための新しいマーカーレスモーションキャプチャパイプラインであるSkelFormerを紹介する。
提案手法は,まず市販の2次元キーポイント推定器を用いて,大規模インザミルドデータに基づいて事前トレーニングを行い,3次元関節位置を求める。
次に、重雑音観測から、関節の位置をポーズと形状の表現にマッピングする回帰に基づく逆運動性骨格変換器を設計する。
論文 参考訳(メタデータ) (2024-04-19T04:51:18Z) - Trajectory Approximation of Video Based on Phase Correlation for Forward
Facing Camera [0.0]
本稿では,GPSを用いた環境下でカメラセンサから軌跡を抽出する手法を提案する。
このシステムは、車両に搭載された前方カメラの映像を入力として撮影し、出力はカメラの軌道を表すチェーンコードである。
特に,本システムは空間的特徴に依存した従来の手法より優れ,ノイズの多い環境においてより高速で頑健であることを示す。
論文 参考訳(メタデータ) (2023-12-20T00:44:04Z) - Neural Disparity Refinement for Arbitrary Resolution Stereo [67.55946402652778]
本稿では,安価で広範なコンシューマデバイスへの3Dコンピュータビジョンの展開を容易にすることを目的とした,ニューラルディファリティ改善のための新しいアーキテクチャを提案する。
我々のアプローチは任意の出力解像度で洗練された不均一写像を推定できる連続的な定式化に依存している。
論文 参考訳(メタデータ) (2021-10-28T18:00:00Z) - Depth-conditioned Dynamic Message Propagation for Monocular 3D Object
Detection [86.25022248968908]
モノラル3Dオブジェクト検出の問題を解決するために、コンテキストと奥行きを認識する特徴表現を学びます。
KITTIベンチマークデータセットにおける単眼的アプローチにおける最新の結果を示す。
論文 参考訳(メタデータ) (2021-03-30T16:20:24Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z) - Real-time Dense Reconstruction of Tissue Surface from Stereo Optical
Video [10.181846237133167]
立体光学ビデオから組織表面の高密度3次元モデル(3次元)をリアルタイムに再構成する手法を提案する。
まずステレオマッチングを用いてビデオフレームから3D情報を抽出し,再構成した3Dモデルをモザイクする。
2mm未満の精度で高分解能テクスチャを有する復元3Dモデルについて, 生体内および生体内データによる実験結果を得た。
論文 参考訳(メタデータ) (2020-07-16T19:14:05Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z) - Du$^2$Net: Learning Depth Estimation from Dual-Cameras and Dual-Pixels [16.797169907541164]
本稿では,デュアルカメラのステレオとデュアルピクセルセンサのステレオを組み合わせた深度推定のためのニューラルネットワークに基づく新しいアプローチを提案する。
我々のネットワークは、2つの情報ソースを融合するために新しいアーキテクチャを使用し、純粋な双眼鏡ステレオマッチングの限界を克服することができる。
論文 参考訳(メタデータ) (2020-03-31T15:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。