論文の概要: MTStereo 2.0: improved accuracy of stereo depth estimation withMax-trees
- arxiv url: http://arxiv.org/abs/2006.15373v1
- Date: Sat, 27 Jun 2020 14:33:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 07:59:56.362503
- Title: MTStereo 2.0: improved accuracy of stereo depth estimation withMax-trees
- Title(参考訳): MTStereo 2.0:Max-treesを用いたステレオ深度推定精度の向上
- Authors: Rafael Brandt, Nicola Strisciuglio, Nicolai Petkov
- Abstract要約: MTStereo 2.0 と呼ばれるステレオマッチング手法を提案する。
これは画像対のマックスツリー階層的表現に基づいており、画像スキャン線に沿ったマッチング領域を特定するために使用される。
提案手法は,KITTI 2015, Driving, FlyingThings3D, Middlebury 2014, Monkaa, TrimBot 2020など,いくつかのベンチマークデータセットで検証し, 競争精度と効率性を実現した。
- 参考スコア(独自算出の注目度): 8.54329116256365
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient yet accurate extraction of depth from stereo image pairs is
required by systems with low power resources, such as robotics and embedded
systems. State-of-the-art stereo matching methods based on convolutional neural
networks require intensive computations on GPUs and are difficult to deploy on
embedded systems. In this paper, we propose a stereo matching method, called
MTStereo 2.0, for limited-resource systems that require efficient and accurate
depth estimation. It is based on a Max-tree hierarchical representation of
image pairs, which we use to identify matching regions along image scan-lines.
The method includes a cost function that considers similarity of region
contextual information based on the Max-trees and a disparity border preserving
cost aggregation approach. MTStereo 2.0 improves on its predecessor MTStereo
1.0 as it a) deploys a more robust cost function, b) performs more thorough
detection of incorrect matches, c) computes disparity maps with pixel-level
rather than node-level precision. MTStereo provides accurate sparse and
semi-dense depth estimation and does not require intensive GPU computations
like methods based on CNNs. Thus it can run on embedded and robotics devices
with low-power requirements. We tested the proposed approach on several
benchmark data sets, namely KITTI 2015, Driving, FlyingThings3D, Middlebury
2014, Monkaa and the TrimBot2020 garden data sets, and achieved competitive
accuracy and efficiency. The code is available at
https://github.com/rbrandt1/MaxTreeS.
- Abstract(参考訳): ロボット工学や組込みシステムといった低消費電力のシステムでは、ステレオ画像対からの深度を効率よく正確に抽出する必要がある。
畳み込みニューラルネットワークに基づく最先端のステレオマッチング手法は、GPU上での集約的な計算を必要とし、組み込みシステムへのデプロイが困難である。
本稿では,効率的な深度推定を必要とする限られた資源システムを対象としたステレオマッチング手法 MTStereo 2.0 を提案する。
これは画像対のマックスツリー階層的表現に基づいており、画像スキャン線に沿ったマッチング領域を特定するために使用される。
この方法は、マックスツリーに基づく領域文脈情報の類似性を考慮したコスト関数と、コスト集約アプローチの相違点を含む。
mtstereo 2.0、以前のmtstereo 1.0で改善
a) より堅牢なコスト関数をデプロイする。
b) 不正マッチをより徹底的に検出する。
c) ノードレベルの精度よりもピクセルレベルの差分マップを計算する。
MTStereoは正確なスパースと半深度推定を提供し、CNNに基づいたメソッドのような集中的なGPU計算を必要としない。
そのため、低消費電力で組み込みやロボティクスのデバイスで動かせる。
我々は,提案手法を,KITTI 2015,Driving, FlyingThings3D, Middlebury 2014, Monkaa と TrimBot2020 のガーデニングデータセットで検証し,競争精度と効率性を達成した。
コードはhttps://github.com/rbrandt1/MaxTreeSで入手できる。
関連論文リスト
- RomniStereo: Recurrent Omnidirectional Stereo Matching [6.153793254880079]
本稿では,全方向ステレオマッチング (RomniStereo) アルゴリズムを提案する。
我々の最良のモデルは、以前のSOTAベースラインよりも平均MAE値が40.7%向上する。
結果の可視化では, 合成例と実例の両方において, 明らかな優位性を示す。
論文 参考訳(メタデータ) (2024-01-09T04:06:01Z) - Efficient Segmentation with Texture in Ore Images Based on
Box-supervised Approach [6.6773975364173]
完全な鉱石と独立した鉱石を識別するために, テクスチャを特徴とするボックス管理手法を提案する。
提案手法は,21.6MBの小型モデルサイズで毎秒50フレーム以上を実現する。
この手法は、鉱石画像データセットの最先端アプローチと比較して高い精度を維持している。
論文 参考訳(メタデータ) (2023-11-10T08:28:22Z) - Metrically Scaled Monocular Depth Estimation through Sparse Priors for
Underwater Robots [0.0]
三角特徴量からのスパース深度測定を融合して深度予測を改善する深度学習モデルを定式化する。
このネットワークは、前方に見える水中データセットFLSeaで教師ありの方法で訓練されている。
この方法は、ラップトップGPUで160FPS、単一のCPUコアで7FPSで実行することで、リアルタイムのパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-10-25T16:32:31Z) - BDIS: Bayesian Dense Inverse Searching Method for Real-Time Stereo
Surgical Image Matching [2.990820994368054]
本稿では,一般的なMISタスクに対して,CPUレベルの事前自由ステレオマッチングアルゴリズムを提案する。
手術画像用のシングルコアCPU (i5-9400) を用いて, 640*480の画像に対して平均17Hzを実現する。
MIS のベースライン ELAS よりも近いか高い精度で出力が小さいが、4-5倍高速である。
論文 参考訳(メタデータ) (2022-05-06T10:50:49Z) - IterMVS: Iterative Probability Estimation for Efficient Multi-View
Stereo [71.84742490020611]
IterMVSは高解像度マルチビューステレオのための新しいデータ駆動方式である。
隠れ状態の深さの画素単位の確率分布を符号化するGRUに基づく新しい推定器を提案する。
DTU, タンク&テンプル, ETH3Dにおける本手法の有効性と有効性を検証する。
論文 参考訳(メタデータ) (2021-12-09T18:58:02Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Bi3D: Stereo Depth Estimation via Binary Classifications [129.1582262491508]
本稿では,一連のバイナリ分類を用いて深度を推定する手法であるBi3Dを提案する。
厳格な時間予算を考えれば、Bi3Dは数ミリ秒で特定の距離より近い物体を検出できる。
標準的なステレオ(すなわち全範囲の連続的な深さ)では、我々の手法は最先端の細かな調整されたステレオ手法に近いか同等である。
論文 参考訳(メタデータ) (2020-05-14T21:33:00Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。