論文の概要: FC-DCNN: A densely connected neural network for stereo estimation
- arxiv url: http://arxiv.org/abs/2010.06950v1
- Date: Wed, 14 Oct 2020 10:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:36:39.917101
- Title: FC-DCNN: A densely connected neural network for stereo estimation
- Title(参考訳): FC-DCNN: ステレオ推定のための密結合ニューラルネットワーク
- Authors: Dominik Hirner, Friedrich Fraundorfer
- Abstract要約: 私たちのネットワークは、完全畳み込み型高密度ニューラルネットワーク(FC-DCNN)で構成されています。
FC-DCNNは補正画像ペア間のマッチングコストを算出する。
室内と屋外の両方で,本手法が有効であることを示す。
- 参考スコア(独自算出の注目度): 14.876446067338406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel lightweight network for stereo estimation. Our network
consists of a fully-convolutional densely connected neural network (FC-DCNN)
that computes matching costs between rectified image pairs. Our FC-DCNN method
learns expressive features and performs some simple but effective
post-processing steps. The densely connected layer structure connects the
output of each layer to the input of each subsequent layer. This network
structure and the fact that we do not use any fully-connected layers or 3D
convolutions leads to a very lightweight network. The output of this network is
used in order to calculate matching costs and create a cost-volume. Instead of
using time and memory-inefficient cost-aggregation methods such as semi-global
matching or conditional random fields in order to improve the result, we rely
on filtering techniques, namely median filter and guided filter. By computing a
left-right consistency check we get rid of inconsistent values. Afterwards we
use a watershed foreground-background segmentation on the disparity image with
removed inconsistencies. This mask is then used to refine the final prediction.
We show that our method works well for both challenging indoor and outdoor
scenes by evaluating it on the Middlebury, KITTI and ETH3D benchmarks
respectively. Our full framework is available at
https://github.com/thedodo/FC-DCNN
- Abstract(参考訳): ステレオ推定のための新しい軽量ネットワークを提案する。
本ネットワークは,完全畳み込み高密度結合ニューラルネットワーク(fc-dcnn)で構成され,画像対のマッチングコストを計算する。
FC-DCNN法は,表現的特徴を学習し,単純だが効果的な後処理を行う。
密結合された層構造は、各層の出力とその後の層の入力とを接続する。
このネットワーク構造と、完全に接続されたレイヤや3D畳み込みを使用しないという事実は、非常に軽量なネットワークにつながります。
このネットワークの出力は、マッチングコストを計算し、コストボリュームを作成するために使用される。
半球マッチングや条件付きランダムフィールドなどの時間的・メモリ非効率なコスト集約手法を用いて結果を改善する代わりに,中央値フィルタやガイドフィルタといったフィルタリング技術に頼る。
左の一貫性チェックを計算することで、一貫性のない値を取り除きます。
その後,不一致を除去した不一致画像に対して,流域前景後景セグメンテーションを用いる。
このマスクは最終予測を洗練するために使われる。
提案手法は, ミドルベリー, KITTI, ETH3Dベンチマークでそれぞれ評価することで, 屋内と屋外の両方の課題に対して有効であることを示す。
私たちのフレームワークはhttps://github.com/thedodo/FC-DCNNで利用可能です。
関連論文リスト
- Deep Convolutional Tables: Deep Learning without Convolutions [12.069186324544347]
本稿では,ドット生成ニューロンを使用しず,代わりに投票表の階層に依存するディープネットワークの新たな定式化を提案する。
ディープCTネットワークは、類似アーキテクチャのCNNに匹敵する精度を持つことが実験的に示されている。
論文 参考訳(メタデータ) (2023-04-23T17:49:21Z) - FCDSN-DC: An Accurate and Lightweight Convolutional Neural Network for
Stereo Estimation with Depth Completion [14.876446067338406]
本研究では,立体推定のための高精度で軽量な畳み込みニューラルネットワークを提案する。
FCDSN-DCを用いた完全畳み込み変形可能な類似性ネットワーク(FCDSN-DC)と命名する。
実世界の屋内・屋外のシーン,特にミドルベリー,キッティ,ETH3Dにおいて,競争力のある結果が得られた場合の課題について検討した。
論文 参考訳(メタデータ) (2022-09-14T09:56:19Z) - Cherry-Picking Gradients: Learning Low-Rank Embeddings of Visual Data
via Differentiable Cross-Approximation [53.95297550117153]
本稿では,大規模な視覚データテンソルの処理を行うエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は大規模多次元グリッドデータや,大規模受容領域上のコンテキストを必要とするタスクに特に有用である。
論文 参考訳(メタデータ) (2021-05-29T08:39:57Z) - Do End-to-end Stereo Algorithms Under-utilize Information? [7.538482310185133]
本稿では,2次元および3次元の畳み込みネットワークに適応フィルタリングと半グローバルアグリゲーションを組み込むことによって,エンドツーエンドのステレオマッチングを実現する方法を示す。
改善は、画像からのRGB情報を信号として利用し、マッチングプロセスを動的にガイドすることによる。
論文 参考訳(メタデータ) (2020-10-14T18:32:39Z) - Monocular Depth Estimation Using Multi Scale Neural Network And Feature
Fusion [0.0]
ネットワークは2つの異なるブロックを使用し、まず、各特徴マップの畳み込みとマージに異なるフィルタサイズを使用する。
第2ブロックは、完全に連結された層の代わりに拡張畳み込みを使用し、計算を減らし、受容場を増大させる。
我々は、RMSE損失とSILog損失からなる深さ推定のための標準評価指標を用いて、Make 3Dデータセット、NYU Depth V2データセット、Kittiデータセットでネットワークをトレーニングし、テストする。
論文 参考訳(メタデータ) (2020-09-11T18:08:52Z) - Distillation Guided Residual Learning for Binary Convolutional Neural
Networks [83.6169936912264]
Binary CNN(BCNN)とFloating Point CNN(FCNN)のパフォーマンスギャップを埋めることは難しい。
我々は,この性能差が,BCNNとFCNNの中間特徴写像の間にかなりの残差をもたらすことを観察した。
性能ギャップを最小限に抑えるため,BCNN は FCNN と同様の中間特徴写像を生成する。
このトレーニング戦略、すなわち、FCNNから派生したブロックワイド蒸留損失で各バイナリ畳み込みブロックを最適化することで、BCNNをより効果的に最適化する。
論文 参考訳(メタデータ) (2020-07-10T07:55:39Z) - The Neural Tangent Link Between CNN Denoisers and Non-Local Filters [4.254099382808598]
畳み込みニューラルネットワーク(CNN)は現在、計算画像問題を解決するための確立されたツールである。
ニューラルネットワークタンジェント(NTK)とよく知られた非局所フィルタリング技術によるネットワーク間の公式なリンクを導入する。
本研究は,広範囲な画像復号化実験により評価した。
論文 参考訳(メタデータ) (2020-06-03T16:50:54Z) - Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance
Disparity Estimation [51.17232267143098]
ステレオ画像から3次元物体を検出するための新しいシステムDisp R-CNNを提案する。
我々は、LiDAR点雲を必要とせずに、統計的形状モデルを用いて、密度の異なる擬似地下構造を生成する。
KITTIデータセットの実験によると、LiDARの基盤構造がトレーニング時に利用できない場合でも、Disp R-CNNは競争性能を達成し、平均精度で従来の最先端手法を20%上回っている。
論文 参考訳(メタデータ) (2020-04-07T17:48:45Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z) - Approximation and Non-parametric Estimation of ResNet-type Convolutional
Neural Networks [52.972605601174955]
本稿では,ResNet型CNNが重要な関数クラスにおいて最小誤差率を達成可能であることを示す。
Barron と H'older のクラスに対する前述のタイプの CNN の近似と推定誤差率を導出する。
論文 参考訳(メタデータ) (2019-03-24T19:42:39Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。