論文の概要: Rethinking Skip Connections in Encoder-decoder Networks for Monocular
Depth Estimation
- arxiv url: http://arxiv.org/abs/2208.13441v1
- Date: Mon, 29 Aug 2022 09:20:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 13:02:02.345296
- Title: Rethinking Skip Connections in Encoder-decoder Networks for Monocular
Depth Estimation
- Title(参考訳): 単眼深度推定のためのエンコーダデコーダネットワークにおけるスキップ接続の再検討
- Authors: Zhitong Lai, Haichao Sun, Rui Tian, Nannan Ding, Zhiguo Wu, Yanjie
Wang
- Abstract要約: 単眼深度推定のためのフルスキップ接続ネットワーク(FSCN)を提案する。
さらに、スキップ接続内の機能をより緊密に融合するために、適応連結モジュール(ACM)を提案する。
- 参考スコア(独自算出の注目度): 4.364863910305258
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skip connections are fundamental units in encoder-decoder networks, which are
able to improve the feature propagtion of the neural networks. However, most
methods with skip connections just connected features with the same resolution
in the encoder and the decoder, which ignored the information loss in the
encoder with the layers going deeper. To leverage the information loss of the
features in shallower layers of the encoder, we propose a full skip connection
network (FSCN) for monocular depth estimation task. In addition, to fuse
features within skip connections more closely, we present an adaptive
concatenation module (ACM). Further more, we conduct extensive experiments on
the ourdoor and indoor datasets (i.e., the KITTI dataste and the NYU Depth V2
dataset) for FSCN and FSCN gets the state-of-the-art results.
- Abstract(参考訳): スキップ接続は、エンコーダ-デコーダネットワークの基本ユニットであり、ニューラルネットワークの機能伝達を改善することができる。
しかし、接続をスキップするほとんどのメソッドは、エンコーダとデコーダで同じ解像度の機能を接続するだけで、レイヤが深くなったことでエンコーダの情報損失を無視する。
エンコーダの浅い層における特徴量の情報損失を利用するために,単眼深度推定のためのフルスキップ接続ネットワーク(FSCN)を提案する。
さらに,スキップ接続の機能をより緊密に融合するために,適応連結モジュール(ACM)を提案する。
さらに、我々は、FSCNとFSCNの室内および屋内データセット(KITTIデータステーとNYU深度V2データセット)に関する広範な実験を行い、最先端の結果を得る。
関連論文リスト
- LKASeg:Remote-Sensing Image Semantic Segmentation with Large Kernel Attention and Full-Scale Skip Connections [27.473573286685063]
LKASegというリモートセンシング画像セマンティックセマンティックネットワークを提案する。
LKASegはLarge Kernel Attention(LSKA)とFull-Scale Skip Connection(FSC)を組み合わせる
ISPRSのベイヒンゲンデータセットでは、mF1とmIoUのスコアは90.33%と82.77%に達した。
論文 参考訳(メタデータ) (2024-10-14T12:25:48Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - HARP-Net: Hyper-Autoencoded Reconstruction Propagation for Scalable
Neural Audio Coding [25.51661602383911]
オートエンコーダベースのデコーダは、そのボトルネック層活性化をビットストリングに変換するために量子化を使用する。
この問題を回避するために、対応するエンコーダ・デコーダ層間のスキップ接続を追加する。
提案するハイパー・オートエンコーダ・アーキテクチャは,通常のオートエンコーダ・ベースラインに比べて音質の向上を実証的に検証する。
論文 参考訳(メタデータ) (2021-07-22T17:57:53Z) - Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。
提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:50:43Z) - Latent Code-Based Fusion: A Volterra Neural Network Approach [21.25021807184103]
最近導入されたVolterra Neural Networks(VNN)を用いた深層構造エンコーダを提案する。
提案手法は,cnnベースのオートエンコーダに対して,より頑健な分類性能を持つサンプル複雑性を示す。
論文 参考訳(メタデータ) (2021-04-10T18:29:01Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。