論文の概要: DDCNet-Multires: Effective Receptive Field Guided Multiresolution CNN
for Dense Prediction
- arxiv url: http://arxiv.org/abs/2107.05634v1
- Date: Mon, 12 Jul 2021 17:28:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 14:52:24.287726
- Title: DDCNet-Multires: Effective Receptive Field Guided Multiresolution CNN
for Dense Prediction
- Title(参考訳): DDCNet-Multires:Dense Predictionのための有効受容場誘導型マルチレゾリューションCNN
- Authors: Ali Salehi, Madhusudhanan Balasubramanian
- Abstract要約: 我々は,ネットワークの有効受容場(ERF)特性に導かれる高密度予測ネットワークを構築するための戦略を開発する。
本研究では, DDCNet をベースとしたサブネットを ERF の範囲を小さくすることで, 異種運動力学を扱うための DDCNet 戦略を拡張した。
マルチレゾリューション機能付きDDCNet(DDCNet-Multires)は、特別なネットワーク層を使わずにコンパクトである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense optical flow estimation is challenging when there are large
displacements in a scene with heterogeneous motion dynamics, occlusion, and
scene homogeneity. Traditional approaches to handle these challenges include
hierarchical and multiresolution processing methods. Learning-based optical
flow methods typically use a multiresolution approach with image warping when a
broad range of flow velocities and heterogeneous motion is present. Accuracy of
such coarse-to-fine methods is affected by the ghosting artifacts when images
are warped across multiple resolutions and by the vanishing problem in smaller
scene extents with higher motion contrast. Previously, we devised strategies
for building compact dense prediction networks guided by the effective
receptive field (ERF) characteristics of the network (DDCNet). The DDCNet
design was intentionally simple and compact allowing it to be used as a
building block for designing more complex yet compact networks. In this work,
we extend the DDCNet strategies to handle heterogeneous motion dynamics by
cascading DDCNet based sub-nets with decreasing extents of their ERF. Our
DDCNet with multiresolution capability (DDCNet-Multires) is compact without any
specialized network layers. We evaluate the performance of the DDCNet-Multires
network using standard optical flow benchmark datasets. Our experiments
demonstrate that DDCNet-Multires improves over the DDCNet-B0 and -B1 and
provides optical flow estimates with accuracy comparable to similar lightweight
learning-based methods.
- Abstract(参考訳): 不均質な動きのダイナミクス、オクルージョン、およびシーンの均質性を持つシーンに大きな変位がある場合、高密度光フロー推定は困難である。
これらの課題に対処する従来のアプローチには、階層的およびマルチレゾリューションな処理方法がある。
学習に基づくオプティカルフロー法は通常、幅広い流れ速度と不均質な動きが存在する場合、イメージウォーピングを伴うマルチレゾリューションアプローチを用いる。
このような粗大な手法の精度は、複数の解像度で画像が歪められたときのゴーストアーティファクトや、より高い動きのコントラストを持つ小さなシーン範囲での消滅問題の影響を受けている。
これまで我々は,ネットワーク(DDCNet)の有効受容場(ERF)特性に導かれる高密度予測ネットワークを構築するための戦略を考案した。
DDCNetの設計は意図的にシンプルでコンパクトであり、より複雑でコンパクトなネットワークを設計するためのビルディングブロックとして使用できる。
本研究では, DDCNet をベースとしたサブネットを ERF の範囲を小さくすることで, 異種運動力学を扱うための DDCNet 戦略を拡張した。
マルチレゾリューション機能付きDDCNet(DDCNet-Multires)は、特別なネットワーク層を持たないコンパクトである。
標準光フローベンチマークを用いたDDCNet-Multiresネットワークの性能評価を行った。
実験により,DDCNet-MultiresはDDCNet-B0および-B1よりも改善し,光学フロー推定を類似の軽量学習法に匹敵する精度で提供することを示した。
関連論文リスト
- WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Deep Networks for Image and Video Super-Resolution [30.75380029218373]
単一画像超解像(SISR)は、MDCB(Mixed-Dense connection block)と呼ばれる効率的な畳み込みユニットを用いて構築される。
ネットワークの2つのバージョンをトレーニングし、異なる損失構成を用いて相補的な画像品質を向上させる。
ネットワークは複数のフレームから情報を集約し,時間的整合性を維持するために学習する。
論文 参考訳(メタデータ) (2022-01-28T09:15:21Z) - DDCNet: Deep Dilated Convolutional Neural Network for Dense Prediction [0.0]
受容場(ERF)とネットワーク内の空間的特徴の高分解能は、高分解能密度推定を提供することに不可欠である。
空間的特徴の解像度を高く保ちながら、より大きな受容場を提供できるネットワークアーキテクチャを設計するための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2021-07-09T23:15:34Z) - A Parallel Down-Up Fusion Network for Salient Object Detection in
Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。
In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。
ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T05:27:57Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Implicit Euler ODE Networks for Single-Image Dehazing [33.34490764631837]
単一画像デハージング問題に対して,効率的なマルチレベル暗黙ネットワーク(MI-Net)を提案する。
提案手法は既存の手法より優れ,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-07-13T15:27:33Z) - Res-CR-Net, a residual network with a novel architecture optimized for
the semantic segmentation of microscopy images [0.5363346028859919]
Res-CR-NetはDeep Neural Network(DNN)の一種で、異なるダイレーションレートの分離可能なアトラス畳み込みの束または畳み込みLSTMを持つ残効ブロックを特徴とする。
各残余ブロックで使用されるフィルタの数とブロック数だけが、様々な顕微鏡画像のネットワークトレーニングを最適化するために修正する必要がある唯一のハイパーパラメータである。
論文 参考訳(メタデータ) (2020-04-14T21:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。