論文の概要: Fractal Pyramid Networks
- arxiv url: http://arxiv.org/abs/2106.14694v1
- Date: Mon, 28 Jun 2021 13:15:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 14:02:52.381605
- Title: Fractal Pyramid Networks
- Title(参考訳): フラクタルピラミッドネットワーク
- Authors: Zhiqiang Deng, Huimin Yu and Yangqi Long
- Abstract要約: 画素ワイズ予測タスクのための新しいネットワークアーキテクチャであるフラクタルピラミッドネットワーク(PFN)を提案する。
PFNは複数の情報処理経路を保持し、情報を複数の小さなチャネルにエンコードする。
我々のモデルは、パラメータをはるかに少なくして、KITTIデータセットの最先端のメソッドを競合または上回ることができます。
- 参考スコア(独自算出の注目度): 3.7384509727711923
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a new network architecture, the Fractal Pyramid Networks (PFNs)
for pixel-wise prediction tasks as an alternative to the widely used
encoder-decoder structure. In the encoder-decoder structure, the input is
processed by an encoding-decoding pipeline that tries to get a semantic
large-channel feature. Different from that, our proposed PFNs hold multiple
information processing pathways and encode the information to multiple separate
small-channel features. On the task of self-supervised monocular depth
estimation, even without ImageNet pretrained, our models can compete or
outperform the state-of-the-art methods on the KITTI dataset with much fewer
parameters. Moreover, the visual quality of the prediction is significantly
improved. The experiment of semantic segmentation provides evidence that the
PFNs can be applied to other pixel-wise prediction tasks, and demonstrates that
our models can catch more global structure information.
- Abstract(参考訳): 本稿では,広く使用されているエンコーダ・デコーダ構造の代替として,画素単位の予測タスクのための新しいネットワークアーキテクチャであるフラクタルピラミッドネットワークを提案する。
エンコーダ・デコーダ構造では、入力は、セマンティックな大きなチャネル機能を取得しようとするエンコード・デコーダパイプラインによって処理される。
これと異なり、提案するPFNは複数の情報処理経路を保持し、複数の小チャンネルに情報をエンコードする。
ImageNetが事前訓練を受けなくても、自己教師付き単眼深度推定のタスクにおいて、我々のモデルは、はるかに少ないパラメータで、KITTIデータセットの最先端の手法と競合したり、性能を向上することができる。
さらに、予測の視覚的品質が大幅に向上する。
セマンティックセグメンテーションの実験により、PFNが他の画素ワイドな予測タスクに適用可能であることを示すとともに、我々のモデルがよりグローバルな構造情報を得ることができることを示す。
関連論文リスト
- Learning with Multigraph Convolutional Filters [153.20329791008095]
MSPモデルに基づいて情報を処理する階層構造として多グラフ畳み込みニューラルネットワーク(MGNN)を導入する。
また,MGNNにおけるフィルタ係数のトラクタブルな計算手法と,レイヤ間で転送される情報の次元性を低減するための低コストな手法を開発した。
論文 参考訳(メタデータ) (2022-10-28T17:00:50Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Global-Local Path Networks for Monocular Depth Estimation with Vertical
CutDepth [24.897377434844266]
単分子深度推定のための新しい構造とトレーニング戦略を提案する。
階層型トランスフォーマーエンコーダをデプロイして,グローバルなコンテキストをキャプチャし,伝達し,軽量で強力なデコーダを設計する。
我々のネットワークは、挑戦的な深度データセットNYU Depth V2に対して最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-01-19T06:37:21Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Transformer Meets DCFAM: A Novel Semantic Segmentation Scheme for
Fine-Resolution Remote Sensing Images [6.171417925832851]
Swin Transformerをバックボーンとして導入し、コンテキスト情報を完全に抽出します。
また、高密度接続特徴集合モジュール(DCFAM)と呼ばれる新しいデコーダを設計し、解像度を復元し、セグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2021-04-25T11:34:22Z) - Latent Code-Based Fusion: A Volterra Neural Network Approach [21.25021807184103]
最近導入されたVolterra Neural Networks(VNN)を用いた深層構造エンコーダを提案する。
提案手法は,cnnベースのオートエンコーダに対して,より頑健な分類性能を持つサンプル複雑性を示す。
論文 参考訳(メタデータ) (2021-04-10T18:29:01Z) - UNETR: Transformers for 3D Medical Image Segmentation [8.59571749685388]
UNEt TRansformers(UNETR)と呼ばれる新しいアーキテクチャを導入し、純粋なトランスフォーマーをエンコーダとして入力ボリュームのシーケンス表現を学習します。
提案モデルの性能を様々なイメージング手法で広く検証しています。
論文 参考訳(メタデータ) (2021-03-18T20:17:15Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。