論文の概要: Deeply Cascaded U-Net for Multi-Task Image Processing
- arxiv url: http://arxiv.org/abs/2005.00225v1
- Date: Fri, 1 May 2020 05:06:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 00:04:51.105775
- Title: Deeply Cascaded U-Net for Multi-Task Image Processing
- Title(参考訳): マルチタスク画像処理のための深いカスケードU-Net
- Authors: Ilja Gubins, Remco C. Veltkamp
- Abstract要約: 逐次画像処理タスクを組み合わせるために設計された,新しいマルチタスクニューラルネットワークアーキテクチャを提案する。
U-Netを各タスクごとに追加の復号経路で拡張し、出力の深いカスケードと、ある経路から別の経路への接続性を探る。
- 参考スコア(独自算出の注目度): 1.3815111881580258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In current practice, many image processing tasks are done sequentially (e.g.
denoising, dehazing, followed by semantic segmentation). In this paper, we
propose a novel multi-task neural network architecture designed for combining
sequential image processing tasks. We extend U-Net by additional decoding
pathways for each individual task, and explore deep cascading of outputs and
connectivity from one pathway to another. We demonstrate effectiveness of the
proposed approach on denoising and semantic segmentation, as well as on
progressive coarse-to-fine semantic segmentation, and achieve better
performance than multiple individual or jointly-trained networks, with lower
number of trainable parameters.
- Abstract(参考訳): 現在の作業では、多くの画像処理タスクが順次実行される(例えば、デノイング、デハジング、そしてセマンティックセグメンテーション)。
本稿では,シーケンシャルな画像処理タスクを組み合わせるために設計された,新しいマルチタスクニューラルネットワークアーキテクチャを提案する。
個々のタスク毎に追加のデコーディングパスによってu-netを拡張し、出力と接続の深いカスケードをある経路から別の経路へ探索する。
提案手法は,提案手法の有効性を実証し,学習可能なパラメータの少ない複数の個別ネットワークや共同学習ネットワークよりも優れた性能を実現する。
関連論文リスト
- The revenge of BiSeNet: Efficient Multi-Task Image Segmentation [6.172605433695617]
BiSeNetFormerは、効率的なマルチタスク画像セグメンテーションのための新しいアーキテクチャである。
複数のタスクをシームレスにサポートすることで、BiSeNetFormerはマルチタスクセグメンテーションのための汎用的なソリューションを提供する。
以上の結果から, BiSeNetFormerは高速, 効率的, マルチタスクセグメンテーションネットワークへの大きな進歩を示していることが示唆された。
論文 参考訳(メタデータ) (2024-04-15T08:32:18Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - DynaMITe: Dynamic Query Bootstrapping for Multi-object Interactive
Segmentation Transformer [58.95404214273222]
最先端のインスタンスセグメンテーション手法の多くは、訓練のために大量のピクセル精度のグランドトルースに依存している。
ユーザインタラクションを時間的クエリとして表現するDynaMITeという,より効率的なアプローチを導入する。
我々のアーキテクチャはまた、改善中にイメージ機能を再計算する必要をなくし、単一のイメージに複数のインスタンスをセグメント化するためのインタラクションを少なくする。
論文 参考訳(メタデータ) (2023-04-13T16:57:02Z) - Dynamic Neural Network for Multi-Task Learning Searching across Diverse
Network Topologies [14.574399133024594]
多様なグラフトポロジを持つ複数のタスクに対して最適化された構造を探索する新しいMTLフレームワークを提案する。
我々は、トポロジ的に多様なタスク適応構造を構築するために、読み出し/読み出し層を備えたDAGベースの制限付き中央ネットワークを設計する。
論文 参考訳(メタデータ) (2023-03-13T05:01:50Z) - End-To-End Data-Dependent Routing in Multi-Path Neural Networks [0.9507070656654633]
本稿では,レイヤ内の並列計算におけるデータ依存資源割り当てを用いたマルチパスニューラルネットワークを提案する。
我々のネットワークは、画像認識タスクにおいて、既存の拡張および適応的な特徴抽出、さらにはアンサンブルやより深いネットワークよりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-07-06T07:58:07Z) - Encoder Fusion Network with Co-Attention Embedding for Referring Image
Segmentation [87.01669173673288]
本稿では,視覚的エンコーダをマルチモーダルな特徴学習ネットワークに変換するエンコーダ融合ネットワーク(EFN)を提案する。
EFNには、マルチモーダル機能の並列更新を実現するコアテンションメカニズムが組み込まれている。
4つのベンチマークデータセットによる実験結果から,提案手法がポストプロセッシングを伴わずに最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-05T02:27:25Z) - EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation [8.449677920206817]
cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
論文 参考訳(メタデータ) (2021-03-16T08:46:57Z) - Searching for Controllable Image Restoration Networks [57.23583915884236]
既存の方法は各出力毎にネットワーク全体を通して別々の推論を必要とする。
本稿では,複数の画像効果を効率的に生成できるニューラルアーキテクチャ探索手法に基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-21T10:08:18Z) - Multi-task GANs for Semantic Segmentation and Depth Completion with
Cycle Consistency [7.273142068778457]
本稿では, セマンティックセグメンテーションと深度補完に優れたマルチタスク生成対向ネットワーク(Multi-task GANs)を提案する。
本稿では,マルチスケール空間プーリングブロックと構造的類似性復元損失を導入することにより,CycleGANに基づく生成セマンティック画像の詳細を改善する。
CityscapesデータセットとKITTI深度補完ベンチマークの実験は、マルチタスクGANが競合性能を達成することができることを示している。
論文 参考訳(メタデータ) (2020-11-29T04:12:16Z) - Deep Multimodal Neural Architecture Search [178.35131768344246]
様々なマルチモーダル学習タスクのための一般化された深層マルチモーダルニューラルアーキテクチャサーチ(MMnas)フレームワークを考案する。
マルチモーダル入力が与えられたら、まずプリミティブ演算のセットを定義し、その後、ディープエンコーダ-デコーダベースの統一バックボーンを構築する。
統合されたバックボーンの上にタスク固有のヘッドをアタッチして、異なるマルチモーダル学習タスクに取り組む。
論文 参考訳(メタデータ) (2020-04-25T07:00:32Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。