論文の概要: FADE: A Task-Agnostic Upsampling Operator for Encoder-Decoder Architectures
- arxiv url: http://arxiv.org/abs/2407.13500v1
- Date: Thu, 18 Jul 2024 13:32:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-19 15:20:54.684143
- Title: FADE: A Task-Agnostic Upsampling Operator for Encoder-Decoder Architectures
- Title(参考訳): FADE:エンコーダ・デコーダアーキテクチャのためのタスク非依存のアップサンプリング演算子
- Authors: Hao Lu, Wenze Liu, Hongtao Fu, Zhiguo Cao,
- Abstract要約: FADEは、新しくて、プラグアンドプレイで、軽量で、タスクに依存しないアップサンプリングオペレータである。
FADEはタスク非依存であり,多くの密集予測タスクにおいて一貫した性能向上を示す。
リージョンとディテールに敏感なタスクの両方で,ロバストな機能アップサンプリングを初めて実施しました。
- 参考スコア(独自算出の注目度): 18.17019371324024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this work is to develop a task-agnostic feature upsampling operator for dense prediction where the operator is required to facilitate not only region-sensitive tasks like semantic segmentation but also detail-sensitive tasks such as image matting. Prior upsampling operators often can work well in either type of the tasks, but not both. We argue that task-agnostic upsampling should dynamically trade off between semantic preservation and detail delineation, instead of having a bias between the two properties. In this paper, we present FADE, a novel, plug-and-play, lightweight, and task-agnostic upsampling operator by fusing the assets of decoder and encoder features at three levels: i) considering both the encoder and decoder feature in upsampling kernel generation; ii) controlling the per-point contribution of the encoder/decoder feature in upsampling kernels with an efficient semi-shift convolutional operator; and iii) enabling the selective pass of encoder features with a decoder-dependent gating mechanism for compensating details. To improve the practicality of FADE, we additionally study parameter- and memory-efficient implementations of semi-shift convolution. We analyze the upsampling behavior of FADE on toy data and show through large-scale experiments that FADE is task-agnostic with consistent performance improvement on a number of dense prediction tasks with little extra cost. For the first time, we demonstrate robust feature upsampling on both region- and detail-sensitive tasks successfully. Code is made available at: https://github.com/poppinace/fade
- Abstract(参考訳): 本研究の目的は、意味的セグメンテーションのような領域依存的なタスクだけでなく、画像マッチングのような細部依存的なタスクを容易にするために、オペレータが要求される密集予測のためのタスクに依存しない機能アップサンプリング演算子を開発することである。
以前のアップサンプリング演算子は、どちらのタイプのタスクでもうまく機能するが、両方ではない。
タスク非依存のアップサンプリングは,2つの特性間のバイアスを伴わずに,意味的保存と詳細記述のトレードオフを動的に行うべきだ,と我々は主張する。
本稿では,デコーダとエンコーダの機能の資産を3つのレベルで融合させることにより,新しい,プラグアンドプレイ,軽量,タスクに依存しないアップサンプリング演算子FADEを提案する。
一 カーネルのアップサンプリングにおけるエンコーダとデコーダの特徴の両方を考慮すること。
二 効率的な半シフト畳み込み演算子を有するアップサンプリングカーネルにおけるエンコーダ/デコーダ特徴の点当たりの寄与を制御すること。
三 詳細を補うための復号器依存ゲーティング機構により、エンコーダの特徴の選択的通過を可能にすること。
FADEの実用性を改善するため,セミシフト畳み込みのパラメータとメモリ効率を考察した。
玩具データ上でのFADEのアップサンプリング挙動を解析し,FADEがタスクに依存しない大規模実験により,多くの高密度予測タスクにおける一貫した性能向上と余分なコストを伴わないことを示す。
リージョンとディテールに敏感なタスクの両方で,ロバストな機能アップサンプリングを初めて実施しました。
コードは、https://github.com/poppinace/fade.comで公開されている。
関連論文リスト
- PAGE: Parametric Generative Explainer for Graph Neural Network [16.350208494261913]
PAGEは、事前の知識や内部の詳細を必要とせずに、グラフニューラルネットワークに対して忠実な説明を提供することができる。
我々は,潜在因果関係の特徴とモデル出力の因果関係を捉えるために,新たな判別器を導入する。
既存の方法と比較して、PAGEはノードやエッジではなく、サンプルスケールで動作する。
論文 参考訳(メタデータ) (2024-08-26T06:39:49Z) - Refine, Discriminate and Align: Stealing Encoders via Sample-Wise Prototypes and Multi-Relational Extraction [57.16121098944589]
RDAは、事前訓練されたエンコーダを盗むために、以前の取り組みで普及した2つの主要な欠陥に対処するために設計された先駆的なアプローチである。
これは、サンプルの様々な視点に対してターゲットエンコーダの表現を統一するサンプルワイドプロトタイプによって達成される。
より強力な有効性を得るために、我々はサロゲートエンコーダを訓練し、ミスマッチした埋め込み-プロトタイプペアを識別するマルチリレーショナル抽出損失を開発する。
論文 参考訳(メタデータ) (2023-12-01T15:03:29Z) - Efficient Controllable Multi-Task Architectures [85.76598445904374]
本稿では,共有エンコーダとタスク固有デコーダからなるマルチタスクモデルを提案する。
我々のキーとなる考え方は、タスク固有のデコーダの容量を変化させ、計算コストの総和を制御し、タスクの重要度を制御することである。
これにより、与えられた予算に対してより強力なエンコーダを許可し、計算コストの制御を高め、高品質のスリム化サブアーキテクチャを提供することにより、全体的な精度を向上させる。
論文 参考訳(メタデータ) (2023-08-22T19:09:56Z) - ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-18T02:06:49Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Think Twice before Driving: Towards Scalable Decoders for End-to-End
Autonomous Driving [74.28510044056706]
既存のメソッドは通常、分離されたエンコーダ-デコーダパラダイムを採用する。
本研究は,この問題を2つの原則で緩和することを目的としている。
まず、エンコーダの特徴に基づいて、粗い将来の位置と行動を予測する。
そして、その位置と動作を条件に、将来のシーンを想像して、それに従って運転した場合にその影響を確認する。
論文 参考訳(メタデータ) (2023-05-10T15:22:02Z) - FADE: Fusing the Assets of Decoder and Encoder for Task-Agnostic
Upsampling [21.590872272491033]
FADEは、新規で、プラグアンドプレイで、タスクに依存しないアップサンプリング演算子である。
まず, 玩具データを用いたFADEのアップサンプリング特性について検討し, 大規模セマンティックセグメンテーションと画像マッチングによる評価を行った。
論文 参考訳(メタデータ) (2022-07-21T10:06:01Z) - Hyperdecoders: Instance-specific decoders for multi-task NLP [9.244884318445413]
NLPにおけるマルチタスクのための入力条件付きハイパーネットワークについて検討する。
我々は,エンコーダの出力に条件付きハイパーネットワークを用いて,デコーダのパラメータ効率適応を生成する。
論文 参考訳(メタデータ) (2022-03-15T22:39:53Z) - TRACER: Extreme Attention Guided Salient Object Tracing Network [3.2434811678562676]
本稿では,注意誘導型トレーシングモジュールを組み込んで,鮮明なエッジで有意な物体を検出するTRACERを提案する。
13の既存手法との比較により、TRACERは5つのベンチマークデータセットで最先端のパフォーマンスを達成することが明らかになった。
論文 参考訳(メタデータ) (2021-12-14T13:20:07Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。