論文の概要: Adaptive Convolutions with Per-pixel Dynamic Filter Atom
- arxiv url: http://arxiv.org/abs/2108.07895v1
- Date: Tue, 17 Aug 2021 22:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:43:41.789948
- Title: Adaptive Convolutions with Per-pixel Dynamic Filter Atom
- Title(参考訳): Per-Pixel Dynamic Filter Atomによる適応畳み込み
- Authors: Ze Wang, Zichen Miao, Jun Hu, and Qiang Qiu
- Abstract要約: 画素ごとの適応フィルタによるスケーラブルな動的畳み込みを導入する。
コンボリューション層へのプラグアンドプレイ置換として、ピクセル単位の動的原子による適応的畳み込みは、画像内分散の明示的なモデリングを可能にする。
本稿では,提案手法がタスク間で同等あるいはさらに優れたパフォーマンスを実現することを示す実験を行う。
- 参考スコア(独自算出の注目度): 24.691793951360914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applying feature dependent network weights have been proved to be effective
in many fields. However, in practice, restricted by the enormous size of model
parameters and memory footprints, scalable and versatile dynamic convolutions
with per-pixel adapted filters are yet to be fully explored. In this paper, we
address this challenge by decomposing filters, adapted to each spatial
position, over dynamic filter atoms generated by a light-weight network from
local features. Adaptive receptive fields can be supported by further
representing each filter atom over sets of pre-fixed multi-scale bases. As
plug-and-play replacements to convolutional layers, the introduced adaptive
convolutions with per-pixel dynamic atoms enable explicit modeling of
intra-image variance, while avoiding heavy computation, parameters, and memory
cost. Our method preserves the appealing properties of conventional
convolutions as being translation-equivariant and parametrically efficient. We
present experiments to show that, the proposed method delivers comparable or
even better performance across tasks, and are particularly effective on
handling tasks with significant intra-image variance.
- Abstract(参考訳): 特徴依存的ネットワーク重み付けの適用は多くの分野で有効であることが証明されている。
しかし、実際には、モデルパラメータとメモリフットプリントの巨大さによって制限され、スケーラブルで多用途な動的畳み込みと画素ごとの適応フィルタは、まだ完全には研究されていない。
本稿では,局所的な特徴から軽量ネットワークが生成する動的フィルタ原子に対して,各空間位置に適応したフィルタを分解することで,この問題に対処する。
適応受容場は、事前に固定されたマルチスケールベース上の各フィルタ原子をさらに表現することで支持できる。
コンボリューション層へのプラグ・アンド・プレイの置き換えとして、ピクセル単位の動的原子による適応的畳み込みは、重い計算、パラメータ、メモリコストを回避しつつ、画像内分散の明示的なモデリングを可能にする。
本手法は,従来の畳み込みの魅力を翻訳同変でパラメトリックな効率で保存する。
本稿では,提案手法がタスク間で同等あるいはさらに優れたパフォーマンスを提供することを示す実験を行い,特に画像内分散の大きいタスクに有効であることを示す。
関連論文リスト
- OminiControl: Minimal and Universal Control for Diffusion Transformer [68.3243031301164]
OminiControlは、イメージ条件をトレーニング済みのDiffusion Transformer(DiT)モデルに統合するフレームワークである。
コアとなるOminiControlはパラメータ再利用機構を活用しており、強力なバックボーンとしてイメージ条件をエンコードすることができる。
OminiControlは、主観駆動生成や空間的に整合した条件を含む、幅広いイメージコンディショニングタスクを統一的に処理する。
論文 参考訳(メタデータ) (2024-11-22T17:55:15Z) - Spatially-Attentive Patch-Hierarchical Network with Adaptive Sampling
for Motion Deblurring [34.751361664891235]
そこで本稿では,異なる空間領域にまたがる大きなぼやけた変化を扱うために,画素適応化と特徴注意設計を提案する。
提案手法は,最先端のデブロワーリングアルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2024-02-09T01:00:09Z) - Decomposed Guided Dynamic Filters for Efficient RGB-Guided Depth
Completion [46.04264366475848]
RGB誘導深度補正は、スパース深度測定と対応するRGB画像から深度マップを予測することを目的としている。
ガイド付き動的フィルタは、RGB特徴から空間的に可変な深度分割可能な畳み込みフィルタを生成し、深度特徴を導出する。
本稿では,ガイド付き動的フィルタを空間的に共有されたコンポーネントに分解し,各空間位置におけるコンテンツ適応型適応器を乗じて分解する。
論文 参考訳(メタデータ) (2023-09-05T08:37:58Z) - Tunable Convolutions with Parametric Multi-Loss Optimization [5.658123802733283]
ニューラルネットワークの挙動は、トレーニング中に使用される特定の損失とデータによって不適切に決定される。
ユーザの好みやデータの動的特性といった外部要因に基づいて,推論時にモデルをチューニングすることが望ましい場合が多い。
これは、不適切な画像から画像への変換タスクの知覚歪曲トレードオフのバランスをとるために特に重要である。
論文 参考訳(メタデータ) (2023-04-03T11:36:10Z) - Adaptive Single Image Deblurring [43.02281823557039]
本稿では,画像間の大きなぼやけた変化を扱うために,効率的な画素適応化と特徴注意設計を提案する。
また、性能を大幅に向上させる効果的なコンテンツ認識グローバルローカルフィルタリングモジュールを提案する。
論文 参考訳(メタデータ) (2022-01-01T10:10:19Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z) - Efficient Spatially Adaptive Convolution and Correlation [11.167305713900074]
本研究では,空間的に異なる線形変換をフィルタに適用できる表現理論フレームワークを提案する。
このフレームワークは、回転(2Dおよび3D)やスケールのような変換群に対する拡張畳み込みと相関の効率的な実装を可能にする。
本稿では,パターンマッチング,画像特徴記述,ベクトル場可視化,適応画像フィルタリングへの応用について述べる。
論文 参考訳(メタデータ) (2020-06-23T17:41:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。