論文の概要: Highly Efficient Natural Image Matting
- arxiv url: http://arxiv.org/abs/2110.12748v1
- Date: Mon, 25 Oct 2021 09:23:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 02:10:09.219611
- Title: Highly Efficient Natural Image Matting
- Title(参考訳): 高効率自然画像マッティング
- Authors: Yijie Zhong, Bo Li, Lv Tang, Hao Tang, Shouhong Ding
- Abstract要約: 軽量モデルを用いたトリマップフリーな自然画像マッチング手法を提案する。
非常に軽量なモデルを構築し、人気のある自然画像ベンチマーク上で1% (344k) の大規模モデルで同等の性能を実現する。
- 参考スコア(独自算出の注目度): 15.977598189574659
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Over the last few years, deep learning based approaches have achieved
outstanding improvements in natural image matting. However, there are still two
drawbacks that impede the widespread application of image matting: the reliance
on user-provided trimaps and the heavy model sizes. In this paper, we propose a
trimap-free natural image matting method with a lightweight model. With a
lightweight basic convolution block, we build a two-stages framework:
Segmentation Network (SN) is designed to capture sufficient semantics and
classify the pixels into unknown, foreground and background regions; Matting
Refine Network (MRN) aims at capturing detailed texture information and
regressing accurate alpha values. With the proposed cross-level fusion Module
(CFM), SN can efficiently utilize multi-scale features with less computational
cost. Efficient non-local attention module (ENA) in MRN can efficiently model
the relevance between different pixels and help regress high-quality alpha
values. Utilizing these techniques, we construct an extremely light-weighted
model, which achieves comparable performance with ~1\% parameters (344k) of
large models on popular natural image matting benchmarks.
- Abstract(参考訳): ここ数年、ディープラーニングベースのアプローチは、自然な画像マッチングにおいて顕著に改善されてきた。
しかし、画像マッチングの広範な適用を妨げる欠点は、ユーザが提供するトリマップへの依存と、重いモデルサイズである。
本稿では,軽量モデルを用いたトリマップフリー自然画像マットリング手法を提案する。
セグメンテーションネットワーク(SN)は、十分なセマンティクスをキャプチャし、ピクセルを未知、前景、背景の領域に分類するように設計され、マッティングリファインネットワーク(MRN)は詳細なテクスチャ情報をキャプチャし、正確なアルファ値を回帰することを目的としている。
提案したクロスレベル融合モジュール(CFM)により、SNは計算コストの少ないマルチスケール機能を効率的に利用することができる。
MRNの効率的な非局所アテンションモジュール(ENA)は、異なるピクセル間の関係を効率的にモデル化し、高品質なアルファ値の回帰に役立つ。
これらの手法を利用して, 一般的な自然画像マットングベンチマークにおいて, 約1\%のパラメータ (344k) の大規模モデルと同等の性能を実現する, 極めて軽量なモデルを構築した。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Towards Enhancing Fine-grained Details for Image Matting [40.17208660790402]
微視的詳細の復元は低レベルだが高精細なテクスチャの特徴に依存していると論じている。
本モデルは,従来のエンコーダデコーダセマンティックパスと,独立したダウンサンプリングフリーテクスチャ補償パスから構成される。
本手法は,Compposition-1kデータセットの以前の開始方法よりも優れている。
論文 参考訳(メタデータ) (2021-01-22T13:20:23Z) - TextureWGAN: Texture Preserving WGAN with MLE Regularizer for Inverse
Problems [4.112614964808275]
提案手法の中で最も一般的で効果的な方法は平均二乗誤差(MSE)を持つ畳み込みニューラルネットワーク(CNN)である。
逆問題に対するWGAN(Wasserstein GAN)に基づく新しい手法を提案する。
We showed that the WGAN-based method was effective to maintain image texture, it also also used a maximum max estimation regularizer (MLE) to maintain pixel fidelity。
論文 参考訳(メタデータ) (2020-08-11T17:06:34Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。