論文の概要: Long-Range Feature Propagating for Natural Image Matting
- arxiv url: http://arxiv.org/abs/2109.12252v1
- Date: Sat, 25 Sep 2021 01:17:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:41:37.282817
- Title: Long-Range Feature Propagating for Natural Image Matting
- Title(参考訳): 自然画像マット化のための長距離特徴伝達
- Authors: Qinglin Liu, Haozhe Xie, Shengping Zhang, Bineng Zhong and Rongrong Ji
- Abstract要約: 自然画像マッチングは、トリマップ内の未知領域のアルファ値を推定する。
近年、深層学習に基づく手法は、その類似性に応じて、既知の領域から未知領域へのアルファ値の伝播を行っている。
本稿では,Alpha matte 推定のために受信フィールド外における長距離コンテキスト特徴を学習する Long-Range Feature Propagating Network (LFPNet) を提案する。
- 参考スコア(独自算出の注目度): 93.20589403997505
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Natural image matting estimates the alpha values of unknown regions in the
trimap. Recently, deep learning based methods propagate the alpha values from
the known regions to unknown regions according to the similarity between them.
However, we find that more than 50\% pixels in the unknown regions cannot be
correlated to pixels in known regions due to the limitation of small effective
reception fields of common convolutional neural networks, which leads to
inaccurate estimation when the pixels in the unknown regions cannot be inferred
only with pixels in the reception fields. To solve this problem, we propose
Long-Range Feature Propagating Network (LFPNet), which learns the long-range
context features outside the reception fields for alpha matte estimation.
Specifically, we first design the propagating module which extracts the context
features from the downsampled image. Then, we present Center-Surround Pyramid
Pooling (CSPP) that explicitly propagates the context features from the
surrounding context image patch to the inner center image patch. Finally, we
use the matting module which takes the image, trimap and context features to
estimate the alpha matte. Experimental results demonstrate that the proposed
method performs favorably against the state-of-the-art methods on the
AlphaMatting and Adobe Image Matting datasets.
- Abstract(参考訳): 自然な画像マッチングは、トリマップ内の未知領域のアルファ値を推定する。
近年、深層学習に基づく手法は、その類似性に応じて、既知の領域から未知領域へのアルファ値の伝播を行っている。
しかし, 未知領域の50\%以上の画素は, 共通畳み込みニューラルネットワークの小さな有効受信フィールドの制限により, 未知領域の画素が受信フィールドの画素にのみ当てはまらない場合に, 不正確な推定が生じるため, 未知領域の画素と未知領域の画素との相関が得られないことが判明した。
この問題を解決するために,アルファマット推定のために受信フィールド外の長距離コンテキスト特徴を学習するLong-Range Feature Propagating Network (LFPNet)を提案する。
具体的には,まず,ダウンサンプル画像からコンテキスト特徴を抽出するプロパゲーションモジュールを設計した。
次に,周囲のコンテキストイメージパッチから内部センターイメージパッチへのコンテキスト特徴を明示的に伝達する,センターサーラウンドピラミッドプーリング(cspp)を提案する。
最後に、イメージ、トリマップ、コンテキスト機能を取り込んだマットングモジュールを使用して、アルファマットを推定します。
実験結果から,提案手法はAlphaMattingおよびAdobe Image Mattingデータセットの最先端手法に対して良好に動作することが示された。
関連論文リスト
- DiffusionMat: Alpha Matting as Sequential Refinement Learning [87.76572845943929]
DiffusionMatは、粗いアルファマットから洗練されたアルファマットへの移行に拡散モデルを利用する画像マッチングフレームワークである。
補正モジュールは、各復調ステップで出力を調整し、最終的な結果が入力画像の構造と一致していることを保証する。
その結果,DiffusionMatは既存の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-11-22T17:16:44Z) - Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering [84.37776381343662]
Mip-NeRFは、スケール情報をエンコードする円錐フラストラムとしてマルチスケール表現を提案する。
我々は,リアルタイムなアンチエイリアスレンダリングのためのマルチスケールな明示的表現であるmip voxel grids (Mip-VoG)を提案する。
私たちのアプローチは、マルチスケールのトレーニングとリアルタイムのアンチエイリアスレンダリングを同時に提供する最初の方法です。
論文 参考訳(メタデータ) (2023-04-20T04:05:22Z) - Alpha Matte Generation from Single Input for Portrait Matting [79.62140902232628]
目標は、各画素が前景の被写体に与える影響を識別するアルファマットを予測することである。
従来のアプローチや既存の作業の多くは、アルファマットの予測にトリマップ、背景画像などの追加入力を使用していた。
我々は、GAN(Generative Adversarial Nets)を用いたポートレート・マッティングを行うための追加の入力不要アプローチを導入する。
論文 参考訳(メタデータ) (2021-06-06T18:53:42Z) - Foreground color prediction through inverse compositing [19.0945877082419]
自然なイメージのマットでは、目的はイメージの前景のオブジェクトの不透明度を推定することです。
近年、ディープラーニングの進歩により、多くの自然画像マッチングアルゴリズムが完全に自動的に優れたパフォーマンスを達成しています。
本稿では,画像の前景色と背景色を復元するための後処理手法として使用できる新しいリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-03-24T18:10:15Z) - Duplex Contextual Relation Network for Polyp Segmentation [19.509290186267396]
画像内および画像間コンテキスト間関係をキャプチャする二重文脈関係ネットワーク(dcrnet)を提案する。
提案手法をEndoScene, Kvasir-SEG, 最近リリースされた大規模PICCOLOデータセット上で評価した。
論文 参考訳(メタデータ) (2021-03-11T15:19:54Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Fast Multi-Level Foreground Estimation [0.4588028371034407]
得られたアルファマットは、合成画像の色にどれだけの額のフォアグラウンドと背景色が寄与するかをピクセル単位で記述する。
文献のほとんどの方法はアルファマットの推定に重点を置いているが、入力された画像とそのアルファマットが与えられた前景の色を推定する過程は無視されることが多い。
アルファマットを用いた前景推定手法を提案する。
論文 参考訳(メタデータ) (2020-06-26T13:16:13Z) - Hierarchical Opacity Propagation for Image Matting [15.265494938937737]
ピクセル間のより直接的アルファマット伝播のための新しい構造が要求されている。
HOPマッティングは最先端のマッティング法より優れている。
論文 参考訳(メタデータ) (2020-04-07T10:39:55Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Natural Image Matting via Guided Contextual Attention [18.034160025888056]
本研究は,自然画像マッチングのための新しいエンド・ツー・エンド・アプローチを,ガイド付きコンテキストアテンションモジュールで開発する。
提案手法は親和性に基づく手法の情報フローを模倣し,深層ニューラルネットワークで学習した豊富な特徴を同時に利用することができる。
composition-1k test set と alphamatting.com ベンチマークデータセットの実験結果から,本手法は自然な画像マッチングにおける最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-01-13T05:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。