論文の概要: Towards Enhancing Fine-grained Details for Image Matting
- arxiv url: http://arxiv.org/abs/2101.09095v1
- Date: Fri, 22 Jan 2021 13:20:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 17:24:50.628791
- Title: Towards Enhancing Fine-grained Details for Image Matting
- Title(参考訳): 画像マット加工の細粒度向上に向けて
- Authors: Chang Liu, Henghui Ding, Xudong Jiang
- Abstract要約: 微視的詳細の復元は低レベルだが高精細なテクスチャの特徴に依存していると論じている。
本モデルは,従来のエンコーダデコーダセマンティックパスと,独立したダウンサンプリングフリーテクスチャ補償パスから構成される。
本手法は,Compposition-1kデータセットの以前の開始方法よりも優れている。
- 参考スコア(独自算出の注目度): 40.17208660790402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, deep natural image matting has been rapidly evolved by
extracting high-level contextual features into the model. However, most current
methods still have difficulties with handling tiny details, like hairs or furs.
In this paper, we argue that recovering these microscopic details relies on
low-level but high-definition texture features. However, {these features are
downsampled in a very early stage in current encoder-decoder-based models,
resulting in the loss of microscopic details}. To address this issue, we design
a deep image matting model {to enhance fine-grained details. Our model consists
of} two parallel paths: a conventional encoder-decoder Semantic Path and an
independent downsampling-free Textural Compensate Path (TCP). The TCP is
proposed to extract fine-grained details such as lines and edges in the
original image size, which greatly enhances the fineness of prediction.
Meanwhile, to leverage the benefits of high-level context, we propose a feature
fusion unit(FFU) to fuse multi-scale features from the semantic path and inject
them into the TCP. In addition, we have observed that poorly annotated trimaps
severely affect the performance of the model. Thus we further propose a novel
term in loss function and a trimap generation method to improve our model's
robustness to the trimaps. The experiments show that our method outperforms
previous start-of-the-art methods on the Composition-1k dataset.
- Abstract(参考訳): 近年,高レベルな文脈特徴をモデルに抽出することで,深層自然画像のマット化が急速に進展している。
しかし、現在の方法の多くは、毛髪や毛皮のような細部を扱うのに依然として難しい。
本稿では,これらの微視的詳細の復元は,低レベルだが高精細なテクスチャ特徴に依存すると論じる。
しかしながら、これらの特徴は現在のエンコーダデコーダベースのモデルにおいて非常に初期の段階でダウンサンプリングされ、顕微鏡的詳細が失われる。
この問題に対処するため,細部まで細部を拡大する深部画像マッチングモデルを設計する。
本モデルは,従来のエンコーダデコーダセマンティックパスと,独立したダウンサンプリングフリーなテクスチュラル補償パス(TCP)の2つの並列パスからなる。
TCPは、元の画像サイズにおける線やエッジなどの細かな詳細を抽出し、予測の微妙さを大幅に向上させる。
一方、高レベルのコンテキストの利点を活用するために、意味経路からマルチスケール機能を融合してTCPに注入する機能融合ユニット(FFU)を提案する。
さらに,アノテーションの少ないトリマップがモデルの性能に深刻な影響を与えていることも確認した。
そこで本研究では,新たな損失関数とトリマップ生成手法を提案し,モデルのトリマップに対するロバスト性を改善する。
実験の結果,本手法はコンポジション1kデータセットの先行手法よりも優れていた。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Multi-Modality Deep Network for JPEG Artifacts Reduction [33.02405073842042]
テキスト誘導JPEGアーティファクト削減のためのマルチモーダル融合学習法を提案する。
提案手法は,最先端の手法と比較して,より優れたデブロッキング結果が得られる。
論文 参考訳(メタデータ) (2023-05-04T11:54:02Z) - Disentangled Pre-training for Image Matting [74.10407744483526]
画像マッチングは、深層モデルのトレーニングをサポートするために高品質なピクセルレベルの人間のアノテーションを必要とする。
本研究では、無限個のデータを活用する自己教師付き事前学習手法を提案し、マッチング性能を向上する。
論文 参考訳(メタデータ) (2023-04-03T08:16:02Z) - ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。
点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。
より頑健なラディアンス場表現の体系化を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:55:31Z) - PP-Matting: High-Accuracy Natural Image Matting [11.68134059283327]
PP-Mattingは、高精度な自然な画像マッチングを実現するトリマップのないアーキテクチャである。
本手法は,前景のきめ細かい詳細を抽出する高精細ディテールブランチ (HRDB) を適用する。
また,意味的セグメンテーションのサブタスクを採用した意味的文脈分岐(SCB)を提案する。
論文 参考訳(メタデータ) (2022-04-20T12:54:06Z) - Highly Efficient Natural Image Matting [15.977598189574659]
軽量モデルを用いたトリマップフリーな自然画像マッチング手法を提案する。
非常に軽量なモデルを構築し、人気のある自然画像ベンチマーク上で1% (344k) の大規模モデルで同等の性能を実現する。
論文 参考訳(メタデータ) (2021-10-25T09:23:46Z) - PixelPyramids: Exact Inference Models from Lossless Image Pyramids [58.949070311990916]
Pixel-Pyramidsは、画像画素の関節分布を符号化するスケール特異的表現を用いたブロック自動回帰手法である。
様々な画像データセット、特に高解像度データに対する密度推定の最先端結果が得られる。
CelebA-HQ 1024 x 1024 では,フローベースモデルの並列化よりもサンプリング速度が優れているにもかかわらず,密度推定値がベースラインの 44% に向上することが観察された。
論文 参考訳(メタデータ) (2021-10-17T10:47:29Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。