論文の概要: Hierarchical and Progressive Image Matting
- arxiv url: http://arxiv.org/abs/2210.06906v1
- Date: Thu, 13 Oct 2022 11:16:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 16:27:12.045945
- Title: Hierarchical and Progressive Image Matting
- Title(参考訳): 階層的およびプログレッシブなイメージマットリング
- Authors: Yu Qiao, Yuhao Liu, Ziqi Wei, Yuxin Wang, Qiang Cai, Guofeng Zhang,
Xin Yang
- Abstract要約: エンド・ツー・エンドの階層的・プログレッシブ・アテンション・マッチング・ネットワーク(HAttMatting++)を提案する。
入力を追加することなく、単一のRGB画像から前景の不透明度を予測することができる。
59,600のトレーニング画像と1000のテスト画像からなる大規模かつ困難な画像マッチングデータセットを構築した。
- 参考スコア(独自算出の注目度): 40.291998690687514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most matting researches resort to advanced semantics to achieve high-quality
alpha mattes, and direct low-level features combination is usually explored to
complement alpha details. However, we argue that appearance-agnostic
integration can only provide biased foreground details and alpha mattes require
different-level feature aggregation for better pixel-wise opacity perception.
In this paper, we propose an end-to-end Hierarchical and Progressive Attention
Matting Network (HAttMatting++), which can better predict the opacity of the
foreground from single RGB images without additional input. Specifically, we
utilize channel-wise attention to distill pyramidal features and employ spatial
attention at different levels to filter appearance cues. This progressive
attention mechanism can estimate alpha mattes from adaptive semantics and
semantics-indicated boundaries. We also introduce a hybrid loss function fusing
Structural SIMilarity (SSIM), Mean Square Error (MSE), Adversarial loss, and
sentry supervision to guide the network to further improve the overall
foreground structure. Besides, we construct a large-scale and challenging image
matting dataset comprised of 59, 600 training images and 1000 test images (a
total of 646 distinct foreground alpha mattes), which can further improve the
robustness of our hierarchical and progressive aggregation model. Extensive
experiments demonstrate that the proposed HAttMatting++ can capture
sophisticated foreground structures and achieve state-of-the-art performance
with single RGB images as input.
- Abstract(参考訳): ほとんどのマットング研究は高度なセマンティクスを用いて高品質なアルファマットを実現しており、直接低レベルの機能の組み合わせはアルファの詳細を補完するために研究されている。
しかし,外見非依存の統合は前景の詳細に偏りを与えるだけであり,α行列は画素の視認性を高めるために異なるレベルの特徴集約を必要とする。
本稿では,1枚のRGB画像からフォアグラウンドの透明度をより正確に予測できる階層的・プログレッシブ・アテンション・マッチング・ネットワーク(HAttMatting++)を提案する。
具体的には, 蒸留ピラミッドの特徴にチャネル的に注意を向け, 異なるレベルの空間的注意を活用し, 外観の手がかりをフィルタする。
このプログレッシブアテンションメカニズムは、適応的セマンティクスとセマンティクスに代表される境界からアルファマットを推定することができる。
また,構造的類似性(ssim),平均二乗誤差(mse),逆損失(adversarial loss),セントリー監督(sedry supervisor)を併用したハイブリッド損失関数を導入し,前景構造の改善を導く。
さらに,59,600のトレーニング画像と1000のテスト画像(合計646個の前景アルファマット)からなる大規模かつ困難な画像マッチングデータセットを構築し,階層的および進行的集約モデルの堅牢性をさらに向上させる。
大規模な実験により、提案したHAttMatting++は、洗練された前景構造をキャプチャし、単一のRGBイメージを入力として最先端のパフォーマンスを実現することができる。
関連論文リスト
- Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Prior-Induced Information Alignment for Image Matting [28.90998570043986]
我々は、PIIAMatting(Presideed-induced Information Alignment Matting Network)という新しいネットワークを提案する。
ピクセルワイズ対応マップの区別と層ワイズ特徴マップの相関を効率的にモデル化することができる。
PIIAMattingはAlphamatting.com, composition-1K, Distinctions-646データセットの最先端の画像マッチング手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2021-06-28T07:46:59Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Smart Scribbles for Image Mating [90.18035889903909]
本稿では,ユーザが入力画像に数個のスクリブルを描画できるように,smart scribblesと呼ばれる対話型フレームワークを提案する。
異なるカテゴリを示すために、スクリブルを描画するための画像の最も情報性の高い領域を推測する。
その後、このクリブルを、よく設計された二相伝播によって画像の残りの部分に拡散させる。
論文 参考訳(メタデータ) (2021-03-31T13:30:49Z) - Deep Burst Super-Resolution [165.90445859851448]
バースト超解像タスクのための新しいアーキテクチャを提案する。
我々のネットワークは複数のノイズRAW画像を入力として取り出し、出力として分解された超解像RGB画像を生成する。
実世界のデータのトレーニングと評価を可能にするため,BurstSRデータセットも導入する。
論文 参考訳(メタデータ) (2021-01-26T18:57:21Z) - Multi-scale Information Assembly for Image Matting [35.43994064645042]
単一のRGB画像から高品質のアルファマットを取り出すマルチスケール情報組み立てフレームワーク(MSIA-matte)を提案する。
既存のマッティングネットワークと比較して、最先端のパフォーマンスを実現できます。
論文 参考訳(メタデータ) (2021-01-07T06:15:48Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z) - Hierarchical Opacity Propagation for Image Matting [15.265494938937737]
ピクセル間のより直接的アルファマット伝播のための新しい構造が要求されている。
HOPマッティングは最先端のマッティング法より優れている。
論文 参考訳(メタデータ) (2020-04-07T10:39:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。