論文の概要: Salient Image Matting
- arxiv url: http://arxiv.org/abs/2103.12337v1
- Date: Tue, 23 Mar 2021 06:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-25 01:55:08.279819
- Title: Salient Image Matting
- Title(参考訳): 忠実な画像マッチング
- Authors: Rahul Deora, Rishab Sharma and Dinesh Samuel Sathia Raj
- Abstract要約: 本研究では,画像中の最も鮮やかな前景の画素あたりの不透明度値を推定するために,Salient Image Mattingという画像マッチングフレームワークを提案する。
我々のフレームワークは、広範囲のセマンティクスと健全なオブジェクトタイプを学ぶという課題を同時に扱う。
私たちのフレームワークは、他の自動メソッドと比較して、わずかな高価なマットデータのみを必要とします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose an image matting framework called Salient Image
Matting to estimate the per-pixel opacity value of the most salient foreground
in an image. To deal with a large amount of semantic diversity in images, a
trimap is conventionally required as it provides important guidance about
object semantics to the matting process. However, creating a good trimap is
often expensive and timeconsuming. The SIM framework simultaneously deals with
the challenge of learning a wide range of semantics and salient object types in
a fully automatic and an end to end manner. Specifically, our framework is able
to produce accurate alpha mattes for a wide range of foreground objects and
cases where the foreground class, such as human, appears in a very different
context than the train data directly from an RGB input. This is done by
employing a salient object detection model to produce a trimap of the most
salient object in the image in order to guide the matting model about
higher-level object semantics. Our framework leverages large amounts of coarse
annotations coupled with a heuristic trimap generation scheme to train the
trimap prediction network so it can produce trimaps for arbitrary foregrounds.
Moreover, we introduce a multi-scale fusion architecture for the task of
matting to better capture finer, low-level opacity semantics. With high-level
guidance provided by the trimap network, our framework requires only a fraction
of expensive matting data as compared to other automatic methods while being
able to produce alpha mattes for a diverse range of inputs. We demonstrate our
framework on a range of diverse images and experimental results show our
framework compares favourably against state of art matting methods without the
need for a trimap
- Abstract(参考訳): 本稿では,画像中の最も鮮やかな前景の画素あたりの不透明度値を推定する,Salient Image Mattingという画像マッチングフレームワークを提案する。
画像における大量の意味的多様性に対処するには、オブジェクトの意味論に関する重要なガイダンスをマットニングプロセスに提供するために、従来はトリマップが必要である。
しかし、良いトリマップを作ることは、しばしば高価で時間を要する。
SIMフレームワークは、完全に自動化され、エンド・ツー・エンドの方法で広範囲のセマンティクスと健全なオブジェクトタイプを学ぶという課題を同時に扱う。
特に,本フレームワークは,RGB入力から直接の列車データとはまったく異なる文脈で,前景オブジェクトや人などの前景クラスが出現するケースに対して,高精度なアルファマットを生成することができる。
これは、高レベルのオブジェクトセマンティクスに関するマットングモデルを導くために、画像内の最もサルエントなオブジェクトのトリマップを生成するためにサルエントオブジェクト検出モデルを使用することによって行われる。
我々のフレームワークは、大量の粗いアノテーションとヒューリスティックなトリマップ生成スキームを併用してトリマップ予測ネットワークをトレーニングし、任意のフォアグラウンドに対してトリマップを生成する。
さらに,より微細で低レベルな不透明なセマンティクスを捉えるために,マルチスケールの融合アーキテクチャを導入する。
trimapネットワークによって提供される高レベルなガイダンスにより、我々のフレームワークは、様々な入力に対してアルファマットを作成できる一方で、他の自動メソッドと比較して、ほんの少しの高価なマットングデータしか必要としません。
我々は,多種多様な画像のフレームワークを実演し,このフレームワークがトリマップを必要とせず,テクストマッチング手法の状態を好適に比較した。
関連論文リスト
- Learning Trimaps via Clicks for Image Matting [103.6578944248185]
Click2Trimapは,ユーザクリックの最小限の入力で高品質なトリマップとアルファ行列を予測できる対話型モデルである。
ユーザスタディでは、Click2Trimapは高品質なトリマップとマッティング予測を、1画像あたり平均5秒で達成している。
論文 参考訳(メタデータ) (2024-03-30T12:10:34Z) - TransMatting: Enhancing Transparent Objects Matting with Transformers [4.012340049240327]
本研究では,トランスフォーマーをベースとしたトランスマターネットワークを提案し,大きな受容場を持つ透明なオブジェクトをモデル化する。
エンコーダからデコーダへのマルチスケール特徴伝搬を導くために,グローバル機能と非バックグラウンドマスクを利用するために,小さな畳み込みネットワークを提案する。
我々は、小さなフォアグラウンド領域を持つ透明物体の高分解能マッチングデータセットを作成する。
論文 参考訳(メタデータ) (2022-08-05T06:44:14Z) - PP-Matting: High-Accuracy Natural Image Matting [11.68134059283327]
PP-Mattingは、高精度な自然な画像マッチングを実現するトリマップのないアーキテクチャである。
本手法は,前景のきめ細かい詳細を抽出する高精細ディテールブランチ (HRDB) を適用する。
また,意味的セグメンテーションのサブタスクを採用した意味的文脈分岐(SCB)を提案する。
論文 参考訳(メタデータ) (2022-04-20T12:54:06Z) - Deep Automatic Natural Image Matting [82.56853587380168]
自動画像マッチング(AIM)とは、任意の自然画像からソフトフォアグラウンドをトリマップのような補助的な入力なしで推定することである。
本稿では,これらの画像の一般化されたトリマップを統一的な意味表現として予測できる,新しいエンドツーエンドマッチングネットワークを提案する。
我々のネットワークは、利用可能な合成マッチングデータセットをトレーニングし、既存の手法を客観的にも主観的にも優れています。
論文 参考訳(メタデータ) (2021-07-15T10:29:01Z) - Semantic Image Matting [75.21022252141474]
交配領域のフレームワークセマンティクス分類に組み込むことで、より良いアルファマットを得る方法を紹介します。
具体的には,20種類のマットングパターンを検討し,学習し,従来の三角マップを意味的三角マップに拡張する提案を行う。
複数のベンチマーク実験により,本手法は他の手法よりも優れており,最も競争力のある最先端性能を実現していることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-16T16:21:02Z) - Smart Scribbles for Image Mating [90.18035889903909]
本稿では,ユーザが入力画像に数個のスクリブルを描画できるように,smart scribblesと呼ばれる対話型フレームワークを提案する。
異なるカテゴリを示すために、スクリブルを描画するための画像の最も情報性の高い領域を推測する。
その後、このクリブルを、よく設計された二相伝播によって画像の残りの部分に拡散させる。
論文 参考訳(メタデータ) (2021-03-31T13:30:49Z) - Human Perception Modeling for Automatic Natural Image Matting [2.179313476241343]
natural image mattingは、alpha matteを使って、フォアグラウンドオブジェクトを背景から正確に分離することを目的としている。
アノテーションを付加せずに直感的に設計したトリマップフリー2段階マッチング手法を提案する。
このマッティングアルゴリズムは,現在最先端の手法と,trimap-freeとtrimap-needの両方の面で競合する性能を持つ。
論文 参考訳(メタデータ) (2021-03-31T12:08:28Z) - Improved Image Matting via Real-time User Clicks and Uncertainty
Estimation [87.84632514927098]
本論文では,トリムアップフリーで,ユーザによるクリック操作だけであいまいさを解消できる深層画像マッチングフレームワークを提案する。
研磨が必要な部品を予測できる新しい不確実性推定モジュールと、以下の局所精製モジュールを紹介します。
その結果,既存の trimap-free メソッドよりも優れた性能を示し,ユーザの労力を最小限に抑え,最先端の trimap-based メソッドと比較できることがわかった。
論文 参考訳(メタデータ) (2020-12-15T14:32:36Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。