論文の概要: TransMatting: Enhancing Transparent Objects Matting with Transformers
- arxiv url: http://arxiv.org/abs/2208.03007v1
- Date: Fri, 5 Aug 2022 06:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-08 12:42:13.365906
- Title: TransMatting: Enhancing Transparent Objects Matting with Transformers
- Title(参考訳): トランスマッティング:トランスフォーマーによる透明なオブジェクトマッティングの強化
- Authors: Huanqia Cai, Fanglei Xue, Lele Xu, Lili Guo
- Abstract要約: 本研究では,トランスフォーマーをベースとしたトランスマターネットワークを提案し,大きな受容場を持つ透明なオブジェクトをモデル化する。
エンコーダからデコーダへのマルチスケール特徴伝搬を導くために,グローバル機能と非バックグラウンドマスクを利用するために,小さな畳み込みネットワークを提案する。
我々は、小さなフォアグラウンド領域を持つ透明物体の高分解能マッチングデータセットを作成する。
- 参考スコア(独自算出の注目度): 4.012340049240327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image matting refers to predicting the alpha values of unknown foreground
areas from natural images. Prior methods have focused on propagating alpha
values from known to unknown regions. However, not all natural images have a
specifically known foreground. Images of transparent objects, like glass,
smoke, web, etc., have less or no known foreground. In this paper, we propose a
Transformer-based network, TransMatting, to model transparent objects with a
big receptive field. Specifically, we redesign the trimap as three learnable
tri-tokens for introducing advanced semantic features into the self-attention
mechanism. A small convolutional network is proposed to utilize the global
feature and non-background mask to guide the multi-scale feature propagation
from encoder to decoder for maintaining the contexture of transparent objects.
In addition, we create a high-resolution matting dataset of transparent objects
with small known foreground areas. Experiments on several matting benchmarks
demonstrate the superiority of our proposed method over the current
state-of-the-art methods.
- Abstract(参考訳): 画像マットリングは、自然画像から未知の前景領域のアルファ値を予測することを指す。
以前の手法では、既知の領域から未知領域へのアルファ値の伝播に重点を置いてきた。
しかし、すべての自然画像が特定の前景を持っているわけではない。
ガラス、煙、ウェブなどの透明な物体の画像は、ほとんど、あるいは全く知られていない。
本稿では,トランスフォーマーをベースとしたトランスマターネットワークを提案し,大きな受容場を持つ透明物体をモデル化する。
具体的には,trimapを学習可能な3つのトライトケンとして再設計し,自己着脱機構に高度な意味的特徴を導入する。
グローバル特徴と非バックグランドマスクを用いて,エンコーダからデコーダへのマルチスケール特徴伝播を誘導し,透明なオブジェクトの文脈を維持するための小型畳み込みネットワークを提案する。
さらに,小さな既知領域を持つ透明なオブジェクトの高解像度なマットングデータセットを作成する。
いくつかのマットングベンチマーク実験では,提案手法が最先端手法よりも優れていることを示す。
関連論文リスト
- From Transparent to Opaque: Rethinking Neural Implicit Surfaces with $α$-NeuS [41.38491898098891]
本稿では,ニューラル暗黙表面(NeuS)に基づく透明な物体と不透明な物体を再構成する新しい手法である$alpha$-NeuSを紹介する。
固定されたアイソ値に依存するマーチングキューブのような従来のアイソ対向アルゴリズムは、このデータには不適である。
再構成された表面は透明な物体と不透明な物体の両方に対して不偏であることを示す。
論文 参考訳(メタデータ) (2024-11-08T06:36:31Z) - DiffusionMat: Alpha Matting as Sequential Refinement Learning [87.76572845943929]
DiffusionMatは、粗いアルファマットから洗練されたアルファマットへの移行に拡散モデルを利用する画像マッチングフレームワークである。
補正モジュールは、各復調ステップで出力を調整し、最終的な結果が入力画像の構造と一致していることを保証する。
その結果,DiffusionMatは既存の手法よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-11-22T17:16:44Z) - TransMatting: Tri-token Equipped Transformer Model for Image Matting [4.012340049240327]
本稿では,トランスフォーマーをベースとしたトランスマターネットワーク(TransMatting)を提案し,長距離機能を持つ透明なオブジェクトをモデル化する。
また、トリマップをトリトーケンという3つの学習可能なトークンとして再設計しました。
提案するTransMattingは,いくつかの人気マッチングベンチマークと新たに収集したTransparent-460において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2023-03-11T18:21:25Z) - Location-Free Camouflage Generation Network [82.74353843283407]
カモフラージュ(Camouflage)は一般的な視覚現象で、前景の物体を背景のイメージに隠すことで、人間の目からは一時的に見えなくなる。
本稿では,前景と背景像の高次特徴を融合させ,一つの推論によって結果を生成する,ロケーションフリーなカモフラージュ生成ネットワーク(LCG-Net)を提案する。
実験により,本手法は単一外観領域における最先端技術と同程度に良好であり,完全に見えない可能性が低いが,多外観領域における最先端技術の品質をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2022-03-18T10:33:40Z) - Long-Range Feature Propagating for Natural Image Matting [93.20589403997505]
自然画像マッチングは、トリマップ内の未知領域のアルファ値を推定する。
近年、深層学習に基づく手法は、その類似性に応じて、既知の領域から未知領域へのアルファ値の伝播を行っている。
本稿では,Alpha matte 推定のために受信フィールド外における長距離コンテキスト特徴を学習する Long-Range Feature Propagating Network (LFPNet) を提案する。
論文 参考訳(メタデータ) (2021-09-25T01:17:17Z) - Deep Automatic Natural Image Matting [82.56853587380168]
自動画像マッチング(AIM)とは、任意の自然画像からソフトフォアグラウンドをトリマップのような補助的な入力なしで推定することである。
本稿では,これらの画像の一般化されたトリマップを統一的な意味表現として予測できる,新しいエンドツーエンドマッチングネットワークを提案する。
我々のネットワークは、利用可能な合成マッチングデータセットをトレーニングし、既存の手法を客観的にも主観的にも優れています。
論文 参考訳(メタデータ) (2021-07-15T10:29:01Z) - Semantic Image Matting [75.21022252141474]
交配領域のフレームワークセマンティクス分類に組み込むことで、より良いアルファマットを得る方法を紹介します。
具体的には,20種類のマットングパターンを検討し,学習し,従来の三角マップを意味的三角マップに拡張する提案を行う。
複数のベンチマーク実験により,本手法は他の手法よりも優れており,最も競争力のある最先端性能を実現していることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-16T16:21:02Z) - Human Perception Modeling for Automatic Natural Image Matting [2.179313476241343]
natural image mattingは、alpha matteを使って、フォアグラウンドオブジェクトを背景から正確に分離することを目的としている。
アノテーションを付加せずに直感的に設計したトリマップフリー2段階マッチング手法を提案する。
このマッティングアルゴリズムは,現在最先端の手法と,trimap-freeとtrimap-needの両方の面で競合する性能を持つ。
論文 参考訳(メタデータ) (2021-03-31T12:08:28Z) - Salient Image Matting [0.0]
本研究では,画像中の最も鮮やかな前景の画素あたりの不透明度値を推定するために,Salient Image Mattingという画像マッチングフレームワークを提案する。
我々のフレームワークは、広範囲のセマンティクスと健全なオブジェクトタイプを学ぶという課題を同時に扱う。
私たちのフレームワークは、他の自動メソッドと比較して、わずかな高価なマットデータのみを必要とします。
論文 参考訳(メタデータ) (2021-03-23T06:22:33Z) - Through the Looking Glass: Neural 3D Reconstruction of Transparent
Shapes [75.63464905190061]
屈折と反射によって誘導される複雑な光路は、従来の多視点ステレオと深いステレオの両方がこの問題を解決するのを妨げている。
携帯電話カメラで取得したいくつかの画像を用いて透明物体の3次元形状を復元する物理ネットワークを提案する。
5-12個の自然画像を用いて, 複雑な透明形状に対する高品質な3次元形状の復元に成功した。
論文 参考訳(メタデータ) (2020-04-22T23:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。