論文の概要: Efficient Neural Generation of 4K Masks for Homogeneous Diffusion
Inpainting
- arxiv url: http://arxiv.org/abs/2303.10096v1
- Date: Fri, 17 Mar 2023 16:16:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 14:00:50.945860
- Title: Efficient Neural Generation of 4K Masks for Homogeneous Diffusion
Inpainting
- Title(参考訳): 均一拡散塗装のための4Kマスクの高効率ニューラルネットワーク
- Authors: Karl Schrader, Pascal Peter, Niklas K\"amper, Joachim Weickert
- Abstract要約: 均質な拡散塗装は 高品質のスパースデータから 画像を再構成できる
画像圧縮のようなアプリケーションのマスク最適化は依然として難しい。
このいわゆるマスク問題に対する最初のニューラルアプローチは、小さな画像に対して高速で高品質なものだった。
これらの問題を解き、ニューロ明示的粗大な戦略により高解像度画像のマスク最適化を可能にする。
- 参考スコア(独自算出の注目度): 9.309874236223983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With well-selected data, homogeneous diffusion inpainting can reconstruct
images from sparse data with high quality. While 4K colour images of size 3840
x 2160 can already be inpainted in real time, optimising the known data for
applications like image compression remains challenging: Widely used stochastic
strategies can take days for a single 4K image. Recently, a first neural
approach for this so-called mask optimisation problem offered high speed and
good quality for small images. It trains a mask generation network with the
help of a neural inpainting surrogate. However, these mask networks can only
output masks for the resolution and mask density they were trained for. We
solve these problems and enable mask optimisation for high-resolution images
through a neuroexplicit coarse-to-fine strategy. Additionally, we improve the
training and interpretability of mask networks by including a numerical
inpainting solver directly into the network. This allows to generate masks for
4K images in around 0.6 seconds while exceeding the quality of stochastic
methods on practically relevant densities. Compared to popular existing
approaches, this is an acceleration of up to four orders of magnitude.
- Abstract(参考訳): 適切に選択されたデータにより、均質な拡散塗装は、スパースデータから高品質で画像を再構成することができる。
サイズ3840 x 2160の4kカラー画像は、すでにリアルタイムにペイント可能だが、画像圧縮のようなアプリケーションのために既知のデータを最適化することは、依然として困難である。
最近、このいわゆるマスク最適化問題に対する最初のニューラルアプローチは、小さな画像に対して高速で優れた品質を提供する。
マスク生成ネットワークを、神経の塗布サロゲートの助けを借りて訓練する。
しかし、これらのマスクネットワークは、トレーニングされた解像度とマスク密度のためにのみマスクを出力することができる。
これらの問題を解き、ニューロ明示的粗大な戦略により高解像度画像のマスク最適化を可能にする。
さらに, マスクネットワークのトレーニングと解釈性を向上させるために, 数値塗布解器をネットワークに直接組み込む。
これにより、4k画像のマスクを0.6秒程度で生成でき、実際に関連する密度の確率的方法の品質を上回っている。
既存の一般的なアプローチと比較して、これは最大4桁の加速度である。
関連論文リスト
- You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - MP-Former: Mask-Piloted Transformer for Image Segmentation [16.620469868310288]
Mask2Formerはデコーダ層間の一貫性のないマスク予測に悩まされている。
本手法では,マスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスのマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスマスをマスマスマスマストした。
論文 参考訳(メタデータ) (2023-03-13T17:57:59Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - RePaint: Inpainting using Denoising Diffusion Probabilistic Models [161.74792336127345]
Free-form Inpaintingは任意のバイナリマスクで指定された領域のイメージに新しいコンテンツを追加するタスクである。
RePaint: A Denoising Probabilistic Model (DDPM) を用いた塗装手法を提案する。
本手法は,標準的なマスクと極端マスクを用いて,顔と汎用画像の塗装の両面で検証する。
論文 参考訳(メタデータ) (2022-01-24T18:40:15Z) - Learning Sparse Masks for Diffusion-based Image Inpainting [10.633099921979674]
拡散ベースの塗布はスパースデータから画像の再構成に強力なツールである。
我々は高効率な適応マスク生成モデルを提供する。
実験により,我々のモデルは最大4桁の加速度で競争品質を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-10-06T10:20:59Z) - Iterative Facial Image Inpainting using Cyclic Reverse Generator [0.913755431537592]
Cyclic Reverse Generator (CRG)アーキテクチャはエンコーダジェネレータモデルを提供する。
提案モデルを用いて実写画像を生成するには,数回の反復しか十分でないことを実証的に観察した。
本手法では,様々なマスクタイプを用いてスケッチベースのインペインティングを適用でき,多種多様な結果が得られる。
論文 参考訳(メタデータ) (2021-01-18T12:19:58Z) - DCT-Mask: Discrete Cosine Transform Mask Representation for Instance
Segmentation [50.70679435176346]
本稿では、離散コサイン変換(DCT)を用いて、高分解能二元格子マスクをコンパクトなベクトルに符号化することで、新しいマスク表現を提案する。
DCT-Maskと呼ばれるこの手法は、ほとんどのピクセルベースのインスタンスセグメンテーション手法に簡単に統合できる。
論文 参考訳(メタデータ) (2020-11-19T15:00:21Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - Fully Convolutional Networks for Automatically Generating Image Masks to
Train Mask R-CNN [4.901462756978097]
Mask R-CNN法は、これまでオブジェクト検出の最良の結果を達成するが、トレーニングのためにMaskを入手するには非常に時間がかかり、手間がかかる。
本稿では,最新のMask R-CNN深層学習のための画像マスク自動生成手法を提案する。
提案手法は,Mask R-CNNを訓練するために自動的に画像マスクを得ることができ,セグメント化における平均精度(mAP)の90%以上の精度で非常に高い分類精度を得ることができる。
論文 参考訳(メタデータ) (2020-03-03T08:09:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。