論文の概要: Fast Soft Color Segmentation
- arxiv url: http://arxiv.org/abs/2004.08096v1
- Date: Fri, 17 Apr 2020 07:43:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:08:03.562888
- Title: Fast Soft Color Segmentation
- Title(参考訳): 高速ソフトカラーセグメンテーション
- Authors: Naofumi Akimoto, Huachun Zhu, Yanghua Jin, Yoshimitsu Aoki
- Abstract要約: 我々は、与えられた画像を複数のRGBA層に分解することを定義したソフトカラーセグメンテーションの問題に対処する。
本稿では,与えられた画像を複数の層に分割して1つのフォワードパスに分割するニューラルネットワークに基づく手法を提案する。
提案手法は,既存の反復的アプローチの推論速度の問題なく,有望な品質を実現する。
- 参考スコア(独自算出の注目度): 10.154836127889487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of soft color segmentation, defined as decomposing a
given image into several RGBA layers, each containing only homogeneous color
regions. The resulting layers from decomposition pave the way for applications
that benefit from layer-based editing, such as recoloring and compositing of
images and videos. The current state-of-the-art approach for this problem is
hindered by slow processing time due to its iterative nature, and consequently
does not scale to certain real-world scenarios. To address this issue, we
propose a neural network based method for this task that decomposes a given
image into multiple layers in a single forward pass. Furthermore, our method
separately decomposes the color layers and the alpha channel layers. By
leveraging a novel training objective, our method achieves proper assignment of
colors amongst layers. As a consequence, our method achieve promising quality
without existing issue of inference speed for iterative approaches. Our
thorough experimental analysis shows that our method produces qualitative and
quantitative results comparable to previous methods while achieving a 300,000x
speed improvement. Finally, we utilize our proposed method on several
applications, and demonstrate its speed advantage, especially in video editing.
- Abstract(参考訳): 本稿では,与えられた画像を複数のrgba層に分解し,それぞれに均質な色領域のみを含むソフトカラーセグメンテーションの問題に対処する。
分解によるレイヤは、イメージやビデオの再色や合成など、レイヤベースの編集の恩恵を受けるアプリケーションへの道を開くものだ。
この問題に対する現在の最先端のアプローチは、反復性によって処理時間が遅くなり、結果として特定の現実のシナリオにスケールしない。
この問題に対処するために、与えられた画像を複数の層に分割し、1つのフォワードパスで処理するニューラルネットワークベースの手法を提案する。
さらに,色層とαチャネル層を別々に分解する手法を提案する。
そこで本手法は,新しいトレーニング目標を生かして,層間の色を適切に割り当てることを実現する。
その結果,提案手法は既存の反復的アプローチの推論速度の問題なく,有望な品質を実現することができた。
本手法は,従来の手法に匹敵する質的,定量的な結果が得られ,30万倍の速度改善が得られた。
最後に,提案手法をいくつかのアプリケーションに応用し,特にビデオ編集においてその高速化を実証する。
関連論文リスト
- Efficient Diffusion Model for Image Restoration by Residual Shifting [63.02725947015132]
本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。
提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。
提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文 参考訳(メタデータ) (2024-03-12T05:06:07Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Stain-invariant self supervised learning for histopathology image
analysis [74.98663573628743]
乳がんのヘマトキシリンおよびエオシン染色像におけるいくつかの分類課題に対する自己監督アルゴリズムを提案する。
本手法は,いくつかの乳がんデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-11-14T18:16:36Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - Saliency Constrained Arbitrary Image Style Transfer using SIFT and DCNN [22.57205921266602]
一般的なニューラルスタイルの転送方法を使用する場合、スタイル画像のテクスチャや色は通常、コンテンツ画像に不完全に転送される。
本稿では,その効果を低減・回避するための新しいサリエンシ制約手法を提案する。
実験により、ソースイメージの正当性マップは正しいマッチングを見つけ出し、アーティファクトを避けるのに役立つことが示された。
論文 参考訳(メタデータ) (2022-01-14T09:00:55Z) - Temporally Consistent Video Colorization with Deep Feature Propagation
and Self-regularization Learning [90.38674162878496]
時間的に一貫した新しいビデオカラー化フレームワーク(TCVC)を提案する。
TCVCは、フレームレベルの深い特徴を双方向的に効果的に伝播し、色付けの時間的一貫性を高める。
実験により,本手法は視覚的に満足な色付きビデオを得るだけでなく,最先端の手法よりも時間的整合性が得られることが示された。
論文 参考訳(メタデータ) (2021-10-09T13:00:14Z) - TUCaN: Progressively Teaching Colourisation to Capsules [13.50327471049997]
TUCaN(Tiny UCapsNet)という新しいダウンサンプリングアップサンプリングアーキテクチャを提案する。
我々は,色を量化空間内のビンとして識別するピクセルごとの色分類タスクとして,この問題に対処する。
ネットワークをトレーニングするために、標準的なエンドツーエンド学習法とは対照的に、オブジェクトのコンテキストを抽出するプログレッシブラーニング方式を提案する。
論文 参考訳(メタデータ) (2021-06-29T08:44:15Z) - Fast, Self Supervised, Fully Convolutional Color Normalization of H&E
Stained Images [3.1329883315045106]
色の変化は、病理組織学における自動診断システムのためのディープラーニングベースのソリューションの展開に問題を引き起こす。
本稿では,自己教師付きトレーニングと推論において高速な色正規化手法を提案する。
本手法は,軽量な完全畳み込みニューラルネットワークをベースとして,深層学習に基づくパイプラインに前処理ブロックとして容易に取り付けることができる。
論文 参考訳(メタデータ) (2020-11-30T17:05:58Z) - Deep Image Compositing [93.75358242750752]
ユーザ入力なしで高品質の画像合成を自動生成する手法を提案する。
ラプラシアン・ピラミッド・ブレンディングにインスパイアされ、フォアグラウンドや背景画像からの情報を効果的に融合させるために、密結合型多ストリーム融合ネットワークが提案されている。
実験により,提案手法は高品質な合成物を自動生成し,定性的かつ定量的に既存手法より優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-11-04T06:12:24Z) - Fast Multi-Level Foreground Estimation [0.4588028371034407]
得られたアルファマットは、合成画像の色にどれだけの額のフォアグラウンドと背景色が寄与するかをピクセル単位で記述する。
文献のほとんどの方法はアルファマットの推定に重点を置いているが、入力された画像とそのアルファマットが与えられた前景の色を推定する過程は無視されることが多い。
アルファマットを用いた前景推定手法を提案する。
論文 参考訳(メタデータ) (2020-06-26T13:16:13Z) - Instance-aware Image Colorization [51.12040118366072]
本稿では,インスタンス認識のカラー化を実現する手法を提案する。
我々のネットワークアーキテクチャは、市販のオブジェクト検出器を利用して、収穫されたオブジェクト画像を取得する。
類似したネットワークを用いて、フルイメージの特徴を抽出し、融合モジュールを適用して最終色を予測する。
論文 参考訳(メタデータ) (2020-05-21T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。