論文の概要: Hierarchical Image Peeling: A Flexible Scale-space Filtering Framework
- arxiv url: http://arxiv.org/abs/2104.01534v1
- Date: Sun, 4 Apr 2021 04:08:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:36:32.709286
- Title: Hierarchical Image Peeling: A Flexible Scale-space Filtering Framework
- Title(参考訳): 階層的イメージピーリング:柔軟なスケールスペースフィルタリングフレームワーク
- Authors: Fu Yuanbin and Guoxiaojie and Hu Qiming and Lin Di and Ma Jiayi and
Ling Haibin
- Abstract要約: 階層的なイメージ組織は、コンピュータビジョンとグラフィックスの幅広いアプリケーションで目撃されています。
この研究は、画像をスケール空間の観点から導出した信号の族に分解する近代的な枠組みを設計する。
コンパクトなリカレントネットワーク、すなわち階層的画像剥離網をカスタマイズして効率良く効果的にタスクを遂行する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The importance of hierarchical image organization has been witnessed by a
wide spectrum of applications in computer vision and graphics. Different from
image segmentation with the spatial whole-part consideration, this work designs
a modern framework for disassembling an image into a family of derived signals
from a scale-space perspective. Specifically, we first offer a formal
definition of image disassembly. Then, by concerning desired properties, such
as peeling hierarchy and structure preservation, we convert the original
complex problem into a series of two-component separation sub-problems,
significantly reducing the complexity. The proposed framework is flexible to
both supervised and unsupervised settings. A compact recurrent network, namely
hierarchical image peeling net, is customized to efficiently and effectively
fulfill the task, which is about 3.5Mb in size, and can handle 1080p images in
more than 60 fps per recurrence on a GTX 2080Ti GPU, making it attractive for
practical use. Both theoretical findings and experimental results are provided
to demonstrate the efficacy of the proposed framework, reveal its superiority
over other state-of-the-art alternatives, and show its potential to various
applicable scenarios. Our code is available at
\url{https://github.com/ForawardStar/HIPe}.
- Abstract(参考訳): 階層的なイメージ組織の重要性は、コンピュータビジョンとグラフィックスにおける幅広い応用によって見られている。
空間的全体を考慮した画像分割とは異なり、この研究は、画像をスケール空間の観点から派生した信号の族に分解する近代的な枠組みを設計する。
具体的には、まず最初に、画像分解の正式な定義を提供する。
そして, 階層の剥がしや構造保存などの望ましい特性を考慮し, 元の複雑な問題を2成分分離部分問題に変換し, 複雑さを著しく低減する。
提案されたフレームワークは、教師なし設定と教師なし設定の両方に柔軟である。
gtx2080tigpu上で1回60fps以上で1080pの画像を処理でき、実用的にも魅力的である。
提案手法の有効性を実証し、他の最先端の選択肢よりも優位性を示し、様々なシナリオに適用可能な可能性を示すため、理論的研究結果と実験結果の両方が提供される。
私たちのコードは \url{https://github.com/ForawardStar/HIPe} で利用可能です。
関連論文リスト
- Mixed Hierarchy Network for Image Restoration [0.0]
画像復元における品質とシステムの複雑さのバランスをとることができる混合階層ネットワークを提案する。
我々のモデルはまずエンコーダ・デコーダアーキテクチャを用いて文脈情報を学習し,次に空間的詳細を保存する高分解能分岐と組み合わせる。
その結果、MHNetという名前の密接な相互接続階層アーキテクチャは、いくつかのイメージ復元タスクにおいて、強力なパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2023-02-19T12:18:45Z) - High-Quality Pluralistic Image Completion via Code Shared VQGAN [51.7805154545948]
高速な推論速度で高品質と多様性を両立させることができる多元画像補完のための新しい枠組みを提案する。
我々のフレームワークは、セマンティックにリッチな離散的なコードを効率的かつ堅牢に学習することができ、画像再構成の品質が大幅に向上する。
論文 参考訳(メタデータ) (2022-04-05T01:47:35Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - Leveraging Image Complexity in Macro-Level Neural Network Design for
Medical Image Segmentation [3.974175960216864]
画像の複雑さは、与えられたデータセットに最適なものを選択するためのガイドラインとして利用できることを示す。
高複雑性データセットの場合、元のイメージ上で実行される浅いネットワークは、ダウンサンプリングされたイメージ上で実行されるディープネットワークよりもセグメンテーション結果が優れている可能性がある。
論文 参考訳(メタデータ) (2021-12-21T09:49:47Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Generating Diverse Structure for Image Inpainting With Hierarchical
VQ-VAE [74.29384873537587]
本稿では,異なる構造を持つ複数の粗い結果を第1段階で生成し,第2段階ではテクスチャを増補して各粗い結果を別々に洗練する,多彩な塗布用2段階モデルを提案する。
CelebA-HQ, Places2, ImageNetデータセットによる実験結果から,本手法は塗布ソリューションの多様性を向上するだけでなく,生成した複数の画像の視覚的品質も向上することが示された。
論文 参考訳(メタデータ) (2021-03-18T05:10:49Z) - Searching for Controllable Image Restoration Networks [57.23583915884236]
既存の方法は各出力毎にネットワーク全体を通して別々の推論を必要とする。
本稿では,複数の画像効果を効率的に生成できるニューラルアーキテクチャ探索手法に基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-21T10:08:18Z) - Conceptual Compression via Deep Structure and Texture Synthesis [42.68994438290913]
本稿では,視覚データをコンパクトな構造とテクスチャ表現にエンコードし,深層合成方式でデコードする,新しい概念圧縮フレームワークを提案する。
特に,2つの相補的な視覚特徴からなる二重層モデルを用いて画像の圧縮を提案する。
エンコーダ側では、構造地図とテクスチャ表現を個別に抽出して圧縮し、コンパクトで解釈可能な、相互運用可能なビットストリームを生成する。
復号段階では, 階層的融合GAN (HF-GAN) が提案され, テクスチャがデコードされた構造写像に描画される合成パラダイムを学習し, 高品質な再構成を実現する。
論文 参考訳(メタデータ) (2020-11-10T08:48:32Z) - TSIT: A Simple and Versatile Framework for Image-to-Image Translation [103.92203013154403]
画像間翻訳のためのシンプルで多用途なフレームワークを提案する。
新たに提案した特徴変換を用いた2ストリーム生成モデルを提案する。
これにより、マルチスケールのセマンティック構造情報とスタイル表現を効果的に捕捉し、ネットワークに融合させることができる。
体系的な研究は、提案手法をいくつかの最先端タスク固有のベースラインと比較し、知覚的品質と定量的評価の両面での有効性を検証する。
論文 参考訳(メタデータ) (2020-07-23T15:34:06Z) - Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting [12.839962012888199]
そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
論文 参考訳(メタデータ) (2020-05-19T18:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。