論文の概要: M2-Net: Multi-stages Specular Highlight Detection and Removal in
Multi-scenes
- arxiv url: http://arxiv.org/abs/2207.09965v1
- Date: Wed, 20 Jul 2022 15:18:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 13:48:00.336481
- Title: M2-Net: Multi-stages Specular Highlight Detection and Removal in
Multi-scenes
- Title(参考訳): M2-Net:マルチステージ光検出・除去
- Authors: Zhaoyangfan Huang and Kun Hu and Xingjun Wang
- Abstract要約: フレームワークは3つの主要コンポーネント、ハイライト機能抽出モジュール、ハイライト粗い除去モジュール、ハイライト精細化モジュールで構成されている。
提案アルゴリズムは,ビデオハイライト除去において,有望な結果とともに初めて適用された。
- 参考スコア(独自算出の注目度): 3.312427167335527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel uniformity framework for highlight
detection and removal in multi-scenes, including synthetic images, face images,
natural images, and text images. The framework consists of three main
components, highlight feature extractor module, highlight coarse removal
module, and highlight refine removal module. Firstly, the highlight feature
extractor module can directly separate the highlight feature and non-highlight
feature from the original highlight image. Then highlight removal image is
obtained using a coarse highlight removal network. To further improve the
highlight removal effect, the refined highlight removal image is finally
obtained using refine highlight removal module based on contextual highlight
attention mechanisms. Extensive experimental results in multiple scenes
indicate that the proposed framework can obtain excellent visual effects of
highlight removal and achieve state-of-the-art results in several quantitative
evaluation metrics. Our algorithm is applied for the first time in video
highlight removal with promising results.
- Abstract(参考訳): 本稿では, 合成画像, 顔画像, 自然画像, テキスト画像など, 複数シーンにおけるハイライト検出・削除のための一様性フレームワークを提案する。
フレームワークは3つの主要コンポーネント、ハイライト機能抽出モジュール、ハイライト粗い除去モジュール、ハイライト精細化モジュールで構成されている。
まず、highlight feature extractorモジュールは、highlight featureとnon-highlight featureを元のhighlight imageと直接分離することができる。
そして、粗いハイライト除去ネットワークを用いてハイライト除去画像を得る。
強調強調除去効果をさらに向上するため、文脈的ハイライト強調機構に基づく精細ハイライト除去モジュールを用いて、精細ハイライト除去画像を得る。
複数の場面における大規模な実験結果から,提案手法はハイライト除去の優れた視覚効果を得られ,いくつかの定量的評価指標で最先端の結果が得られることが示唆された。
提案アルゴリズムは,ビデオハイライト除去において,有望な結果とともに初めて適用された。
関連論文リスト
- Extract-and-Abstract: Unifying Extractive and Abstractive Summarization within Single Encoder-Decoder Framework [24.97672212363703]
本稿では,単一エンコーダ-デコーダモデルにおいて,抽出および抽象的要約タスクを協調的かつシームレスに実行するExtAbsを提案する。
ExtAbsでは、バニラエンコーダを増設して塩分を抽出し、バニラデコーダを提案された塩分マスクで修正してサマリーを生成する。
実験により、ExtAbsは抽出タスクのベースラインよりも優れたパフォーマンスを達成でき、抽象タスクのバニラモデルよりも同等か、さらに優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-18T09:21:25Z) - VIP: Versatile Image Outpainting Empowered by Multimodal Large Language Model [76.02314305164595]
本研究は,ユーザの要求に応じて結果のカスタマイズが可能な,新たな画像出力フレームワークを提案する。
画像のマスキング部分とマスキング部分のテキスト記述を自動的に抽出し整理するマルチモーダル大言語モデル(MLLM)を利用する。
さらに、画像の特定の空間領域とテキストプロンプトの対応する部分との相互作用を強化するために、特別にCentral-Total-Surrounding (CTS) と呼ばれるCentral-Attentionモジュールが精巧に設計されている。
論文 参考訳(メタデータ) (2024-06-03T07:14:19Z) - Towards High-Quality Specular Highlight Removal by Leveraging
Large-Scale Synthetic Data [45.30068102110486]
本稿では,1つのオブジェクトレベルの画像から特異なハイライトを取り除くことを目的とする。
そこで本研究では,これらに対処するための3段階ネットワークを提案する。
オブジェクトレベルの画像の大規模な合成データセットを提案する。
論文 参考訳(メタデータ) (2023-09-12T15:10:23Z) - SimpSON: Simplifying Photo Cleanup with Single-Click Distracting Object
Segmentation Network [70.89436857471887]
ワンクリックでタスクを遂行するために最適化された対話型トラクタ選択法を提案する。
本手法は従来の単視分割法により達成された精度とリコールを超越した手法である。
実験により, 未知の物体を対話的に, グループで効果的に, 正確に識別できることが実証された。
論文 参考訳(メタデータ) (2023-05-28T04:05:24Z) - Good Visual Guidance Makes A Better Extractor: Hierarchical Visual
Prefix for Multimodal Entity and Relation Extraction [88.6585431949086]
本稿では,視覚的な実体と関係抽出のための階層型ビジュアルプレフィックス融合NeTwork(HVPNeT)を提案する。
視覚的表現をプラグ可能な視覚的接頭辞とみなして, 誤りに敏感な予測決定のためのテキスト的表現を導出する。
3つのベンチマークデータセットの実験により,本手法の有効性が実証され,最先端の性能が得られた。
論文 参考訳(メタデータ) (2022-05-07T02:10:55Z) - Two-stage Visual Cues Enhancement Network for Referring Image
Segmentation [89.49412325699537]
Referring Image (RIS)は、ある自然言語表現によって参照される画像から対象のオブジェクトをセグメント化することを目的としている。
本稿では,2段階のビジュアルキュー拡張ネットワーク(TV-Net)を考案し,この問題に対処する。
この2段階の強化により,提案するTV-Netは,自然言語表現と画像間のきめ細かいマッチング動作の学習において,より優れた性能を享受できる。
論文 参考訳(メタデータ) (2021-10-09T02:53:39Z) - Text-Aware Single Image Specular Highlight Removal [14.624958411229862]
既存の手法では、医用画像や特定対象画像のハイライトを除去するが、テキストで画像を扱うことはできない。
本稿ではまず,テキスト認識による単一画像のハイライト除去問題について検討する。
中心となる目標は、テキスト画像からハイライトを取り除き、テキストの検出と認識の精度を向上させることである。
論文 参考訳(メタデータ) (2021-08-16T03:51:53Z) - Disassembling Object Representations without Labels [75.2215716328001]
本研究では,オブジェクト表現を分解する新しい表現学習タスクについて検討する。
分解は、学習した表現におけるカテゴリ固有のモジュラリティを可能にする。
我々は、非教師なし分解オブジェクト表現(UDOR)という、非教師なしの非教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-03T08:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。