論文の概要: Realistic Saliency Guided Image Enhancement
- arxiv url: http://arxiv.org/abs/2306.06092v1
- Date: Fri, 9 Jun 2023 17:52:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 12:02:29.119211
- Title: Realistic Saliency Guided Image Enhancement
- Title(参考訳): 写実的救世主誘導画像強調
- Authors: S. Mahdi H. Miangoleh and Zoya Bylinskii and Eric Kee and Eli
Shechtman and Ya\u{g}{\i}z Aksoy
- Abstract要約: プロの写真家が行う一般的な編集作業には、邪魔な要素の強調や主題の強化が含まれる。
本稿では,様々なイメージタイプにまたがって高いリアリズムを維持するために,サリエンシ誘導画像強調のためのリアリズム損失を提案する。
私たちは、メモリフットプリントとランタイムを小さくしながら、自分たちのデータセットに対する最近のアプローチより優れています。
- 参考スコア(独自算出の注目度): 32.446298454642985
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Common editing operations performed by professional photographers include the
cleanup operations: de-emphasizing distracting elements and enhancing subjects.
These edits are challenging, requiring a delicate balance between manipulating
the viewer's attention while maintaining photo realism. While recent approaches
can boast successful examples of attention attenuation or amplification, most
of them also suffer from frequent unrealistic edits. We propose a realism loss
for saliency-guided image enhancement to maintain high realism across varying
image types, while attenuating distractors and amplifying objects of interest.
Evaluations with professional photographers confirm that we achieve the dual
objective of realism and effectiveness, and outperform the recent approaches on
their own datasets, while requiring a smaller memory footprint and runtime. We
thus offer a viable solution for automating image enhancement and photo cleanup
operations.
- Abstract(参考訳): プロの写真家が行う編集作業には、注意をそらす要素の強調や被写体の拡張といったクリーンアップ操作がある。
これらの編集は困難であり、写真リアリズムを維持しながら視聴者の注意を操るには微妙なバランスが必要となる。
最近のアプローチは、注意の減衰や増幅の成功例を誇示するが、そのほとんどは、しばしば非現実的な編集に苦しむ。
本研究では,様々なイメージタイプにまたがって高いリアリズムを維持しつつ,関心の対象を拡大しつつ,サリエンシ誘導画像強調のためのリアリズム損失を提案する。
プロの写真家による評価では、リアリズムと有効性の2つの目標を達成し、メモリフットプリントとランタイムを小さくしながら、自身のデータセットでの最近のアプローチを上回っています。
したがって,画像強調と写真のクリーンアップ操作を自動化するための有効なソリューションを提供する。
関連論文リスト
- Training-Free Consistency Pipeline for Fashion Repose [9.61065600471628]
FashionReposeは、非厳格なポーズ編集のためのトレーニング不要のパイプラインである。
オフザシェルフモデルを統合して、長袖服のポーズを調整し、アイデンティティとブランディングの属性を維持する。
FashionReposeは、ゼロショットのアプローチを使用して、これらの編集をほぼリアルタイムで実行し、特別なトレーニングを不要にする。
論文 参考訳(メタデータ) (2025-01-23T14:17:01Z) - ExpRDiff: Short-exposure Guided Diffusion Model for Realistic Local Motion Deblurring [61.82010103478833]
そこで本稿では,コンテキストベースの局所的ぼかし検出モジュールを開発し,さらにコンテキスト情報を加えて,ぼかし領域の識別を改善する。
最新のスマートフォンには、短時間露光画像を提供するカメラが備わっていることを考慮し、ぼやけたガイド付き画像復元法を開発した。
上記のコンポーネントを ExpRDiff という名前のシンプルで効果的なネットワークに定式化します。
論文 参考訳(メタデータ) (2024-12-12T11:42:39Z) - INRetouch: Context Aware Implicit Neural Representation for Photography Retouching [54.17599183365242]
本稿では、プロの編集から前後のイメージペアを通して学習する新しいリタッチ転送手法を提案する。
我々は,画像の内容とコンテキストに基づいて,適応的に編集を適用することを学習する文脈認識型インプシットニューラル表現を開発した。
提案手法は,写真再構成における既存の手法を超越するだけでなく,画像再構成タスクの性能向上にも寄与する。
論文 参考訳(メタデータ) (2024-12-05T03:31:48Z) - DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Streamlining Image Editing with Layered Diffusion Brushes [8.738398948669609]
我々のシステムは、ハイエンドの消費者向けGPUを使用して、140ミリ秒以内の512x512画像に1回の編集を行う。
提案手法は,オブジェクト属性の調整,エラー訂正,逐次的なプロンプトベースのオブジェクト配置と操作など,さまざまなタスクに対して有効性を示す。
論文 参考訳(メタデータ) (2024-05-01T04:30:03Z) - Recovering Continuous Scene Dynamics from A Single Blurry Image with
Events [58.7185835546638]
インプリシットビデオ関数(IVF)は、同時イベントを伴う単一の動きのぼやけた画像を表現する。
両モードの利点を効果的に活用するために、二重注意変換器を提案する。
提案するネットワークは,限られた参照タイムスタンプの地平線画像の監督のみで訓練される。
論文 参考訳(メタデータ) (2023-04-05T18:44:17Z) - Perceptual Image Enhancement for Smartphone Real-Time Applications [60.45737626529091]
本稿では,知覚的画像強調のための軽量ネットワークLPIENetを提案する。
我々のモデルは、ノイズアーティファクト、回折アーティファクト、ぼかし、HDR過剰露光を扱うことができる。
我々のモデルは、中級商用スマートフォンで1秒未満で2K解像度画像を処理することができる。
論文 参考訳(メタデータ) (2022-10-24T19:16:33Z) - Enjoy Your Editing: Controllable GANs for Image Editing via Latent Space
Navigation [136.53288628437355]
コントロール可能なセマンティックイメージ編集により、ユーザーはクリック数回で画像属性全体を変更できる。
現在のアプローチでは、絡み合った属性編集、グローバルなイメージアイデンティティの変更、フォトリアリズムの低下に悩まされることが多い。
本稿では,主に定性評価に焦点を当てた先行研究とは異なり,制御可能な編集性能を測定するための定量的評価手法を提案する。
論文 参考訳(メタデータ) (2021-02-01T21:38:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。