論文の概要: HALO: Human-Aligned End-to-end Image Retargeting with Layered Transformations
- arxiv url: http://arxiv.org/abs/2504.03026v1
- Date: Thu, 03 Apr 2025 20:53:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:48:26.638935
- Title: HALO: Human-Aligned End-to-end Image Retargeting with Layered Transformations
- Title(参考訳): HALO:階層化変換による人間指向のエンドツーエンドイメージリターゲティング
- Authors: Yiran Xu, Siqi Xie, Zhuofang Li, Harris Shadmany, Yinxiao Li, Luciano Sbaiz, Miaosen Wang, Junjie Ke, Jose Lezama, Hang Qi, Han Zhang, Jesse Berent, Ming-Hsuan Yang, Irfan Essa, Jia-Bin Huang, Feng Yang,
- Abstract要約: Imageは、画像のアスペクト比を変更しながら、その内容と構造を少ない視覚的アーティファクトで維持することを目的としている。
HALOは構造を水平層と非塩分層に分解し、異なる層に異なるラップフィールドを適用する。
本手法は,平均ベースラインよりも18.4%高いユーザ嗜好を達成している。
- 参考スコア(独自算出の注目度): 55.78224865743332
- License:
- Abstract: Image retargeting aims to change the aspect-ratio of an image while maintaining its content and structure with less visual artifacts. Existing methods still generate many artifacts or fail to maintain original content or structure. To address this, we introduce HALO, an end-to-end trainable solution for image retargeting. Since humans are more sensitive to distortions in salient areas than non-salient areas of an image, HALO decomposes the input image into salient/non-salient layers and applies different wrapping fields to different layers. To further minimize the structure distortion in the output images, we propose perceptual structure similarity loss which measures the structure similarity between input and output images and aligns with human perception. Both quantitative results and a user study on the RetargetMe dataset show that HALO achieves SOTA. Especially, our method achieves an 18.4% higher user preference compared to the baselines on average.
- Abstract(参考訳): 画像の再ターゲティングは、画像のアスペクト比を変更しながら、その内容と構造を少ない視覚的アーティファクトで維持することを目的としている。
既存のメソッドは依然として多くのアーティファクトを生成したり、オリジナルのコンテンツや構造を維持できない。
これを解決するために、画像再ターゲティングのためのエンドツーエンドのトレーニング可能なソリューションであるHALOを紹介する。
人間は画像の非塩分領域よりも塩分領域の歪みに敏感であるため、HALOは入力画像を塩分層と非塩分層に分解し、異なる層に異なる包装フィールドを適用する。
出力画像における構造歪みを最小化するため,入力画像と出力画像の間の構造類似度を測定し,人間の知覚と整合する知覚構造類似度損失を提案する。
RetargetMeデータセットの定量的結果とユーザスタディは、HALOがSOTAを達成することを示している。
特に,提案手法は,平均ベースラインよりも18.4%高いユーザ嗜好を達成している。
関連論文リスト
- Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.569646683579899]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:29:05Z) - SA-MixNet: Structure-aware Mixup and Invariance Learning for
Scribble-supervised Road Extraction in Remote Sensing Images [85.52629779976137]
複雑化の進んだ画像シーンを作成するために,ある画像から別の画像へ道路領域を貼り付ける構造を意識したミックスアップ方式を提案する。
道路構造を保ちながら接続性を高めるために,識別器に基づく正規化が設計されている。
われわれのフレームワークは、DeepGlobe、Wuhan、およびマサチューセッツのデータセット上で優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-03-03T02:56:43Z) - OAIR: Object-Aware Image Retargeting Using PSO and Aesthetic Quality
Assessment [11.031841470875571]
以前の画像手法は、アーチファクトや歪みに苦しむ出力を生成する。
前景と背景の同時リサイズは、オブジェクトのアスペクト比の変化を引き起こす。
これらの問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T07:16:59Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - The Spatially-Correlative Loss for Various Image Translation Tasks [69.62228639870114]
シーン構造の一貫性を保つために、シンプルで効率的かつ効果的な新しい空間相関損失を提案します。
以前の方法は、ピクセルレベルのサイクル一貫性または特徴レベルのマッチング損失を使用してこれを試みます。
I2I翻訳の3つのモードすべてにおいて,ベースラインモデルに対して,単一モーダル,マルチモーダル,さらには単一イメージ翻訳において,明確な改善が見られた。
論文 参考訳(メタデータ) (2021-04-02T02:13:30Z) - Image Inpainting with Learnable Feature Imputation [8.293345261434943]
正規畳み込み層は、未知の領域にフィルターを適用するのと同じ方法で、塗装された画像の視覚的アーティファクトを引き起こす。
本稿では,欠落した入力値の畳み込みに対する(階層的な)特徴計算を提案する。
我々はCelebA-HQとPlaces2を比較し,そのモデルを検証する。
論文 参考訳(メタデータ) (2020-11-02T16:05:32Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。