論文の概要: OAIR: Object-Aware Image Retargeting Using PSO and Aesthetic Quality
Assessment
- arxiv url: http://arxiv.org/abs/2209.04804v1
- Date: Sun, 11 Sep 2022 07:16:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 13:13:45.105425
- Title: OAIR: Object-Aware Image Retargeting Using PSO and Aesthetic Quality
Assessment
- Title(参考訳): OAIR: PSOによるオブジェクト認識画像の再ターゲティングと審美的品質評価
- Authors: Mohammad Reza Naderi, Mohammad Hossein Givkashi, Nader Karimi, Shahram
Shirani, Shadrokh Samavi
- Abstract要約: 以前の画像手法は、アーチファクトや歪みに苦しむ出力を生成する。
前景と背景の同時リサイズは、オブジェクトのアスペクト比の変化を引き起こす。
これらの問題を克服する手法を提案する。
- 参考スコア(独自算出の注目度): 11.031841470875571
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image retargeting aims at altering an image size while preserving important
content and minimizing noticeable distortions. However, previous image
retargeting methods create outputs that suffer from artifacts and distortions.
Besides, most previous works attempt to retarget the background and foreground
of the input image simultaneously. Simultaneous resizing of the foreground and
background causes changes in the aspect ratios of the objects. The change in
the aspect ratio is specifically not desirable for human objects. We propose a
retargeting method that overcomes these problems. The proposed approach
consists of the following steps. Firstly, an inpainting method uses the input
image and the binary mask of foreground objects to produce a background image
without any foreground objects. Secondly, the seam carving method resizes the
background image to the target size. Then, a super-resolution method increases
the input image quality, and we then extract the foreground objects. Finally,
the retargeted background and the extracted super-resolued objects are fed into
a particle swarm optimization algorithm (PSO). The PSO algorithm uses aesthetic
quality assessment as its objective function to identify the best location and
size for the objects to be placed in the background. We used image quality
assessment and aesthetic quality assessment measures to show our superior
results compared to popular image retargeting techniques.
- Abstract(参考訳): 画像再ターゲティングは、重要なコンテンツを保持しながら画像サイズを変え、目に見える歪みを最小化することを目的としている。
しかし、以前の画像再ターゲティング手法は、アーティファクトや歪みに苦しむ出力を生成する。
さらに、以前のほとんどの作業は、入力画像の背景と前景を同時に再ターゲットしようとする。
前景と背景を同時にリサイズすると、オブジェクトのアスペクト比が変化します。
アスペクト比の変化は、特に人間のオブジェクトには望ましくない。
これらの問題を克服する再ターゲティング手法を提案する。
提案手法は以下のステップからなる。
まず、塗装方法は、フォアグラウンドオブジェクトの入力画像とバイナリマスクを使用して、フォアグラウンドオブジェクトなしで背景画像を生成する。
第2に、シーム彫り法は、背景画像を目標サイズにリサイズする。
そして,超解像法により入力画像の品質が向上し,前景オブジェクトを抽出する。
最後に、再ターゲットされた背景と抽出した超解像を粒子群最適化アルゴリズム(PSO)に入力する。
PSOアルゴリズムは、美的品質評価を目的関数として使用し、対象物が背景に配置される最適な位置と大きさを特定する。
画像品質評価と美的品質評価を用いて,画像再ターゲティング技術よりも優れた結果を示した。
関連論文リスト
- Prune and Repaint: Content-Aware Image Retargeting for any Ratio [8.665919238538143]
本稿では,キーセマンティクスの保存と画質のバランスをとるために,PruneRepaintというコンテンツ認識手法を提案する。
前景の内容と構造に焦点を合わせることで、PruneRepaintアプローチは、キーコンテンツ損失と変形を適応的に回避する。
論文 参考訳(メタデータ) (2024-10-30T10:02:42Z) - DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Diff-DOPE: Differentiable Deep Object Pose Estimation [29.703385848843414]
Diff-DOPE, 画像入力を行う6-DoFポーズ精細機, オブジェクトの3次元テクスチャモデル, オブジェクトの初期ポーズを紹介する。
この方法は、画像とモデルの投影の間の視覚的エラーを最小限に抑えるために、オブジェクトのポーズを更新するために微分可能なレンダリングを使用する。
このシンプルで効果的なアイデアは、ポーズ推定データセットで最先端の結果を得ることができることを示す。
論文 参考訳(メタデータ) (2023-09-30T18:52:57Z) - Supervised Deep Learning for Content-Aware Image Retargeting with
Fourier Convolutions [11.031841470875571]
画像は、コンテンツに注意して画像のサイズを変更することを目的としている。
ラベル付きデータセットは、イメージタスクでディープラーニングモデルのトレーニングには使用できない。
通常の畳み込みニューラルネットワークは、推論時間で異なるサイズの画像を生成することができない。
論文 参考訳(メタデータ) (2023-06-12T19:17:44Z) - Background Prompting for Improved Object Depth [70.25467510077706]
単一の画像からオブジェクトの深さを推定することは、多くのビジョン、ロボティクス、グラフィックアプリケーションにとって貴重なタスクである。
本稿では,入力対象画像を学習背景に適応させる,シンプルで効果的なバックグラウンドプロンプティング手法を提案する。
複数の合成および実データセットの結果は、既存の様々な深度ネットワークに対して、実際の物体深度を一貫した改善を示す。
論文 参考訳(メタデータ) (2023-06-08T17:59:59Z) - Self-Supervised Video Object Segmentation via Cutout Prediction and
Tagging [117.73967303377381]
本稿では, 自己教師型ビデオオブジェクト(VOS)アプローチを提案する。
本手法は,対象情報と背景情報の両方を考慮した識別学習損失の定式化に基づく。
提案手法であるCT-VOSは, DAVIS-2017 と Youtube-VOS の2つの挑戦的なベンチマークにおいて,最先端の結果を達成している。
論文 参考訳(メタデータ) (2022-04-22T17:53:27Z) - Fast Hybrid Image Retargeting [0.0]
本稿では,コンテント・アウェア・トリミングを用いて歪みを定量化し,抑制する手法を提案する。
我々の手法は,実行時間のごく一部で実行しながら,最近の手法より優れています。
論文 参考訳(メタデータ) (2022-03-25T11:46:06Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - High-Resolution Image Inpainting with Iterative Confidence Feedback and
Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。
本稿では,フィードバック機構を備えた反復インペイント手法を提案する。
実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-24T13:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。