論文の概要: Image Composition Assessment with Saliency-augmented Multi-pattern
Pooling
- arxiv url: http://arxiv.org/abs/2104.03133v1
- Date: Wed, 7 Apr 2021 14:07:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:47:42.704940
- Title: Image Composition Assessment with Saliency-augmented Multi-pattern
Pooling
- Title(参考訳): 塩分増分多パターンプールによる画像合成評価
- Authors: Bo Zhang and Li Niu and Liqing Zhang
- Abstract要約: 我々は,複数のプロのレーダが提供した各画像のコンポジションスコアを用いて,最初のコンポジションアセスメントデータセットCADBをコントリビュートする。
さらに,新しいSaliency-Augmented Multi-pattern Pooling (SAMP)モジュールを用いた合成評価ネットワークSAMP-Netを提案する。
- 参考スコア(独自算出の注目度): 19.2097256920092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image composition assessment is crucial in aesthetic assessment, which aims
to assess the overall composition quality of a given image. However, to the
best of our knowledge, there is neither dataset nor method specifically
proposed for this task. In this paper, we contribute the first composition
assessment dataset CADB with composition scores for each image provided by
multiple professional raters. Besides, we propose a composition assessment
network SAMP-Net with a novel Saliency-Augmented Multi-pattern Pooling (SAMP)
module, which analyses visual layout from the perspectives of multiple
composition patterns. We also leverage composition-relevant attributes to
further boost the performance, and extend Earth Mover's Distance (EMD) loss to
weighted EMD loss to eliminate the content bias. The experimental results show
that our SAMP-Net can perform more favorably than previous aesthetic assessment
approaches and offer constructive composition suggestions.
- Abstract(参考訳): 画像構成評価は、画像全体の構成品質を評価することを目的とした美的評価において重要である。
しかしながら、私たちの知る限りでは、このタスクに特別に提案されたデータセットやメソッドはありません。
本稿では,複数のプロのレギュラーが提供した各画像のコンポジションスコアについて,最初のコンポジション評価データセットCADBに貢献する。
さらに,合成パターンの視点から視覚的レイアウトを解析する新しいSaliency-Augmented Multi-pattern Pooling (SAMP)モジュールを用いた合成評価ネットワークSAMP-Netを提案する。
また、合成関連属性を活用して性能をさらに向上させ、Earth Mover's Distance(EMD)損失を重み付きEMD損失に拡張し、コンテンツバイアスをなくす。
実験の結果,SAMP-Netは従来の審美的評価手法よりも好適に機能し,構成的構成を提案することができた。
関連論文リスト
- FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior [50.0535198082903]
我々は,複数の入力イメージを単一のコヒーレントなイメージに統合する,新しい画像合成手法を提案する。
本稿では, 大規模事前学習拡散モデルに内在する強力な生成的前駆体を利用して, 汎用画像合成を実現する可能性を示す。
論文 参考訳(メタデータ) (2024-07-06T03:35:43Z) - Enhancing Historical Image Retrieval with Compositional Cues [3.2276097734075426]
本稿では,この話題に計算美学,すなわち画像合成から重要な要素を紹介する。
CNNが抽出した合成関連情報を設計した検索モデルに明示的に統合することにより、画像の合成規則と意味情報の両方を考察する。
論文 参考訳(メタデータ) (2024-03-21T10:51:19Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - Dehazed Image Quality Evaluation: From Partial Discrepancy to Blind
Perception [35.257798506356814]
画像のデハジングは、ぼんやりとした画像から空間的詳細を復元することを目的としている。
本稿では,部分的不一致に基づく画像品質評価手法を提案する。
Blind Perceptionを用いたNo-Reference品質評価尺度に拡張する。
論文 参考訳(メタデータ) (2022-11-22T23:49:14Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z) - Blind Image Decomposition [53.760745569495825]
本稿では,Blind Image Decomposition (BID)について述べる。
雨のような重畳された画像を異なるソースコンポーネントに分解する方法は、現実世界の視覚システムにとって重要なステップだ。
本稿では,Blind Image Decomposition Network (BIDeN) を提案する。
論文 参考訳(メタデータ) (2021-08-25T17:37:19Z) - Large-Scale Attribute-Object Compositions [28.97267708915054]
本研究では,画像からの属性対象合成の予測方法の学習課題と,学習データから欠落した未知の合成への一般化について検討する。
私たちは、ハッシュタグを使ってInstagramの画像でフレームワークをトレーニングします。
我々は、ノイズの多いアノテーションや目に見えない合成を扱うために、データ収集とモデリングのために慎重に設計する。
論文 参考訳(メタデータ) (2021-05-24T16:05:41Z) - Adversarial Image Composition with Auxiliary Illumination [53.89445873577062]
本稿では,現実的な画像合成を実現するためのAIC-Netを提案する。
影の発生と前景の移動を両立させる新しい分岐生成機構を提案する。
歩行者と自動車のコンポジションタスクに関する実験により,提案したAIC-Netが優れたコンポジション性能を実現することを示す。
論文 参考訳(メタデータ) (2020-09-17T12:58:16Z) - Image Captioning with Compositional Neural Module Networks [18.27510863075184]
自然言語の合成性と順序性の両方を探求する画像キャプションのための階層的枠組みを導入する。
提案アルゴリズムは,入力画像で検出された各オブジェクトの特異な側面に対応する異なるモジュールに選択的に参加することで,詳細に富んだ文を構成することを学習する。
論文 参考訳(メタデータ) (2020-07-10T20:58:04Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。