論文の概要: Image Aesthetics Assessment Using Graph Attention Network
- arxiv url: http://arxiv.org/abs/2206.12869v2
- Date: Tue, 28 Jun 2022 08:28:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-03 01:47:13.644589
- Title: Image Aesthetics Assessment Using Graph Attention Network
- Title(参考訳): グラフ注意ネットワークを用いた画像美学評価
- Authors: Koustav Ghosal, Aljosa Smolic
- Abstract要約: 画像美学評価のためのグラフニューラルネットワークに基づく2段階のフレームワークを提案する。
まず、入力画像がグラフとしてモデル化され、元のアスペクト比と解像度を維持する特徴グラフ表現を提案する。
次に,この特徴グラフを用いて,視覚的注意を用いて入力画像の異なる領域間の意味的関係をキャプチャするグラフニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 17.277954886018353
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aspect ratio and spatial layout are two of the principal factors determining
the aesthetic value of a photograph. But, incorporating these into the
traditional convolution-based frameworks for the task of image aesthetics
assessment is problematic. The aspect ratio of the photographs gets distorted
while they are resized/cropped to a fixed dimension to facilitate training
batch sampling. On the other hand, the convolutional filters process
information locally and are limited in their ability to model the global
spatial layout of a photograph. In this work, we present a two-stage framework
based on graph neural networks and address both these problems jointly. First,
we propose a feature-graph representation in which the input image is modelled
as a graph, maintaining its original aspect ratio and resolution. Second, we
propose a graph neural network architecture that takes this feature-graph and
captures the semantic relationship between the different regions of the input
image using visual attention. Our experiments show that the proposed framework
advances the state-of-the-art results in aesthetic score regression on the
Aesthetic Visual Analysis (AVA) benchmark.
- Abstract(参考訳): アスペクト比と空間配置は、写真の美的価値を決定する主要な要因の2つである。
しかし、これらを画像美学評価のための従来の畳み込みベースのフレームワークに組み込むことは問題となる。
画像のアスペクト比は、バッチサンプリングのトレーニングを容易にするために、サイズ/クロッピングを一定次元に再構成するときに歪む。
一方、畳み込みフィルタは局所的に情報を処理し、写真のグローバルな空間配置をモデル化する能力に制限がある。
本稿では,グラフニューラルネットワークに基づく2段階フレームワークを提案し,これら2つの課題を共同で解決する。
まず,入力画像をグラフとしてモデル化し,元のアスペクト比と解像度を維持した特徴グラフ表現を提案する。
次に,この特徴グラフを用いて,視覚的注意を用いて入力画像の異なる領域間の意味的関係をキャプチャするグラフニューラルネットワークアーキテクチャを提案する。
実験の結果,提案手法は,AVA(Aesthetic Visual Analysis)ベンチマークにおいて,美的スコアのレグレッションを向上することが示された。
関連論文リスト
- Cross-Image Attention for Zero-Shot Appearance Transfer [68.43651329067393]
画像間の意味的対応を暗黙的に確立するクロスイメージアテンション機構を導入する。
ノイズの多い潜在コードを操作する3つのメカニズムと、デノナイジングプロセスを通してモデルの内部表現を利用する。
実験により,本手法は多種多様な対象カテゴリに対して有効であり,形状,大きさ,視点の変動に頑健であることが示された。
論文 参考訳(メタデータ) (2023-11-06T18:33:24Z) - Cross-view Self-localization from Synthesized Scene-graphs [1.9580473532948401]
クロスビューの自己ローカライゼーションは、スパース視点からデータベースイメージを提供する視覚的場所認識の難解なシナリオである。
生画像から計算したビュー不変外観特徴と合成画像から計算したビュー依存空間意味特徴の利点を組み合わせたハイブリッドシーンモデルを提案する。
論文 参考訳(メタデータ) (2023-10-24T04:16:27Z) - HandNeRF: Neural Radiance Fields for Animatable Interacting Hands [122.32855646927013]
神経放射場(NeRF)を用いて手の動きを正確に再現する新しい枠組みを提案する。
我々は,提案するHandNeRFのメリットを検証するための広範囲な実験を行い,その成果を報告する。
論文 参考訳(メタデータ) (2023-03-24T06:19:19Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Image Keypoint Matching using Graph Neural Networks [22.33342295278866]
画像マッチング問題に対するグラフニューラルネットワークを提案する。
提案手法はまず,局所化ノード埋め込みを用いてキーポイント間の初期ソフト対応を生成する。
提案手法は,キーポイントアノテーションを用いた自然な画像データセット上で評価し,最先端のモデルと比較して,予測精度を犠牲にすることなく推論時間を高速化することを示す。
論文 参考訳(メタデータ) (2022-05-27T23:38:44Z) - Graph Representation Learning for Spatial Image Steganalysis [11.358487655918678]
空間画像ステガナリシスのためのグラフ表現学習アーキテクチャを提案する。
詳細なアーキテクチャでは、各画像をグラフに変換し、ノードは画像のパッチを表し、エッジはパッチ間の局所的な関連を示す。
注意ネットワークにグラフを供給することにより、効率的なステガナリシスのための識別的特徴を学習することができる。
論文 参考訳(メタデータ) (2021-10-03T09:09:08Z) - VisGraphNet: a complex network interpretation of convolutional neural
features [6.50413414010073]
ニューラルネットワークの特徴マップをモデル化するための可視性グラフの提案と検討を行う。
この研究は、元のデータよりもこれらのグラフによって提供される別の視点によって動機付けられている。
論文 参考訳(メタデータ) (2021-08-27T20:21:04Z) - Gigapixel Histopathological Image Analysis using Attention-based Neural
Networks [7.1715252990097325]
圧縮経路と学習経路からなるCNN構造を提案する。
本手法は,グローバル情報とローカル情報の両方を統合し,入力画像のサイズに関して柔軟であり,弱い画像レベルラベルのみを必要とする。
論文 参考訳(メタデータ) (2021-01-25T10:18:52Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。