論文の概要: CuratorNet: Visually-aware Recommendation of Art Images
- arxiv url: http://arxiv.org/abs/2009.04426v2
- Date: Wed, 30 Sep 2020 12:35:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 12:04:59.446662
- Title: CuratorNet: Visually-aware Recommendation of Art Images
- Title(参考訳): curatornet:アートイメージの視覚的なレコメンデーション
- Authors: Pablo Messina, Manuel Cartagena, Patricio Cerda-Mardini, Felipe del
Rio and Denis Parra
- Abstract要約: CuratorNetは、アートイメージを視覚的に認識するためのニューラルネットワークアーキテクチャである。
ネットワークにはパラメータの固定セットがあり、一度だけトレーニングする必要がある。
現状のVBPRなど,いくつかのベースラインにおいて,CuratorNetが最高のパフォーマンスを実現していることを示す。
- 参考スコア(独自算出の注目度): 1.7219362335740878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although there are several visually-aware recommendation models in domains
like fashion or even movies, the art domain lacks thesame level of research
attention, despite the recent growth of the online artwork market. To reduce
this gap, in this article we introduceCuratorNet, a neural network architecture
for visually-aware recommendation of art images. CuratorNet is designed at the
core withthe goal of maximizing generalization: the network has a fixed set of
parameters that only need to be trained once, and thereafter themodel is able
to generalize to new users or items never seen before, without further
training. This is achieved by leveraging visualcontent: items are mapped to
item vectors through visual embeddings, and users are mapped to user vectors by
aggregating the visualcontent of items they have consumed. Besides the model
architecture, we also introduce novel triplet sampling strategies to build
atraining set for rank learning in the art domain, resulting in more effective
learning than naive random sampling. With an evaluationover a real-world
dataset of physical paintings, we show that CuratorNet achieves the best
performance among several baselines,including the state-of-the-art model VBPR.
CuratorNet is motivated and evaluated in the art domain, but its architecture
and trainingscheme could be adapted to recommend images in other areas
- Abstract(参考訳): ファッションや映画のようなドメインには視覚的に認識されるレコメンデーションモデルがいくつかあるが、オンラインアート市場が近年成長しているにもかかわらず、アートドメインには研究のレベルが欠如している。
このギャップを軽減するために、この記事では、アートイメージを視覚的に認識するためのニューラルネットワークアーキテクチャであるCuratorNetを紹介します。
CuratorNetは、一般化の最大化を目標として、コアに設計されている:ネットワークには、一度しかトレーニングする必要のないパラメータの固定セットがあり、その後、モデルは、それ以上のトレーニングをすることなく、今まで見たことのない新しいユーザやアイテムに一般化することができる。
アイテムはビジュアル埋め込みを通じてアイテムベクターにマッピングされ、ユーザは消費したアイテムのビジュアルコンテントを集約することで、ユーザベクターにマッピングされる。
モデルアーキテクチャの他に,アート領域におけるランク学習のための訓練セットを構築するための新しい三重項サンプリング戦略も導入し,ナイーブなランダムサンプリングよりも効果的な学習を実現する。
実世界の物理的絵画データセットの評価により、curatornetは最先端モデルvbprを含むいくつかのベースラインで最高のパフォーマンスを達成している。
CuratorNetはアートドメインでモチベーションと評価を受けているが、そのアーキテクチャとトレーニングスキームは、他の領域のイメージに適応することができる。
関連論文リスト
- HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.048226951354646]
シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した11種類の手影人形の8,340枚の画像からなる新しいデータセットを提案する。
本研究の結果は,従来のコンボリューションモデルよりも,注目に基づくトランスフォーマーアーキテクチャよりもかなり優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-19T18:56:24Z) - Neural architecture impact on identifying temporally extended
Reinforcement Learning tasks [0.0]
Intention based architectures in reinforcement learning (RL) domain, which can be good performance on OpenAI Gym Atari-2600 game suite。
注意に基づくモデルでは、イメージへの注意マップの抽出とオーバーレイにより、エージェントがアクションを選択するために使用する情報の直接観察が可能になる。
さらに、視覚変換器を用いた注意に基づく映像分類モデルの開発により、画像ベースRLドメインにも視覚変換器をベースとしたアーキテクチャが考案された。
論文 参考訳(メタデータ) (2023-10-04T21:09:19Z) - Interactive Neural Painting [66.9376011879115]
本稿では,対話型ニューラルペイント(NP)の最初のアプローチを提案する。
2段デコーダを用いた条件変圧器変分自動エンコーダ(VAE)アーキテクチャに基づく新しい手法であるI-Paintを提案する。
実験の結果,本手法は良好なストローク提案を提供し,最先端技術と比較した。
論文 参考訳(メタデータ) (2023-07-31T07:02:00Z) - Synergy of Machine and Deep Learning Models for Multi-Painter
Recognition [0.0]
我々は,62名のアーティストを含む絵画認識タスクのための大規模データセットを新たに導入し,良好な結果を得た。
RegNetは、機能をエクスポートする上で、SVMは、最大85%のパフォーマンスを持つ画家に基づいて、イメージの最高の分類を行う。
論文 参考訳(メタデータ) (2023-04-28T11:34:53Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - Leveraging Computer Vision Application in Visual Arts: A Case Study on
the Use of Residual Neural Network to Classify and Analyze Baroque Paintings [0.0]
本稿ではヨハン・クペツキーの「画家シャルル・ブルニの肖像」の分類に焦点をあてる。
残余ネットワークトレーニングで抽出した特徴は,オンラインアートコレクションの検索システム内での画像検索に有用であることを示す。
論文 参考訳(メタデータ) (2022-10-27T10:15:36Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Graph Neural Networks for Knowledge Enhanced Visual Representation of
Paintings [14.89186519385364]
ArtSAGENetは、グラフニューラルネットワーク(GNN)と畳み込みニューラルネットワーク(CNN)を統合する新しいアーキテクチャである。
提案したArtSAGENetは,アーティストとアートワーク間の重要な依存関係をキャプチャし,エンコードする。
本研究は美術品の分析とキュレーションにビジュアルコンテンツとセマンティクスを統合する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-05-17T23:05:36Z) - SketchEmbedNet: Learning Novel Concepts by Imitating Drawings [125.45799722437478]
モデルを用いて画像のスケッチを作成することによって学習した画像表現の特性について検討する。
この生成型クラスに依存しないモデルでは,新規な例,クラス,さらには新規なデータセットからの画像の情報埋め込みが,数ショットで生成されることが示されている。
論文 参考訳(メタデータ) (2020-08-27T16:43:28Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z) - Exploring Bottom-up and Top-down Cues with Attentive Learning for Webly
Supervised Object Detection [76.9756607002489]
本稿では,新しいクラスを対象としたWebSOD法を提案する。
提案手法はボトムアップとトップダウンを組み合わせた新しいクラス検出手法である。
提案手法は,3種類の新規/ベース分割を持つPASCAL VOCデータセット上で実証した。
論文 参考訳(メタデータ) (2020-03-22T03:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。