論文の概要: Identifying Professional Photographers Through Image Quality and
Aesthetics in Flickr
- arxiv url: http://arxiv.org/abs/2307.01756v1
- Date: Tue, 4 Jul 2023 14:55:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 16:52:43.021578
- Title: Identifying Professional Photographers Through Image Quality and
Aesthetics in Flickr
- Title(参考訳): Flickrでプロの写真家を画像品質と美学で識別する
- Authors: Sofia Strukova, Rub\'en Gaspar Marco, Jos\'e A. Ruip\'erez-Valiente,
F\'elix G\'omez M\'armol
- Abstract要約: 本研究では,写真とビデオの共有プラットフォームに適切なデータセットが存在しないことを明らかにする。
我々は、オープンソースのマルチモーダルデータを用いて、Flickrで最大のラベル付きデータセットの1つを作成しました。
画像の審美性と技術的品質と,その画像の社会的活動との関係について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In our generation, there is an undoubted rise in the use of social media and
specifically photo and video sharing platforms. These sites have proved their
ability to yield rich data sets through the users' interaction which can be
used to perform a data-driven evaluation of capabilities. Nevertheless, this
study reveals the lack of suitable data sets in photo and video sharing
platforms and evaluation processes across them. In this way, our first
contribution is the creation of one of the largest labelled data sets in Flickr
with the multimodal data which has been open sourced as part of this
contribution. Predicated on these data, we explored machine learning models and
concluded that it is feasible to properly predict whether a user is a
professional photographer or not based on self-reported occupation labels and
several feature representations out of the user, photo and crowdsourced sets.
We also examined the relationship between the aesthetics and technical quality
of a picture and the social activity of that picture. Finally, we depicted
which characteristics differentiate professional photographers from
non-professionals. As far as we know, the results presented in this work
represent an important novelty for the users' expertise identification which
researchers from various domains can use for different applications.
- Abstract(参考訳): 私たちの世代では、ソーシャルメディア、特に写真とビデオの共有プラットフォームの利用が、間違いなく増加しています。
これらのサイトは、ユーザのインタラクションを通じてリッチなデータセットを生成できることを証明し、データ駆動による機能評価に使用することができる。
それにもかかわらず、写真とビデオの共有プラットフォームにおける適切なデータセットの欠如と、それらの評価プロセスを明らかにする。
このようにして、私たちの最初のコントリビューションは、flickrで最大のラベル付きデータセットの1つと、このコントリビューションの一部としてオープンソース化されたマルチモーダルデータの作成です。
これらのデータに基づいて機械学習モデルを探索し、ユーザーがプロの写真家であるか否かを、自己申告された職業ラベルとユーザー、写真、クラウドソースセットからいくつかの特徴表現に基づいて適切に予測することは可能であると結論付けた。
また,画像の審美性と技術的品質と,その画像の社会的活動との関係についても検討した。
最後に,プロの写真家と非プロの写真家を区別する特徴について述べる。
私たちが知る限り、この研究で提示された結果は、さまざまなドメインの研究者が異なるアプリケーションのために使用できる、ユーザの専門知識の識別にとって重要なノベルティである。
関連論文リスト
- Design and Evaluation of Camera-Centric Mobile Crowdsourcing Applications [3.941600320957518]
このプロジェクトでは,アプリケーション設計がユーザのコントリビューション意欲や,取得したデータの量や品質にどのように影響するかを理解する。
我々はカメラベースのモバイルクラウドソーシングアプリケーションの3つのバージョンを設計した。
その結果,高いレベルのユーザラベリングがコントリビューションの削減につながることが示唆された。
論文 参考訳(メタデータ) (2024-09-04T18:10:35Z) - AID-AppEAL: Automatic Image Dataset and Algorithm for Content Appeal Enhancement and Assessment Labeling [11.996211235559866]
Image Content Appeal Assessment (ICAA) は、画像のコンテンツが視聴者に対して生成する肯定的な関心のレベルを定量化する新しいメトリクスである。
ICAAは、画像の芸術的品質を判断する伝統的な画像美学評価(IAA)とは異なる。
論文 参考訳(メタデータ) (2024-07-08T01:40:32Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Blind Dates: Examining the Expression of Temporality in Historical
Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。
我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。
解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文 参考訳(メタデータ) (2023-10-10T13:51:24Z) - Empowering Visually Impaired Individuals: A Novel Use of Apple Live
Photos and Android Motion Photos [3.66237529322911]
われわれは、Apple Live PhotosとAndroid Motion Photosの技術の使用を提唱している。
以上の結果から,Live PhotosとMotion Photosは,共通の視覚支援タスクにおいて,単フレーム画像よりも優れていた。
論文 参考訳(メタデータ) (2023-09-14T20:46:35Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Structuring User-Generated Content on Social Media with Multimodal
Aspect-Based Sentiment Analysis [2.023920009396818]
本稿では、機械学習がこれらのデータベースをどの程度分析し、構成できるかを示す。
自動データ分析パイプラインがデプロイされ、他のドメインの研究者のためにユーザ生成コンテンツに関する洞察を提供する。
論文 参考訳(メタデータ) (2022-10-27T12:38:10Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - ImageSubject: A Large-scale Dataset for Subject Detection [9.430492045581534]
主に被写体は、写真家が強調したいものなので、通常、画像やビデオの中に存在します。
主対象を検出することは、機械が画像やビデオの内容を理解するのを助ける重要な技術である。
我々は、オブジェクトのレイアウトを理解し、その中の主要な対象を見つけるために、モデルのトレーニングを目標とする新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-01-09T22:49:59Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。