論文の概要: Identifying Professional Photographers Through Image Quality and
Aesthetics in Flickr
- arxiv url: http://arxiv.org/abs/2307.01756v1
- Date: Tue, 4 Jul 2023 14:55:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 16:52:43.021578
- Title: Identifying Professional Photographers Through Image Quality and
Aesthetics in Flickr
- Title(参考訳): Flickrでプロの写真家を画像品質と美学で識別する
- Authors: Sofia Strukova, Rub\'en Gaspar Marco, Jos\'e A. Ruip\'erez-Valiente,
F\'elix G\'omez M\'armol
- Abstract要約: 本研究では,写真とビデオの共有プラットフォームに適切なデータセットが存在しないことを明らかにする。
我々は、オープンソースのマルチモーダルデータを用いて、Flickrで最大のラベル付きデータセットの1つを作成しました。
画像の審美性と技術的品質と,その画像の社会的活動との関係について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In our generation, there is an undoubted rise in the use of social media and
specifically photo and video sharing platforms. These sites have proved their
ability to yield rich data sets through the users' interaction which can be
used to perform a data-driven evaluation of capabilities. Nevertheless, this
study reveals the lack of suitable data sets in photo and video sharing
platforms and evaluation processes across them. In this way, our first
contribution is the creation of one of the largest labelled data sets in Flickr
with the multimodal data which has been open sourced as part of this
contribution. Predicated on these data, we explored machine learning models and
concluded that it is feasible to properly predict whether a user is a
professional photographer or not based on self-reported occupation labels and
several feature representations out of the user, photo and crowdsourced sets.
We also examined the relationship between the aesthetics and technical quality
of a picture and the social activity of that picture. Finally, we depicted
which characteristics differentiate professional photographers from
non-professionals. As far as we know, the results presented in this work
represent an important novelty for the users' expertise identification which
researchers from various domains can use for different applications.
- Abstract(参考訳): 私たちの世代では、ソーシャルメディア、特に写真とビデオの共有プラットフォームの利用が、間違いなく増加しています。
これらのサイトは、ユーザのインタラクションを通じてリッチなデータセットを生成できることを証明し、データ駆動による機能評価に使用することができる。
それにもかかわらず、写真とビデオの共有プラットフォームにおける適切なデータセットの欠如と、それらの評価プロセスを明らかにする。
このようにして、私たちの最初のコントリビューションは、flickrで最大のラベル付きデータセットの1つと、このコントリビューションの一部としてオープンソース化されたマルチモーダルデータの作成です。
これらのデータに基づいて機械学習モデルを探索し、ユーザーがプロの写真家であるか否かを、自己申告された職業ラベルとユーザー、写真、クラウドソースセットからいくつかの特徴表現に基づいて適切に予測することは可能であると結論付けた。
また,画像の審美性と技術的品質と,その画像の社会的活動との関係についても検討した。
最後に,プロの写真家と非プロの写真家を区別する特徴について述べる。
私たちが知る限り、この研究で提示された結果は、さまざまなドメインの研究者が異なるアプリケーションのために使用できる、ユーザの専門知識の識別にとって重要なノベルティである。
関連論文リスト
- ImageLab: Simplifying Image Processing Exploration for Novices and
Experts Alike [0.0]
ImageLabは、初心者でも専門家でも、画像処理を民主化するための新しいツールだ。
ImageLabは貴重な教育資源として機能するだけでなく、経験豊富な実践者のための実践的なテスト環境も提供する。
論文 参考訳(メタデータ) (2024-01-06T08:27:28Z) - Blind Dates: Examining the Expression of Temporality in Historical
Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。
我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。
解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文 参考訳(メタデータ) (2023-10-10T13:51:24Z) - Empowering Visually Impaired Individuals: A Novel Use of Apple Live
Photos and Android Motion Photos [3.66237529322911]
われわれは、Apple Live PhotosとAndroid Motion Photosの技術の使用を提唱している。
以上の結果から,Live PhotosとMotion Photosは,共通の視覚支援タスクにおいて,単フレーム画像よりも優れていた。
論文 参考訳(メタデータ) (2023-09-14T20:46:35Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Structuring User-Generated Content on Social Media with Multimodal
Aspect-Based Sentiment Analysis [2.023920009396818]
本稿では、機械学習がこれらのデータベースをどの程度分析し、構成できるかを示す。
自動データ分析パイプラインがデプロイされ、他のドメインの研究者のためにユーザ生成コンテンツに関する洞察を提供する。
論文 参考訳(メタデータ) (2022-10-27T12:38:10Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - BIQ2021: A Large-Scale Blind Image Quality Assessment Database [1.3670071336891754]
本稿ではBlind Image Quality Assessment Database, BIQ2021を紹介する。
データセットは、画像品質評価に使用する意図のないもの、意図的に導入した自然な歪みで撮影したもの、オープンソースの画像共有プラットフォームから撮影したもの、の3つのセットで構成されている。
データベースは、主観的スコアリング、人体統計、および各画像の標準偏差に関する情報を含む。
論文 参考訳(メタデータ) (2022-02-08T14:07:38Z) - ImageSubject: A Large-scale Dataset for Subject Detection [9.430492045581534]
主に被写体は、写真家が強調したいものなので、通常、画像やビデオの中に存在します。
主対象を検出することは、機械が画像やビデオの内容を理解するのを助ける重要な技術である。
我々は、オブジェクトのレイアウトを理解し、その中の主要な対象を見つけるために、モデルのトレーニングを目標とする新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-01-09T22:49:59Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。