Fugu-MT 論文翻訳(概要): Identifying Professional Photographers Through Image Quality and Aesthetics in Flickr

論文の概要: Identifying Professional Photographers Through Image Quality and Aesthetics in Flickr

arxiv url: http://arxiv.org/abs/2307.01756v1
Date: Tue, 4 Jul 2023 14:55:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-06 16:52:43.021578
Title: Identifying Professional Photographers Through Image Quality and Aesthetics in Flickr
Title（参考訳）: Flickrでプロの写真家を画像品質と美学で識別する
Authors: Sofia Strukova, Rub\'en Gaspar Marco, Jos\'e A. Ruip\'erez-Valiente, F\'elix G\'omez M\'armol
Abstract要約: 本研究では,写真とビデオの共有プラットフォームに適切なデータセットが存在しないことを明らかにする。我々は、オープンソースのマルチモーダルデータを用いて、Flickrで最大のラベル付きデータセットの1つを作成しました。画像の審美性と技術的品質と,その画像の社会的活動との関係について検討した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In our generation, there is an undoubted rise in the use of social media and specifically photo and video sharing platforms. These sites have proved their ability to yield rich data sets through the users' interaction which can be used to perform a data-driven evaluation of capabilities. Nevertheless, this study reveals the lack of suitable data sets in photo and video sharing platforms and evaluation processes across them. In this way, our first contribution is the creation of one of the largest labelled data sets in Flickr with the multimodal data which has been open sourced as part of this contribution. Predicated on these data, we explored machine learning models and concluded that it is feasible to properly predict whether a user is a professional photographer or not based on self-reported occupation labels and several feature representations out of the user, photo and crowdsourced sets. We also examined the relationship between the aesthetics and technical quality of a picture and the social activity of that picture. Finally, we depicted which characteristics differentiate professional photographers from non-professionals. As far as we know, the results presented in this work represent an important novelty for the users' expertise identification which researchers from various domains can use for different applications.
Abstract（参考訳）: 私たちの世代では、ソーシャルメディア、特に写真とビデオの共有プラットフォームの利用が、間違いなく増加しています。これらのサイトは、ユーザのインタラクションを通じてリッチなデータセットを生成できることを証明し、データ駆動による機能評価に使用することができる。それにもかかわらず、写真とビデオの共有プラットフォームにおける適切なデータセットの欠如と、それらの評価プロセスを明らかにする。このようにして、私たちの最初のコントリビューションは、flickrで最大のラベル付きデータセットの1つと、このコントリビューションの一部としてオープンソース化されたマルチモーダルデータの作成です。これらのデータに基づいて機械学習モデルを探索し、ユーザーがプロの写真家であるか否かを、自己申告された職業ラベルとユーザー、写真、クラウドソースセットからいくつかの特徴表現に基づいて適切に予測することは可能であると結論付けた。また,画像の審美性と技術的品質と,その画像の社会的活動との関係についても検討した。最後に,プロの写真家と非プロの写真家を区別する特徴について述べる。私たちが知る限り、この研究で提示された結果は、さまざまなドメインの研究者が異なるアプリケーションのために使用できる、ユーザの専門知識の識別にとって重要なノベルティである。

関連論文リスト

ProCrop: Learning Aesthetic Image Cropping from Professional Compositions [57.949730056500634]
ProCropは、プロの写真を利用して収穫決定を導く検索方式である。プロ画像のアウトペイントによって生成された242Kの弱い注釈付き画像の大規模データセットを提示する。この合成対応データセット生成は、美学原理で導かれる多様な高品質な作物提案を提供する。
論文参考訳（メタデータ） (2025-05-28T15:38:44Z)
Towards More Accurate Personalized Image Generation: Addressing Overfitting and Evaluation Bias [52.590072198551944]
画像パーソナライズの目的は、ユーザが提供する課題に基づいて画像を作成することである。現在の手法では、テキストプロンプトへの忠実性を保証する上で、課題に直面している。トレーニング画像の歪みを除去するアトラクタを組み込んだ,新たなトレーニングパイプラインを導入する。
論文参考訳（メタデータ） (2025-03-09T14:14:02Z)
Design and Evaluation of Camera-Centric Mobile Crowdsourcing Applications [3.941600320957518]
このプロジェクトでは,アプリケーション設計がユーザのコントリビューション意欲や,取得したデータの量や品質にどのように影響するかを理解する。我々はカメラベースのモバイルクラウドソーシングアプリケーションの3つのバージョンを設計した。その結果,高いレベルのユーザラベリングがコントリビューションの削減につながることが示唆された。
論文参考訳（メタデータ） (2024-09-04T18:10:35Z)
AID-AppEAL: Automatic Image Dataset and Algorithm for Content Appeal Enhancement and Assessment Labeling [11.996211235559866]
Image Content Appeal Assessment (ICAA) は、画像のコンテンツが視聴者に対して生成する肯定的な関心のレベルを定量化する新しいメトリクスである。 ICAAは、画像の芸術的品質を判断する伝統的な画像美学評価(IAA)とは異なる。
論文参考訳（メタデータ） (2024-07-08T01:40:32Z)
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。本研究では,既存のデータ拡張技術の欠点について検討する。 Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文参考訳（メタデータ） (2024-03-28T17:23:45Z)
Blind Dates: Examining the Expression of Temporality in Historical Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文参考訳（メタデータ） (2023-10-10T13:51:24Z)
Empowering Visually Impaired Individuals: A Novel Use of Apple Live Photos and Android Motion Photos [3.66237529322911]
われわれは、Apple Live PhotosとAndroid Motion Photosの技術の使用を提唱している。以上の結果から,Live PhotosとMotion Photosは,共通の視覚支援タスクにおいて,単フレーム画像よりも優れていた。
論文参考訳（メタデータ） (2023-09-14T20:46:35Z)
ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文参考訳（メタデータ） (2022-12-04T08:49:14Z)
Structuring User-Generated Content on Social Media with Multimodal Aspect-Based Sentiment Analysis [2.023920009396818]
本稿では、機械学習がこれらのデータベースをどの程度分析し、構成できるかを示す。自動データ分析パイプラインがデプロイされ、他のドメインの研究者のためにユーザ生成コンテンツに関する洞察を提供する。
論文参考訳（メタデータ） (2022-10-27T12:38:10Z)
There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文参考訳（メタデータ） (2022-03-01T21:52:08Z)
ImageSubject: A Large-scale Dataset for Subject Detection [9.430492045581534]
主に被写体は、写真家が強調したいものなので、通常、画像やビデオの中に存在します。主対象を検出することは、機械が画像やビデオの内容を理解するのを助ける重要な技術である。我々は、オブジェクトのレイアウトを理解し、その中の主要な対象を見つけるために、モデルのトレーニングを目標とする新しいデータセットを提案する。
論文参考訳（メタデータ） (2022-01-09T22:49:59Z)
Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。コードとPSSデータセットは公開されます。
論文参考訳（メタデータ） (2021-07-24T04:03:11Z)
From ImageNet to Image Classification: Contextualizing Progress on Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文参考訳（メタデータ） (2020-05-22T17:39:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。