論文の概要: Predicting Popularity of Images Over 30 Days
- arxiv url: http://arxiv.org/abs/2108.01326v1
- Date: Tue, 3 Aug 2021 07:04:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 14:08:46.169244
- Title: Predicting Popularity of Images Over 30 Days
- Title(参考訳): 30日間にわたる画像の人気予測
- Authors: Amartya Dutta, Ferdous Ahmed Barbhuiya
- Abstract要約: この研究は、ユーザーと画像のソーシャル機能を使って、Flickr上の画像の人気を30日間にわたって予測することを目的としている。
画像の形状と規模を予測し、30日間にわたる画像の予測シーケンスを合成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The current work deals with the problem of attempting to predict the
popularity of images before even being uploaded. This method is specifically
focused on Flickr images. Social features of each image as well as that of the
user who had uploaded it, have been recorded. The dataset also includes the
engagement score of each image which is the ground truth value of the views
obtained by each image over a period of 30 days. The work aims to predict the
popularity of images on Flickr over a period of 30 days using the social
features of the user and the image, as well as the visual features of the
images. The method states that the engagement sequence of an image can be said
to depend on two independent quantities, namely scale and shape of an image.
Once the shape and scale of an image have been predicted, combining them the
predicted sequence of an image over 30 days is obtained. The current work
follows a previous work done in the same direction, with certain speculations
and suggestions of improvement.
- Abstract(参考訳): 現在の作品は、アップロードされる前に画像の人気を予測しようとする問題に対処している。
この方法はFlickrの画像に特化している。
各画像の社会的特徴とアップロードしたユーザーの特徴が記録されている。
また、データセットは、30日間にわたって各画像によって得られたビューの基底真理値である各画像のエンゲージメントスコアも含む。
この研究は、ユーザーと画像の社会的特徴と画像の視覚的特徴を用いて、Flickr上の画像の人気を30日間にわたって予測することを目的としている。
この方法では、画像のエンゲージメントシーケンスは、画像のスケールと形状の2つの独立した量に依存すると言える。
画像の形状とスケールが予測されると、それらを組み合わせて、30日以上にわたる画像の予測シーケンスを得る。
現在の作業は、ある憶測と改善の提案を持って、同じ方向に進めた以前の作業に続くものだ。
関連論文リスト
- A Dynamic YOLO-Based Sequence-Matching Model for Efficient Coverless Image Steganography [12.950354250175982]
動的にマッチングされた画像に基づく効率的なカバーレスステガノグラフィー手法を提案する。
YOLOは最適なオブジェクトの選択に使用され、これらのオブジェクトとスクランブル要素の間のマッピング辞書が確立される。
典型的な幾何学的攻撃の下では、平均して79.85%の秘密情報を復元することができる。
論文 参考訳(メタデータ) (2024-01-22T13:35:27Z) - Stellar: Systematic Evaluation of Human-Centric Personalized
Text-to-Image Methods [52.806258774051216]
我々は,個々のイメージを入力し,生成プロセスの基盤となるテキストと,所望の視覚的コンテキストを記述したテキストに焦点をあてる。
我々は,既存の関連するデータセットよりも桁違いの大きさの個人画像と,リッチなセマンティックな接地真実アノテーションが容易に利用できるパーソナライズされたプロンプトを含む標準化データセット(Stellar)を紹介した。
被験者ごとにテストタイムの微調整を必要とせず,新しいSoTAを定量的かつ人為的に設定した,シンプルで効率的でパーソナライズされたテキスト・ツー・イメージのベースラインを導出する。
論文 参考訳(メタデータ) (2023-12-11T04:47:39Z) - Behavior Optimized Image Generation [69.9906601767728]
本稿では,画像内容とユーザ行動の両方を理解するBoigLLMを提案する。
本稿では, この課題において, BoigLLM が GPT-3.5 や GPT-4 などの 13 倍のモデルより優れていることを示す。
BoigBenchは1億6800万件の企業ツイートをメディア、ブランド名、投稿時間、合計などのベンチマークデータセットです。
論文 参考訳(メタデータ) (2023-11-18T07:07:38Z) - Content Bias in Deep Learning Image Age Approximation: A new Approach Towards better Explainability [4.088355251010862]
時間画像法医学において、コンテンツバイアスはニューラルネットワークによって利用することができる。
画像コンテンツの影響を評価する新しい手法を提案する。
年齢分類の文脈で提案される深層学習アプローチは,画像内容に大きく依存している可能性が高い。
論文 参考訳(メタデータ) (2023-10-03T14:09:27Z) - ImagenHub: Standardizing the evaluation of conditional image generation
models [48.51117156168]
本稿では,条件付き画像生成モデルの推論と評価を標準化するワンストップライブラリであるImagenHubを提案する。
本研究では,感性一貫性と知覚品質という2つの評価スコアと,生成した画像を評価するための包括的なガイドラインを設計する。
人間の評価は,0.4以上の値を持つ76%のモデル上で,クリッペンドルフのαに対する高い労働者間合意を達成する。
論文 参考訳(メタデータ) (2023-10-02T19:41:42Z) - NewsStories: Illustrating articles with visual summaries [49.924916589209374]
我々は,3300万記事,2200万画像,100万ビデオを含む大規模マルチモーダルデータセットを提案する。
現状の画像テキストアライメント手法は、複数の画像を持つ長い物語に対して堅牢ではないことを示す。
本稿では,GoodNewsデータセット上で,ゼロショット画像セット検索において,これらの手法を10%向上させる直感的なベースラインを提案する。
論文 参考訳(メタデータ) (2022-07-26T17:34:11Z) - Using Social Media Images for Building Function Classification [12.99941371793082]
本研究では,大規模なソーシャルメディア画像データセットから高品質で地上レベルの画像を得るためのフィルタリングパイプラインを提案する。
われわれの方法では、世界中の42都市から2800万枚以上の画像で、文化的に多様なソーシャルメディアデータセットをFlickrから分析する。
微細調整された最先端アーキテクチャは、フィルタ画像上でF1スコアを最大0.51まで生成する。
論文 参考訳(メタデータ) (2022-02-15T11:05:10Z) - Content-Based Detection of Temporal Metadata Manipulation [91.34308819261905]
画像の撮像時間とその内容と地理的位置とが一致しているかどうかを検証するためのエンドツーエンドのアプローチを提案する。
中心となる考え方は、画像の内容、キャプチャ時間、地理的位置が一致する確率を予測するための教師付き一貫性検証の利用である。
我々のアプローチは、大規模なベンチマークデータセットの以前の作業により改善され、分類精度が59.03%から81.07%に向上した。
論文 参考訳(メタデータ) (2021-03-08T13:16:19Z) - The Forchheim Image Database for Camera Identification in the Wild [10.091921099426294]
Forchheim Image Database (FODB)は、27台のスマートフォンカメラで143シーンの23,000枚以上の画像で構成されている。
各画像は、オリジナルのカメラネイティブバージョンと、ソーシャルネットワークから5つのコピーの6つの異なる品質で提供される。
汎用EfficientNetは、クリーン画像と圧縮画像の両方で、いくつかの専門のCNNを著しく上回っている。
論文 参考訳(メタデータ) (2020-11-04T11:54:54Z) - On-device Filtering of Social Media Images for Efficient Storage [0.0]
ソーシャルメディア画像のオンデバイスフィルタリングのための畳み込みニューラルネットワーク(CNN)に基づく新しい手法を提案する。
提案したソリューションは、Places-365データセットで98.25%、Syntheticイメージデータセットで95.81%の精度を実現している。
論文 参考訳(メタデータ) (2020-04-06T08:49:29Z) - Watching the World Go By: Representation Learning from Unlabeled Videos [78.22211989028585]
近年の単一画像教師なし表現学習技術は,様々なタスクにおいて顕著な成功を収めている。
本稿では,この自然な拡張を無償で提供することを論じる。
そこで本稿では,ビデオノイズコントラスト推定(Voice Noise Contrastive Estimation)を提案する。
論文 参考訳(メタデータ) (2020-03-18T00:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。