論文の概要: Commonly Interesting Images
- arxiv url: http://arxiv.org/abs/2409.16736v1
- Date: Wed, 25 Sep 2024 08:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-27 04:50:49.364891
- Title: Commonly Interesting Images
- Title(参考訳): 面白い画像
- Authors: Fitim Abdullahu, Helmut Grabner,
- Abstract要約: 我々は、特定の状況下では、すべての画像が特定の観察者にとって興味深いものであると論じる。
写真共有プラットフォームのFlickrのさまざまなユーザーによる2.5kの画像コレクションの分析により、画像の特徴が一般的に興味深いものになっていることが判明した。
- 参考スコア(独自算出の注目度): 0.21485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Images tell stories, trigger emotions, and let us recall memories -- they make us think. Thus, they have the ability to attract and hold one's attention, which is the definition of being "interesting". Yet, the appeal of an image is highly subjective. Looking at the image of my son taking his first steps will always bring me back to this emotional moment, while it is just a blurry, quickly taken snapshot to most others. Preferences vary widely: some adore cats, others are dog enthusiasts, and a third group may not be fond of either. We argue that every image can be interesting to a particular observer under certain circumstances. This work particularly emphasizes subjective preferences. However, our analysis of 2.5k image collections from diverse users of the photo-sharing platform Flickr reveals that specific image characteristics make them commonly more interesting. For instance, images, including professionally taken landscapes, appeal broadly due to their aesthetic qualities. In contrast, subjectively interesting images, such as those depicting personal or niche community events, resonate on a more individual level, often evoking personal memories and emotions.
- Abstract(参考訳): 画像は物語を伝え、感情をトリガーし、記憶を思い出させる。
したがって、彼らは自分の注意を引き付け、保持する能力を持ち、それは「興味ある」の定義である。
しかし、画像の魅力は非常に主観的である。
息子が彼の最初の一歩を踏み出す様子を見ると、私はいつもこの感情的な瞬間に戻るだろう。
一部のアドル猫、他の猫は犬の愛好家であり、第三グループはどちらも好まないかもしれない。
我々は、特定の状況下では、すべての画像が特定の観察者にとって興味深いものであると論じる。
この作品は特に主観的嗜好を強調している。
しかし、写真共有プラットフォームのFlickrのさまざまなユーザーによる2.5万枚の画像コレクションの分析から、画像の特徴が一般的に興味深いものになっていることが判明した。
例えば、職業的に撮影された風景を含む画像は、美的な性質から広くアピールしている。
対照的に、個人的またはニッチなコミュニティイベントを描いているような、主観的に興味深いイメージは、より個々のレベルで共鳴し、しばしば個人的な記憶や感情を呼び起こす。
関連論文リスト
- Yo'LLaVA: Your Personalized Language and Vision Assistant [41.51436329973022]
大規模マルチモーダルモデル(LMM)をパーソナライズする新しいタスクについて紹介する。
提案するYo'LLaVAは,パーソナライズされた被写体を潜在トークンの集合に埋め込むことを学習する。
定性的かつ定量的な分析により,Yo'LLaVAはより少ないトークンでより効率的に概念を学習できることが判明した。
論文 参考訳(メタデータ) (2024-06-13T17:59:29Z) - EmoSet: A Large-scale Visual Emotion Dataset with Rich Attributes [53.95428298229396]
リッチ属性を付加した最初の大規模視覚感情データセットであるEmoSetを紹介する。
EmoSetは合計330万枚の画像で構成され、そのうち118,102枚は人間のアノテーションによって慎重にラベル付けされている。
心理学的な研究によって動機付けられ、感情のカテゴリに加えて、各画像には記述可能な感情特性のセットが注釈付けされている。
論文 参考訳(メタデータ) (2023-07-16T06:42:46Z) - Photoswap: Personalized Subject Swapping in Images [56.2650908740358]
Photowapは参照画像から対象の視覚概念を学習し、事前訓練された拡散モデルを用いて対象画像に置き換える。
Photowapは、被験者のスワップ、背景保存、全体的な品質において、人間の評価におけるベースラインの手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-05-29T17:56:13Z) - Understanding Aesthetics with Language: A Photo Critique Dataset for
Aesthetic Assessment [6.201485014848172]
74K画像と220Kコメントを含むCritique Photo Redditデータセット(RPCD)を提案する。
我々は、美的判断の指標として批判の感情の極性を利用する。
論文 参考訳(メタデータ) (2022-06-17T08:16:20Z) - 3D Moments from Near-Duplicate Photos [67.15199743223332]
3D Momentsは、新しい計算写真効果だ。
1枚目から2枚目までのシーンの動きを円滑に補間するビデオを作成する。
本システムは,モーションパララックスとシーンダイナミックスを併用したフォトリアリスティックな時空ビデオを生成する。
論文 参考訳(メタデータ) (2022-05-12T17:56:18Z) - Controlling Memorability of Face Images [5.000272778136267]
本稿では,顔画像の記憶性を変化させ,制御するための高速なアプローチを提案する。
われわれはまず、StyleGANの潜在空間に超平面を発見し、高解像度と低解像度の記憶可能な画像を分離した。
今回我々は,StyleGAN拡張潜伏空間の異なる層が顔の記憶にどう寄与するかを解析した。
論文 参考訳(メタデータ) (2022-02-24T04:33:55Z) - Hallucinating Pose-Compatible Scenes [55.064949607528405]
ポーズ条件付きシーン生成のための大規模生成対向ネットワークを提案する。
毎日の環境に1900万フレーム以上の人間がいる巨大なメタデータをキュレートします。
我々は、ポーズ互換シーンを人間の有無に関わらず幻覚化し、不整合シーンやポーズを可視化し、1つの生成された画像から別のシーンに人物を配置し、ポーズをアニメーションする様々な用途に、トレーニングされたモデルを活用する。
論文 参考訳(メタデータ) (2021-12-13T18:59:26Z) - A Study of Face Obfuscation in ImageNet [94.2949777826947]
本稿では,imagenetチャレンジにおける画像難読化について検討する。
ImageNetチャレンジのほとんどのカテゴリは、人のカテゴリではありません。
さまざまな深層ニューラルネットワークを顔画像上でベンチマークし、異なるカテゴリに対する異なる影響を観察します。
結果は、顔が破れた画像で学んだ特徴が等しく転送可能であることを示している。
論文 参考訳(メタデータ) (2021-03-10T17:11:34Z) - Aesthetic Quality Assessment for Group photograph [0.0]
そこで本研究では,グループ写真の経験と原理に基づいて,ハイレベルな機能セットを設計した。
それらと83の一般的な審美的特徴を組み合わせて2つの審美的アセスメントモデルを構築した。
実験の結果,これらの特徴は,プロの写真とスナップショットを分類し,同じ状況下での多種多様な人間の集団写真の識別を予測できることがわかった。
論文 参考訳(メタデータ) (2020-02-04T02:52:52Z) - Learning Preference-Based Similarities from Face Images using Siamese
Multi-Task CNNs [78.24964622317633]
オンラインデートプラットフォームの大きな課題は、ユーザに適したマッチングを決定することだ。
ディープラーニングアプローチは、人間の顔からある程度まで様々な特性を予測できることを示した。
画像ベースマッチングの実現可能性について検討し,個人の関心や嗜好,態度とマッチングする方法について検討した。
論文 参考訳(メタデータ) (2020-01-25T23:08:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。