Fugu-MT 論文翻訳(概要): Emotional Images: Assessing Emotions in Images and Potential Biases in Generative Models

論文の概要: Emotional Images: Assessing Emotions in Images and Potential Biases in Generative Models

arxiv url: http://arxiv.org/abs/2411.05985v1
Date: Fri, 08 Nov 2024 21:42:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:46.00001
Title: Emotional Images: Assessing Emotions in Images and Potential Biases in Generative Models
Title（参考訳）: 感情画像:画像における感情の評価と生成モデルにおける潜在的なバイアス
Authors: Maneet Mehta, Cody Buntain,
Abstract要約: 本稿では、生成人工知能(AI)モデルにより生成された画像の感情的誘発における潜在的なバイアスと矛盾について検討する。我々は、AIが生成した画像によって誘発される感情と、それらの画像を作成するために使用されるプロンプトによって誘発される感情を比較した。発見は、AI生成画像が元のプロンプトに関係なく、しばしばネガティブな感情的コンテンツに傾いていることを示している。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper examines potential biases and inconsistencies in emotional evocation of images produced by generative artificial intelligence (AI) models and their potential bias toward negative emotions. In particular, we assess this bias by comparing the emotions evoked by an AI-produced image to the emotions evoked by prompts used to create those images. As a first step, the study evaluates three approaches for identifying emotions in images -- traditional supervised learning, zero-shot learning with vision-language models, and cross-modal auto-captioning -- using EmoSet, a large dataset of image-emotion annotations that categorizes images across eight emotional types. Results show fine-tuned models, particularly Google's Vision Transformer (ViT), significantly outperform zero-shot and caption-based methods in recognizing emotions in images. For a cross-modality comparison, we then analyze the differences between emotions in text prompts -- via existing text-based emotion-recognition models -- and the emotions evoked in the resulting images. Findings indicate that AI-generated images frequently lean toward negative emotional content, regardless of the original prompt. This emotional skew in generative models could amplify negative affective content in digital spaces, perpetuating its prevalence and impact. The study advocates for a multidisciplinary approach to better align AI emotion recognition with psychological insights and address potential biases in generative AI outputs across digital media.
Abstract（参考訳）: 本稿では、生成人工知能(AI)モデルによる画像の感情誘発の潜在的なバイアスと矛盾と、その負の感情に対する潜在的なバイアスについて検討する。特に、AIが生成した画像によって引き起こされる感情と、それらの画像を作成するために使われるプロンプトによって引き起こされる感情とを比較して、このバイアスを評価する。最初のステップとして、従来の教師付き学習、視覚言語モデルによるゼロショット学習、そして8種類の感情を分類する画像感情アノテーションの大規模なデータセットであるEmoSetを使用して、画像内の感情を識別する3つのアプローチを評価する。その結果、微調整されたモデル、特にGoogleのVision Transformer(ViT)は、画像内の感情を認識するためにゼロショットやキャプションベースの方法よりも大幅に優れていた。クロスモダリティ比較では、既存のテキストベースの感情認識モデルを通じて、テキストプロンプト内の感情と、結果のイメージに誘発される感情の違いを分析する。発見は、AI生成画像が元のプロンプトに関係なく、しばしばネガティブな感情的コンテンツに傾いていることを示している。生成モデルにおけるこの感情的な歪は、デジタル空間におけるネガティブな感情的コンテンツを増幅し、その有病率と影響を持続させる。この研究は、AIの感情認識を心理学的洞察と整合させ、デジタルメディア全体で生成するAI出力の潜在的なバイアスに対処する、多分野的なアプローチを提唱している。

関連論文リスト

EmoSEM: Segment and Explain Emotion Stimuli in Visual Art [25.539022846134543]
本稿では,視覚芸術理解における重要な課題に焦点をあてる。芸術的イメージを与えられたモデルは,特定の人間の感情を誘発するピクセル領域をピンポイントする。近年の芸術理解の進歩にもかかわらず、ピクセルレベルの感情理解は依然として二重の課題に直面している。本稿では,感情理解能力を持つセグメンテーションモデルSAMを実現するために,感情刺激・説明モデル(EmoSEM)を提案する。
論文参考訳（メタデータ） (2025-04-20T15:40:00Z)
EmotiCrafter: Text-to-Emotional-Image Generation based on Valence-Arousal Model [23.26111054485357]
連続感情画像コンテンツ生成(C-EICG)の新たな課題について紹介する。本稿では,テキストプロンプトとValence-Arousal値に基づいて画像を生成する感情画像生成モデルであるEmotiCrafterを提案する。
論文参考訳（メタデータ） (2025-01-10T04:41:37Z)
Level of agreement between emotions generated by Artificial Intelligence and human evaluation: a methodological proposal [0.0]
生成画像と人間の感情反応の一致度はまだ評価されていない。本研究は、感情評価に固有の主観性を確認した。
論文参考訳（メタデータ） (2024-10-10T19:44:32Z)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [36.40067582639123]
そこで本研究では,感情を刺激するイメージを合成し,本来のシーンのセマンティクスと構造を保ちながら,感情を刺激するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。感情編集データセットが不足しているため、34万対の画像とその感情アノテーションからなるユニークなデータセットを提供する。
論文参考訳（メタデータ） (2024-03-13T05:13:17Z)
The Good, The Bad, and Why: Unveiling Emotions in Generative AI [73.94035652867618]
EmotionPromptはAIモデルの性能を向上し、EmotionAttackはそれを妨げうることを示す。 EmotionDecodeによると、AIモデルは人間の脳内のドーパミンのメカニズムに似た感情的な刺激を理解することができる。
論文参考訳（メタデータ） (2023-12-18T11:19:45Z)
High-Level Context Representation for Emotion Recognition in Images [4.987022981158291]
画像から高レベルな文脈表現を抽出する手法を提案する。このモデルは、この表現と感情を関連付けるために、1つのキューと1つのエンコードストリームに依存している。我々のアプローチは従来のモデルよりも効率的であり、感情認識に関連する現実の問題に対処するために容易に展開できる。
論文参考訳（メタデータ） (2023-05-05T13:20:41Z)
SOLVER: Scene-Object Interrelated Visual Emotion Reasoning Network [83.27291945217424]
画像から感情を予測するために,SOLVER(Scene-Object Interrelated Visual Emotion Reasoning Network)を提案する。異なるオブジェクト間の感情関係を掘り下げるために、まずセマンティックな概念と視覚的特徴に基づいて感情グラフを構築します。また、シーンとオブジェクトを統合するScene-Object Fusion Moduleを設計し、シーンの特徴を利用して、提案したシーンベースのアテンションメカニズムでオブジェクトの特徴の融合プロセスを導出する。
論文参考訳（メタデータ） (2021-10-24T02:41:41Z)
Using Knowledge-Embedded Attention to Augment Pre-trained Language Models for Fine-Grained Emotion Recognition [0.0]
我々は,事前学習した自己意識モデルに外部知識を導入することで,微粒な感情認識を改善することに集中する。結果と誤差解析は,複数のデータセットで過去のモデルより優れていた。
論文参考訳（メタデータ） (2021-07-31T09:41:44Z)
Affective Image Content Analysis: Two Decades Review and New Perspectives [132.889649256384]
我々は,過去20年間の情緒的イメージコンテンツ分析(AICA)の発展を包括的にレビューする。我々は、感情的ギャップ、知覚主観性、ラベルノイズと欠如という3つの主要な課題に関して、最先端の手法に焦点を当てる。画像の内容やコンテキスト理解,グループ感情クラスタリング,ビューアーとイメージのインタラクションなど,今後の課題や研究の方向性について論じる。
論文参考訳（メタデータ） (2021-06-30T15:20:56Z)
A Circular-Structured Representation for Visual Emotion Distribution Learning [82.89776298753661]
視覚的感情分布学習に先立つ知識を活用するために,身近な円形構造表現を提案する。具体的には、まず感情圏を構築し、その内にある感情状態を統一する。提案した感情圏では、各感情分布は3つの属性で定義される感情ベクトルで表される。
論文参考訳（メタデータ） (2021-06-23T14:53:27Z)
Enhancing Cognitive Models of Emotions with Representation Learning [58.2386408470585]
本稿では,きめ細かな感情の埋め込み表現を生成するための,新しいディープラーニングフレームワークを提案する。本フレームワークは,コンテキスト型埋め込みエンコーダとマルチヘッド探索モデルを統合する。本モデルは共感対話データセット上で評価され,32種類の感情を分類する最新結果を示す。
論文参考訳（メタデータ） (2021-04-20T16:55:15Z)
Facial Expression Editing with Continuous Emotion Labels [76.36392210528105]
深層生成モデルは、自動表情編集の分野で素晴らしい成果を上げている。連続した2次元の感情ラベルに従って顔画像の表情を操作できるモデルを提案する。
論文参考訳（メタデータ） (2020-06-22T13:03:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。