Fugu-MT 論文翻訳(概要): Defining and Quantifying Creative Behavior in Popular Image Generators

論文の概要: Defining and Quantifying Creative Behavior in Popular Image Generators

arxiv url: http://arxiv.org/abs/2505.04497v1
Date: Wed, 07 May 2025 15:20:17 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-08 19:07:36.125384
Title: Defining and Quantifying Creative Behavior in Popular Image Generators
Title（参考訳）: 人気画像生成装置における創造性の定義と定量化
Authors: Aditi Ramaswamy,
Abstract要約: ユーザが与えられたタスクに適したAIモデルを選択するのに役立つ手段を紹介します。画像・画像生成モデルについて評価を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Creativity of generative AI models has been a subject of scientific debate in the last years, without a conclusive answer. In this paper, we study creativity from a practical perspective and introduce quantitative measures that help the user to choose a suitable AI model for a given task. We evaluated our measures on a number of popular image-to-image generation models, and the results of this suggest that our measures conform to human intuition.
Abstract（参考訳）: 生成型AIモデルの創造性は、決定的な答えのない科学的な議論の対象となっている。本稿では,実践的な視点から創造性について検討し,ユーザが与えられたタスクに適したAIモデルを選択するのに役立つ量的尺度を提案する。画像・画像生成モデルについて評価を行った結果,人間の直感に適合する可能性が示唆された。

関連論文リスト

Human-Guided Image Generation for Expanding Small-Scale Training Image Datasets [10.93687452351281]
特定の実世界のアプリケーションにおけるコンピュータビジョンモデルの性能は、利用可能な少数の画像によって制限される。より制御可能なデータセット拡張のためのヒューマンガイド画像生成法を提案する。
論文参考訳（メタデータ） (2024-12-22T03:15:39Z)
Quality Assessment for AI Generated Images with Instruction Tuning [58.41087653543607]
我々はまず,AIGCIQA2023+と呼ばれるAIGIのための画像品質評価(IQA)データベースを構築した。本稿では,AIGIに対する人間の嗜好を評価するためのMINT-IQAモデルを提案する。
論文参考訳（メタデータ） (2024-05-12T17:45:11Z)
Multimodal Large Language Model is a Human-Aligned Annotator for Text-to-Image Generation [87.50120181861362]
VisionPreferは高品質できめ細かい選好データセットで、複数の選好面をキャプチャする。我々は、VisionPrefer上で報酬モデルVP-Scoreをトレーニングし、テキストから画像への生成モデルのトレーニングを指導し、VP-Scoreの嗜好予測精度は人間のアノテーションに匹敵する。
論文参考訳（メタデータ） (2024-04-23T14:53:15Z)
Collaborative Interactive Evolution of Art in the Latent Space of Deep Generative Models [1.4425878137951238]
私たちはまず,Creative Adversarial Networks(CANs)と呼ばれるアーキテクチャを用いて,創造的なイメージの制作を訓練するGANを採用する。次に、画像を発見するためにモデルの潜在空間内をナビゲートするために進化的アプローチを用いる。我々は、自動美学と協調的対話的人間評価指標を用いて、生成された画像を評価する。
論文参考訳（メタデータ） (2024-03-28T17:40:15Z)
Enhancing Image Caption Generation Using Reinforcement Learning with Human Feedback [0.0]
本研究では,人間に好まれるキャプションを生成するために,ディープニューラルネットワークモデルの性能を増幅する潜在的手法を検討する。これは、教師付き学習と強化学習と人間のフィードバックを統合することで達成された。我々は、人間の協調型生成AIモデル分野における継続的な進歩に寄与することを願って、我々のアプローチと結果のスケッチを提供する。
論文参考訳（メタデータ） (2024-03-11T13:57:05Z)
Social Reward: Evaluating and Enhancing Generative AI through Million-User Feedback from an Online Creative Community [63.949893724058846]
コミュニティ認識の一形態としての社会的報酬は、オンラインプラットフォームのユーザーがコンテンツに関わり、貢献する動機の強い源泉となる。この作業はパラダイムシフトの先駆者であり、革新的な報酬モデリングフレームワークであるSocial Rewardを発表した。私たちは、オンラインビジュアル作成と編集プラットフォームであるPicsartから、データセットのキュレーションと洗練の広範な旅に乗り出した。
論文参考訳（メタデータ） (2024-02-15T10:56:31Z)
Can AI Be as Creative as Humans? [84.43873277557852]
理論的には、AIは人間の創造者によって生成されたデータに適切に適合できるという条件の下で、人間と同じくらい創造的になれることを証明しています。 AIの創造性に関する議論は、十分な量のデータに適合する能力の問題に縮小されている。
論文参考訳（メタデータ） (2024-01-03T08:49:12Z)
Limitations of Face Image Generation [12.11955119100926]
顔生成における生成モデルの有効性と欠点について検討した。テキストプロンプトへの忠実度、人口格差、分布変化など、顔画像生成のいくつかの制限を識別する。本稿では、学習データの選択が生成モデルの性能にどのように貢献するかを洞察する分析モデルを提案する。
論文参考訳（メタデータ） (2023-09-13T19:33:26Z)
Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation Evaluation [96.74302670358145]
生成/編集された画像と対応するプロンプト/インストラクションの整合性を評価するために,視覚概念評価(ViCE)の自動手法を提案する。 ViCEは、Large Language Models(LLM)とVisual Question Answering(VQA)の強みを統合パイプラインに統合し、品質評価において人間の認知プロセスを再現することを目指している。
論文参考訳（メタデータ） (2023-07-18T16:33:30Z)
Human Image Generation: A Comprehensive Survey [44.204029557298476]
本稿では,人間の画像生成技術を3つのパラダイム,すなわちデータ駆動手法,知識誘導手法,ハイブリッド手法に分割する。異なる手法の利点と特徴はモデルアーキテクチャの観点から要約される。広範囲の応用可能性により、合成された人間の画像の典型的な下流使用法がカバーされている。
論文参考訳（メタデータ） (2022-12-17T15:19:45Z)
Towards Creativity Characterization of Generative Models via Group-based Subset Scanning [64.6217849133164]
創造的プロセスを特定し,定量化し,特徴付けるグループベースサブセットスキャンを提案する。創造的なサンプルは、データセット全体にわたる通常のサンプルや非創造的なサンプルよりも大きな異常のサブセットを生成する。
論文参考訳（メタデータ） (2022-03-01T15:07:14Z)
Towards creativity characterization of generative models via group-based subset scanning [51.84144826134919]
創造的プロセスを定量化し,検出し,特徴付けるグループベースサブセットスキャンを提案する。創造的なサンプルは、データセットをまたいだ通常または非創造的なサンプルよりも大きな異常のサブセットを生成する。
論文参考訳（メタデータ） (2021-04-01T14:07:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。