Fugu-MT 論文翻訳(概要): Interoceptive Divergence in Aesthetic Evaluation and Implications for Human-AI Alignment

論文の概要: Interoceptive Divergence in Aesthetic Evaluation and Implications for Human-AI Alignment

arxiv url: http://arxiv.org/abs/2605.18759v1
Date: Sun, 05 Apr 2026 10:20:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-25 12:34:33.918339
Title: Interoceptive Divergence in Aesthetic Evaluation and Implications for Human-AI Alignment
Title（参考訳）: 美的評価における知覚的多様性と人間-AIアライメントの意義
Authors: Yoshia Abe, Tatsuya Daikoku, Yasuo Kuniyoshi,
Abstract要約: 本研究では,人間とAIシステムが審美経験にどのように収束するか,あるいは分散するかを検討する。人間とAIは、美的評価と感情の相関関係において広範囲に類似したパターンを示したが、感情的反応の分布と美的評価と身体的感覚の関係の両方に顕著な相違が現れた。大規模なテキストデータに基づいて訓練された最先端のLCMは、審美的評価において平均的な人間の傾向をある程度の程度に近似することができることを示唆している。
参考スコア（独自算出の注目度）: 2.905751301655124
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Artificial intelligence (AI), exemplified by large language models (LLMs), is rapidly approaching and in some cases surpassing human performance across a wide range of cognitive tasks. However, human nature is not limited to intelligence alone; it also encompasses sensibility, including the capacity to perceive and experience beauty in visual scenes. This raises a fundamental question: how humans and AI systems converge or diverge in such aesthetic experiences. Aesthetic evaluation depends not only on objective properties of images but also on internal processes within the observer. As part of ongoing efforts in AI alignment, building upon prior human studies that have examined the relationship between beauty ratings, bodily sensations, and emotions, we adopt a comparable set of questionnaire items and present them to LLMs, enabling a direct comparison between human and AI responses. Our comparative analyses revealed that, while humans and AI exhibited broadly similar patterns in the correlations between beauty ratings and emotions, as well as in the image features they prioritized, notable divergences emerged in both the distribution of emotional responses and the relationship between beauty ratings and bodily sensations. These findings suggest that state-of-the-art LLMs, trained on large-scale textual data, can approximate average human tendencies in aesthetic evaluation to a certain extent. However, they also indicate limitations, particularly in relation to interoceptive aspects, which may reflect insufficient representation in training data or unintended consequences of alignment processes. These findings highlight key challenges for AI alignment and suggest important directions for developing AI systems with human-like aesthetic processing.
Abstract（参考訳）: 大規模言語モデル(LLM)によって実証された人工知能(AI)は、急速に接近しており、場合によっては幅広い認知タスクにおいて人間のパフォーマンスを上回っている。しかし、人間の自然は知性のみに限らず、視覚的な場面で美を知覚し体験する能力を含む感覚も含む。これは、人間とAIシステムがこのような美的体験にどのように収束するか、あるいは分散するのか、という根本的な疑問を提起する。美的評価は、画像の客観的特性だけでなく、観察者の内部プロセスにも依存する。 AIアライメントの継続的な取り組みの一環として、美容評価、身体感覚、感情の関係を調査した先行研究に基づいて、我々は、同等の質問項目群を採用し、LLMに提示し、人間とAIの反応を直接比較できるようにする。比較分析の結果,ヒトとAIは美容評価と感情の相関関係に大きく類似したパターンを示したが,イメージ的特徴は感情応答の分布と美容評価と身体感覚の関係の両方に顕著な相違がみられた。これらの結果は,大規模テキストデータに基づいて訓練された最先端のLCMは,審美的評価において平均的な人間の傾向をある程度近似することができることを示唆している。しかし、これらはまた、特に、トレーニングデータにおける不十分な表現や、意図しないアライメントプロセスの結果を反映する、相互受容的な側面に関する制限を示す。これらの発見は、AIアライメントの鍵となる課題を浮き彫りにし、人間のような美的処理を備えたAIシステムを開発する上で重要な方向性を示唆している。

関連論文リスト

HumanPCR: Probing MLLM Capabilities in Diverse Human-Centric Scenes [72.26829188852139]
HumanPCRは、人間の視覚的コンテキストに関するMLLMの能力を調べるための評価スイートである。 Human-P、HumanThought-C、Human-Rは、6,000以上の人間認証された複数の選択質問を特徴としている。 Human-Rは、手動でキュレートされたビデオ推論テストを提供する。
論文参考訳（メタデータ） (2025-08-19T09:52:04Z)
Artificial Intelligence Can Emulate Human Normative Judgments on Emotional Visual Scenes [0.09208007322096533]
現状のマルチモーダルシステムは、標準化された画像に対して人間の感情評価をエミュレートできるかどうかを検討する。 AIの判断は、平均的な人間の評価と驚くほどよく相関している。
論文参考訳（メタデータ） (2025-03-24T15:41:23Z)
Identifying Features that Shape Perceived Consciousness in Large Language Model-based AI: A Quantitative Study of Human Responses [4.369058206183195]
本研究では,大規模言語モデル(LLM)に基づくAIシステムにおいて,AI生成したテキストの特徴が人間に主観意識を知覚させるかどうかを定量的に検討する。回帰分析とクラスタリング分析を用いて,これらの特徴がAI意識に対する参加者の認識にどのように影響するかを検討した。
論文参考訳（メタデータ） (2025-02-21T10:27:28Z)
AI-generated Image Quality Assessment in Visual Communication [72.11144790293086]
AIGI-VCは、視覚コミュニケーションにおけるAI生成画像の品質評価データベースである。データセットは、14の広告トピックと8つの感情タイプにまたがる2500のイメージで構成されている。粗い人間の嗜好アノテーションときめ細かい嗜好記述を提供し、選好予測、解釈、推論におけるIQAメソッドの能力をベンチマークする。
論文参考訳（メタデータ） (2024-12-20T08:47:07Z)
MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.012111671763776]
そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。 MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文参考訳（メタデータ） (2024-11-18T02:09:48Z)
How explainable AI affects human performance: A systematic review of the behavioural consequences of saliency maps [0.0]
透明性マップは、ディープニューラルネットワークがどのように画像を分類するかを説明することができる。しかし、実際には人間にとって役に立つのだろうか? 68のユーザスタディの体系的なレビューでは、サリエンシマップは人間のパフォーマンスを向上させるが、ヌル効果やコストさえも非常に一般的であることがわかった。
論文参考訳（メタデータ） (2024-04-03T21:46:25Z)
Exploring the Naturalness of AI-Generated Images [59.04528584651131]
我々は、AI生成画像の視覚的自然性をベンチマークし、評価する第一歩を踏み出した。本研究では,人間の評価を整列するAGIの自然性を自動予測するジョイント・オブジェクト・イメージ・ナチュラルネス評価器(JOINT)を提案する。その結果,JOINTは自然性評価において,より主観的に一貫した結果を提供するために,ベースラインを著しく上回ることを示した。
論文参考訳（メタデータ） (2023-12-09T06:08:09Z)
Affect-DML: Context-Aware One-Shot Recognition of Human Affect using Deep Metric Learning [29.262204241732565]
既存の方法は、すべての関心の感情に注釈付きトレーニングの例として優先順位が与えられると仮定している。我々は、文脈における感情のワンショット認識を概念化し、単一のサポートサンプルからより細かい粒子レベルの人間の影響状態を認識することを目的とした新しい問題である。モデルの全変種は、ランダムなベースラインよりも明らかに優れており、セマンティックシーンのコンテキストを活用することで、学習された表現を一貫して改善している。
論文参考訳（メタデータ） (2021-11-30T10:35:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。