Fugu-MT 論文翻訳(概要): Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception

論文の概要: Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception

arxiv url: http://arxiv.org/abs/2605.29064v1
Date: Wed, 27 May 2026 20:11:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-30 02:45:55.441052
Title: Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception
Title（参考訳）: 都市認知におけるマルチモーダルLLMエージェントの表現生成におけるペルソナ効果の分析
Authors: Neemias da Silva, Myriam Delgado, Rodrigo Minetto, Daniel Silver, Thiago H Silva,
Abstract要約: 本研究では,都市環境下での多モーダル大言語モデルにより生成されたペルソナ言語について検討する。 1200のペルソナ条件エージェントと2つの非ペルソナ設定からの59,808のアノテーションを用いて、ペルソナのキャプション、正当化、認識タグを分析した。
参考スコア（独自算出の注目度）: 4.411001164962554
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study how persona prompting shapes language generated by multimodal large language models in an urban perception setting. Using 59,808 annotations from 1,200 persona-conditioned agents and two no-persona settings, we analyze captions, justifications, and perception tags across personas. Results indicate strong convergence in captions for different personas, whereas justifications display systematic variation associated with socioeconomic and political attributes, while perception tags show no statistically significant persona-related differences, though effect trends are observed. Topic analysis further reveals that personas emphasize different evaluative themes when interpreting the same scenes.
Abstract（参考訳）: 本研究では,都市環境下での多モーダル大言語モデルによるペルソナの形状促進手法について検討する。 1200のペルソナ条件エージェントと2つの非ペルソナ設定からの59,808のアノテーションを用いて、ペルソナのキャプション、正当化、認識タグを分析した。その結果、異なる人格のキャプションに強い収束性を示す一方で、社会的・政治的属性に関連する体系的な変化を示すのに対し、知覚タグは統計的に有意な人格関連の違いを示すものではないが、効果傾向は観察されている。トピック分析は、ペルソナが同じ場面を解釈する際に異なる評価テーマを強調することを明らかにする。

関連論文リスト

Who and What? Using Linguistic Features and Annotator Characteristics to Analyze Annotation Variation [11.220035519005833]
有害な言語検出のための4つの参照データセットの大規模解析を行った。我々は,アノテータの特徴,項目の言語的特性,およびそれらの相互作用を統計的に情報を得た画像にまとめる。
論文参考訳（メタデータ） (2026-05-07T14:18:54Z)
Stable Behavior, Limited Variation: Persona Validity in LLM Agents for Urban Sentiment Perception [4.732324753420076]
我々は、ジェンダー、経済的地位、政治的指向、性格にまたがる要因的なペルソナを用いて、都市景観画像の評価を行う。その結果、ペルソナを共有するエージェント間で強い収束を示し、安定かつ再現可能な行動を示す。エージェントはまた、人間のアノテーションに共通する中間的な感情カテゴリーを崩壊させる極度のバイアスを示す。
論文参考訳（メタデータ） (2026-04-30T15:59:11Z)
Floating or Suggesting Ideas? A Large-Scale Contrastive Analysis of Metaphorical and Literal Verb-Object Constructions [53.690096725532726]
本研究では,2Mコーパス文中の297の英語動詞オブジェクト対(例:float idea vs. suggest idea)を分析した。 5つのNLPツールを用いて,感情的,語彙的,統語的,言論的な特徴を捉えた認知的・言語的特徴2,293点を抽出した。クロスペアの結果は, 語彙頻度, 凝集度, 構造規則性が高く, 比喩的文脈は感情負荷, イメージ性, 語彙多様性, 構造的特異性を示す。
論文参考訳（メタデータ） (2026-04-09T14:08:57Z)
How Annotation Trains Annotators: Competence Development in Social Influence Recognition [58.27352499161234]
本研究では,社会的影響認識の過程における能力の観点から,アノテータの作業品質の変化について検討する。この研究は、専門家と非専門家の両方を含む5つのグループから25人の注釈係が参加し、1,021の対話のデータセットに注釈を付けた。その結果,アノテータの自己認識能力と自信の増大が示唆された。
論文参考訳（メタデータ） (2026-04-03T10:32:57Z)
Experiences Build Characters: The Linguistic Origins and Functional Impact of LLM Personality [10.56924140369377]
本研究は、教師なしの方法でモデルをドメイン固有のテキストに公開するために、継続事前学習を採用する。モデル変異の性格特性を定量化し,それらの言語的スタイルと推論行動との関係を解析する。この結果は、モデル能力がバイモーダルであり、"Expressive Generalists" と "Suppressed Specialists" がピークであることを示している。
論文参考訳（メタデータ） (2026-03-06T09:42:41Z)
Personalized Image Descriptions from Attention Sequences [55.65023709100682]
異なる領域、オブジェクト、詳細をさまざまな順序で参照し、異なる言語スタイルで記述する。パーソナライズされた画像記述のための既存のモデルは、個々の視聴パターンを活用する以前の作業がなく、言語スタイルのみに焦点を当てている。我々は、パーソナライズされた視聴動作を記述生成のコアファクターとして明示的にモデル化することで、このギャップに対処する。そこで,本手法では,補助的な注意制御タスクによって誘導される言語スタイルと視聴行動の両方をキャプチャする対象埋め込みについて学習する。軽量なアダプタは,これらの埋め込みを凍結した視覚言語モデルと整合させ,再訓練を行なわずにパーソナライズすることができる。
論文参考訳（メタデータ） (2025-12-07T05:23:18Z)
Exploring Language Patterns of Prompts in Text-to-Image Generation and Their Impact on Visual Diversity [0.6445605125467574]
本研究では,プロンプト作成時にユーザが行う言語的,意味的な選択について検討する。 CivitAIプラットフォーム上のCiviverseデータセットから600万以上のプロンプトを分析します。視覚的多様性を定量化するためにVendiスコアを用いて,プロンプトにおける語彙的類似性と生成画像の視覚的類似性との間に明確な相関関係を示す。
論文参考訳（メタデータ） (2025-04-19T00:51:38Z)
Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.627729608055006]
言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文参考訳（メタデータ） (2024-04-29T17:58:36Z)
Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか? 本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文参考訳（メタデータ） (2023-10-20T03:33:36Z)
Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文参考訳（メタデータ） (2023-03-20T19:32:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。