論文の概要: Towards Trust Calibration in Socially Interactive Agents: Investigating Gendered Multimodal Behaviors Generation with LLMs
- arxiv url: http://arxiv.org/abs/2605.19798v1
- Date: Tue, 19 May 2026 12:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.347697
- Title: Towards Trust Calibration in Socially Interactive Agents: Investigating Gendered Multimodal Behaviors Generation with LLMs
- Title(参考訳): 社会的対話型エージェントにおける信頼の校正に向けて--LPMを用いたジェンダー型マルチモーダル行動生成の検討
- Authors: Lucie Galland, Chloé Clavel, Magalie Ochs,
- Abstract要約: GPT-5.4は様々なモードでコヒーレントな振舞いを生成できることを示す。
また、ジェンダーがプロンプトで特定されると、LDMは社会的ジェンダーステレオタイプを再現する傾向がある。
- 参考スコア(独自算出の注目度): 8.21736236281494
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As Socially Interactive Agents (SIAs) become increasingly integrated into daily life, the ability to calibrate user trust to an agent's actual capabilities would help ensure appropriate usage of these agents. In this paper, we explore the capacity of Large Language Models (LLMs) to generate multimodal behaviors (verbal, vocal, gestural, and facial expression modalities) that reflect varying levels of ability and benevolence, two key dimensions of trustworthiness. We propose a novel method for automatically generating behaviors aligned with specific levels of these traits, a first step towards enabling nuanced and trust-calibrated interactions. By analyzing a large dataset of multimodal transcripts generated by LLMs, we demonstrate that GPT-5.4 is able to produce coherent behavior across different modalities (text, intonation, facial expression, and gesture). Using Random Forest feature importance analysis, we show that the generated behaviors align with theoretical expectations for ability and benevolence. However, we also find that when gender is specified in the prompt, LLMs tend to reproduce societal gender stereotypes, associating male agents' behaviors with high ability and female agents' behaviors with high benevolence. To validate our approach, we conducted a user study on Prolific using a within-subjects design. Participants perceived different levels of ability and benevolence in the generated behaviors align with the intended instructions.
- Abstract(参考訳): Socially Interactive Agents (SIAs) が日々の生活に統合されるにつれて、エージェントの実際の能力に対するユーザの信頼を調整できる能力は、これらのエージェントの適切な使用を確実にする助けとなる。
本稿では,言語モデル(LLM)の多言語行動(言語,声,ジェスチャー,表情のモダリティ)を生成する能力について検討する。
本稿では,これらの特徴の特定のレベルに沿った行動を自動的に生成する手法を提案する。
GPT-5.4 は LLM が生成する多モーダル文字の大規模なデータセットを解析することにより,様々なモダリティ(テキスト,イントネーション,表情,ジェスチャー)にまたがるコヒーレントな振る舞いを生成できることを実証する。
ランダムフォレストの特徴的重要度分析を用いて, 生成した行動は, 能力とベネバンスに対する理論的期待と一致していることを示す。
しかし, ジェンダーがプロンプトで特定されると, LLMは社会的ジェンダーのステレオタイプを再現し, 男性エージェントの行動と女性エージェントの行動と高いベネヴァンスを関連付ける傾向にあることがわかった。
提案手法の有効性を検証するために,本研究では,内部オブジェクト設計を用いたProlificのユーザスタディを行った。
参加者は、生成された行動における能力とベネヴァンスの異なるレベルが意図された指示と一致していると認識した。
関連論文リスト
- LLMs Reading the Rhythms of Daily Life: Aligned Understanding for Behavior Prediction and Generation [53.62804271492357]
大きな言語モデル(LLM)は、その意味的豊かさ、強い解釈可能性、生成能力により、有望な方向性を提供する。
本稿では,LLMを構造化カリキュラム学習プロセスを通じて人間行動モデリングに統合する,行動理解アライメント(BUA)を提案する。
BUAは、事前訓練された行動モデルからのシーケンス埋め込みをアライメントアンカーとして採用し、3段階のカリキュラムを通じてLLMをガイドし、マルチラウンドの対話設定では予測と生成機能を導入している。
論文 参考訳(メタデータ) (2026-04-26T07:34:37Z) - Agent-to-Agent Theory of Mind: Testing Interlocutor Awareness among Large Language Models [15.988426837549248]
大規模言語モデル(LLM)は、マルチエージェントやヒューマンAIシステムに統合されつつある。
本稿では,対話相手の同一性と特徴を識別し,適応する能力について定式化する。
GPT や Claude など,LLM が同一家族の同族や著名なモデルファミリを確実に識別できることを示す。
論文 参考訳(メタデータ) (2025-06-28T17:22:59Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Rethinking ChatGPT's Success: Usability and Cognitive Behaviors Enabled by Auto-regressive LLMs' Prompting [5.344199202349884]
本研究では,2種類の大規模言語モデルと6種類のタスク固有チャネルにおけるモーダル性の構造を分析した。
本研究では,LLMにおける多様な認知行動の刺激について,自由形テキストと言語文脈の導入を通して検討する。
論文 参考訳(メタデータ) (2024-05-17T00:19:41Z) - MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration [98.18244218156492]
大規模言語モデル(LLM)は、非常に高度な自然言語処理を持つ。
アプリケーションがマルチエージェント環境に拡大するにつれて、包括的な評価フレームワークの必要性が生じる。
この研究は、マルチエージェント設定内でLLMを評価するための新しい競合ベースのベンチマークフレームワークを導入している。
論文 参考訳(メタデータ) (2023-11-14T21:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。