Fugu-MT 論文翻訳(概要): SOTOPIA-$Ω$: Dynamic Strategy Injection Learning and Social Instruction Following Evaluation for Social Agents

論文の概要: SOTOPIA-$Ω$: Dynamic Strategy Injection Learning and Social Instruction Following Evaluation for Social Agents

arxiv url: http://arxiv.org/abs/2502.15538v3
Date: Thu, 29 May 2025 08:54:31 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-30 15:42:33.302941
Title: SOTOPIA-$Ω$: Dynamic Strategy Injection Learning and Social Instruction Following Evaluation for Social Agents
Title（参考訳）: SOTOPIA-$Ω$:ダイナミックストラテジーインジェクション学習とソーシャルインストラクション : ソーシャルエージェントの評価
Authors: Wenyuan Zhang, Tianyun Liu, Mengxiao Song, Xiaodong Li, Tingwen Liu,
Abstract要約: 本稿では,言語エージェントの社会的能力向上のための枠組みを提案する。本稿では,ソーシャルインストラクション・フォロー(S-IF)の概念を導入し,新しい2つのS-IF評価指標を提案する。質の高いコーパスで訓練された複数の7Bモデルが,社会目標達成において,専門家エージェント(GPT-4)をはるかに上回るだけでなく,その達成に寄与することが実証された。
参考スコア（独自算出の注目度）: 16.320531397370008
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite the abundance of prior social strategies possessed by humans, there remains a paucity of research dedicated to their transfer and integration into social agents. Our proposed SOTOPIA-$\Omega$ framework aims to address and bridge this gap, with a particular focus on enhancing the social capabilities of language agents. This framework dynamically injects multi-step reasoning strategies inspired by negotiation theory and two simple direct strategies into expert agents, thereby automating the construction of a high-quality social dialogue training corpus. Additionally, we introduce the concept of Social Instruction Following (S-IF) and propose two new S-IF evaluation metrics that complement social capability. We demonstrate that several 7B models trained on high-quality corpus not only significantly surpass the expert agent (GPT-4) in achieving social goals but also enhance S-IF performance. Analysis and variant experiments validate the advantages of dynamic construction, which can especially break the agent's prolonged deadlock.
Abstract（参考訳）: 人類が持つ以前の社会戦略が豊富にあるにもかかわらず、社会エージェントへの移動と統合を専門とする研究の質は相変わらず残っている。提案するSOTOPIA-$\Omega$フレームワークは,言語エージェントの社会的能力向上に着目し,このギャップに対処し,橋渡しすることを目的としている。この枠組みは,交渉理論に着想を得た多段階的推論戦略と2つの簡単な直接戦略を専門家に動的に注入し,高品質な対話学習コーパスの構築を自動化する。さらに,ソーシャルインストラクションフォロー(S-IF)の概念を導入し,社会的能力を補完する2つの新しいS-IF評価指標を提案する。高品質コーパスで訓練された複数の7Bモデルが,社会目標達成において専門家エージェント(GPT-4)をはるかに上回るだけでなく,S-IF性能も向上することを示した。解析および変種実験は、動的構成の利点を検証し、特にエージェントの長いデッドロックを壊す可能性がある。

関連論文リスト

Simulating Generative Social Agents via Theory-Informed Workflow Design [11.992123170134185]
社会エージェントのための体系的設計プロセスを提供する理論インフォームド・フレームワークを提案する。私たちのフレームワークは、社会的認知理論の原則に基づいており、モチベーション、行動計画、学習という3つの重要なモジュールを導入しています。実験により, 複雑な条件下での現実的な人間の行動パターンを再現できることが実証された。
論文参考訳（メタデータ） (2025-08-12T08:14:48Z)
Sotopia-RL: Reward Design for Social Intelligence [52.59432715228559]
Sotopia-RLは、粗いエピソードレベルのフィードバックを発話レベル、多次元報酬に洗練する新しいフレームワークである。オープンエンドの社会学習環境であるソトピアにおける実験は、ソトピア-RLが最先端の社会目標達成スコアを達成することを示した。
論文参考訳（メタデータ） (2025-08-05T20:43:42Z)
LLM Economist: Large Population Models and Mechanism Design in Multi-Agent Generative Simulacra [29.627070781534698]
本稿では,エージェント・ベース・モデリングを用いて経済政策を設計・評価する新しい枠組みを提案する。下位レベルでは、有界な労働者エージェントは、テキストベースのユーティリティ関数をテキストで学習するために労働供給を選択する。上位のレベルでは、プランナーエージェントは、現在の連邦政府の括弧に固定された一貫した境界税制を提案するために、文脈内強化学習を採用する。
論文参考訳（メタデータ） (2025-07-21T17:21:14Z)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。 EPOはオープンなアクション空間で戦略を提供し、任意のLLMエージェントにプラグインすることで、ゴール指向の振る舞いを動機付けることができる。社会的および物理的領域にわたる実験は、EPOの長期的なゴールアライメント能力を示す。
論文参考訳（メタデータ） (2025-02-18T03:15:55Z)
AgentSense: Benchmarking Social Intelligence of Language Agents through Interactive Scenarios [38.878966229688054]
本稿では,対話型シナリオを通して言語エージェントのソーシャルインテリジェンスをベンチマークするAgensSenseを紹介する。ドラマティック理論に基づいて、エージェントセンスは、広範なスクリプトから構築された1,225の多様な社会的シナリオを作成するためにボトムアップアプローチを採用している。我々はERG理論を用いて目標を分析し、包括的な実験を行う。以上の結果から,LPMは複雑な社会シナリオ,特に高レベルの成長ニーズにおいて,目標達成に苦慮していることが明らかとなった。
論文参考訳（メタデータ） (2024-10-25T07:04:16Z)
SocialGFs: Learning Social Gradient Fields for Multi-Agent Reinforcement Learning [58.84311336011451]
マルチエージェント強化学習のための新しい勾配に基づく状態表現を提案する。オフラインサンプルからソーシャルグラデーションフィールド(SocialGF)を学習するために,デノジングスコアマッチングを採用している。実際に、SocialGFをMAPPOなど、広く使われているマルチエージェント強化学習アルゴリズムに統合する。
論文参考訳（メタデータ） (2024-05-03T04:12:19Z)
SOTOPIA-$π$: Interactive Learning of Socially Intelligent Language Agents [73.35393511272791]
本稿では,対話型学習手法であるSOTOPIA-$pi$を提案する。この手法は,大規模言語モデル(LLM)の評価に基づいて,フィルタリングされた社会的相互作用データに対する行動クローニングと自己強化トレーニングを活用する。
論文参考訳（メタデータ） (2024-03-13T17:17:48Z)
Emergence of Social Norms in Generative Agent Societies: Principles and Architecture [8.094425852451643]
生成型MASにおける社会的規範の出現を促進するために,CRSECという新しいアーキテクチャを提案する。私たちのアーキテクチャは、創造と表現、スプレッド、評価、コンプライアンスの4つのモジュールで構成されています。本実験は,生産型MASにおける社会的規範の確立と社会的対立の低減を図ったものである。
論文参考訳（メタデータ） (2024-03-13T05:08:10Z)
K-Level Reasoning: Establishing Higher Order Beliefs in Large Language Models for Strategic Reasoning [76.3114831562989]
マルチエージェント環境で戦略を動的に適応させるためには、LLM(Large Language Model)エージェントが必要である。我々は,「K-Level Reasoning with Large Language Models (K-R)」という新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-02T16:07:05Z)
SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。 GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文参考訳（メタデータ） (2023-10-18T02:27:01Z)
Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View [60.80731090755224]
本稿では,理論的洞察を用いた実用実験により,現代NLPシステム間の協調機構を解明する。我々は, LLMエージェントからなる4つの独特な社会をつくり, それぞれのエージェントは, 特定の特性(容易性, 過信性)によって特徴づけられ, 異なる思考パターン(議論, ふりかえり)と協調する。以上の結果から, LLMエージェントは, 社会心理学理論を反映した, 適合性やコンセンサスリーディングといった人間的な社会的行動を示すことが明らかとなった。
論文参考訳（メタデータ） (2023-10-03T15:05:52Z)
Towards socially-competent and culturally-adaptive artificial agents Expressive order, interactional disruptions and recovery strategies [0.0]
この研究の総体的目的は、人工エージェントをダイアド的相互作用よりも社会的に競争力のあるものにするための枠組みを構築することである。本稿は,(i)社会的能力,(ii)関係的役割,(iii)近接性の3次元に焦点をあてて,この能力レベルがいかに達成されるかを強調した。
論文参考訳（メタデータ） (2023-08-06T15:47:56Z)
Training Socially Aligned Language Models on Simulated Social Interactions [99.39979111807388]
AIシステムにおける社会的アライメントは、確立された社会的価値に応じてこれらのモデルが振舞うことを保証することを目的としている。現在の言語モデル(LM)は、トレーニングコーパスを独立して厳格に複製するように訓練されている。本研究は,シミュレートされた社会的相互作用からLMを学習することのできる,新しい学習パラダイムを提案する。
論文参考訳（メタデータ） (2023-05-26T14:17:36Z)
Towards Social Identity in Socio-Cognitive Agents [0.0]
認知社会フレームの概念に基づく社会認知エージェントモデルを提案する。認知社会フレームは、社会集団を中心に構築され、社会集団のダイナミックス機構と社会的アイデンティティの構成の基礎を形成する。
論文参考訳（メタデータ） (2020-01-20T15:27:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。