論文の概要: SOTOPIA-S4: a user-friendly system for flexible, customizable, and large-scale social simulation
- arxiv url: http://arxiv.org/abs/2504.16122v1
- Date: Sat, 19 Apr 2025 20:02:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.845817
- Title: SOTOPIA-S4: a user-friendly system for flexible, customizable, and large-scale social simulation
- Title(参考訳): SOTOPIA-S4: 柔軟性、カスタマイズ性、大規模社会シミュレーションのためのユーザフレンドリーなシステム
- Authors: Xuhui Zhou, Zhe Su, Sophie Feng, Jiaxu Zhou, Jen-tse Huang, Hsien-Te Kao, Spencer Lynch, Svitlana Volkova, Tongshuang Sherry Wu, Anita Woolley, Hao Zhu, Maarten Sap,
- Abstract要約: 本稿では,高速でフレキシブルでスケーラブルな社会シミュレーションシステムであるSOTOPIA-S4を提案する。
SOTOPIA-S4は、シミュレーションエンジン、シミュレーション管理用のフレキシブルAPIを備えたAPIサーバ、Webインターフェースを含む、pipパッケージとして提供される。
本稿では,SOTOPIA-S4の有用性を2つのユースケースで示す。
- 参考スコア(独自算出の注目度): 25.405455245230456
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social simulation through large language model (LLM) agents is a promising approach to explore and validate hypotheses related to social science questions and LLM agents behavior. We present SOTOPIA-S4, a fast, flexible, and scalable social simulation system that addresses the technical barriers of current frameworks while enabling practitioners to generate multi-turn and multi-party LLM-based interactions with customizable evaluation metrics for hypothesis testing. SOTOPIA-S4 comes as a pip package that contains a simulation engine, an API server with flexible RESTful APIs for simulation management, and a web interface that enables both technical and non-technical users to design, run, and analyze simulations without programming. We demonstrate the usefulness of SOTOPIA-S4 with two use cases involving dyadic hiring negotiation and multi-party planning scenarios.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントによる社会シミュレーションは、社会科学問題やLLMエージェントの行動に関連する仮説を探求し、検証するための有望なアプローチである。
SOTOPIA-S4は、高速で柔軟でスケーラブルな社会シミュレーションシステムで、現在のフレームワークの技術的障壁に対処しつつ、仮説テストのためのカスタマイズ可能な評価指標とマルチターンおよびマルチパーティLSMベースのインタラクションを生成する。
SOTOPIA-S4は、シミュレーションエンジン、シミュレーション管理のためのフレキシブルなRESTful APIを備えたAPIサーバ、および技術系と非技術系の両方のユーザがプログラミングなしでシミュレーションを設計、実行、分析できるWebインターフェースを含む、pipパッケージとして提供される。
本稿では,SOTOPIA-S4の有用性を2つのユースケースで示す。
関連論文リスト
- LLM-Agents Driven Automated Simulation Testing and Analysis of small Uncrewed Aerial Systems [11.183147511573717]
小型無人航空機の正確な挙動を検証するためには, 粗いシミュレーション試験が重要である。
開発者をサポートするために様々なsUASシミュレーションツールが存在するが、シミュレーションテストの作成、実行、分析のプロセス全体が、手作業で面倒な作業である。
複数のLLMエージェントが協調してsUASシミュレーションテストプロセスをサポートするフレームワークであるAutoSimTestを提案する。
論文 参考訳(メタデータ) (2025-01-21T03:42:21Z) - GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.00666003559324]
我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文 参考訳(メタデータ) (2024-10-06T05:02:23Z) - LLM experiments with simulation: Large Language Model Multi-Agent System for Simulation Model Parametrization in Digital Twins [4.773175285216063]
本稿では,大規模言語モデル(LLM)を適用し,デジタル双生児におけるシミュレーションモデルのパラメトリゼーションを自動化する新しいフレームワークを提案する。
提案手法は,LLMの知識を取り入れたシミュレーションモデルのユーザビリティを向上させる。
このシステムは、ユーザのフレンドリさを高め、人間のユーザの認知負荷を軽減する可能性がある。
論文 参考訳(メタデータ) (2024-05-28T11:59:40Z) - BASES: Large-scale Web Search User Simulation with Large Language Model
based Agents [108.97507653131917]
BASESは、大きな言語モデル(LLM)を持つ新しいユーザーシミュレーションフレームワークである。
シミュレーションフレームワークは,大規模に独自のユーザプロファイルを生成することができ,その結果,多様な検索行動が生まれる。
WARRIORSは、中国語と英語の両方のバージョンを含む、Web検索ユーザ行動を含む、新しい大規模なデータセットである。
論文 参考訳(メタデータ) (2024-02-27T13:44:09Z) - GPT-Based Models Meet Simulation: How to Efficiently Use Large-Scale
Pre-Trained Language Models Across Simulation Tasks [0.0]
本稿では,科学シミュレーションにおける大規模事前学習言語モデルの利用に関する最初の研究である。
最初の課題は参加者の関与を促進する概念モデルの構造を説明することである。
第2のタスクはシミュレーション出力の要約に重点を置いており、モデルユーザーが望ましいシナリオを識別できるようにしている。
第3の課題は、シミュレーションの可視化の洞察をテキストで伝えることによって、シミュレーションプラットフォームへのアクセシビリティの拡大を目指している。
論文 参考訳(メタデータ) (2023-06-21T15:42:36Z) - User Behavior Simulation with Large Language Model based Agents [116.74368915420065]
LLMベースのエージェントフレームワークを提案し,実際のユーザ動作をシミュレートするサンドボックス環境を設計する。
実験結果から,本手法のシミュレーション行動は実人の行動に非常に近いことが判明した。
論文 参考訳(メタデータ) (2023-06-05T02:58:35Z) - Synthetic Data-Based Simulators for Recommender Systems: A Survey [55.60116686945561]
本調査は,モデリングとシミュレーションの分野における最近のトレンドを包括的に概観することを目的としている。
まずは、シミュレーターを実装するフレームワークの開発の背後にあるモチベーションから始めます。
我々は,既存のシミュレータの機能,近似,産業的有効性に基づいて,新しい一貫した一貫した分類を行う。
論文 参考訳(メタデータ) (2022-06-22T19:33:21Z) - Metaphorical User Simulators for Evaluating Task-oriented Dialogue
Systems [80.77917437785773]
タスク指向対話システム(TDS)は、主にオフラインまたは人間による評価によって評価される。
本稿では,エンド・ツー・エンドのTDS評価のためのメタファ型ユーザシミュレータを提案する。
また,異なる機能を持つ対話システムなどの変種を生成するためのテスタベースの評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-02T05:11:03Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。