論文の概要: We Need Strong Preconditions For Using Simulations In Policy
- arxiv url: http://arxiv.org/abs/2604.07838v1
- Date: Thu, 09 Apr 2026 05:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.724929
- Title: We Need Strong Preconditions For Using Simulations In Policy
- Title(参考訳): 政策にシミュレーションを使うには強い前提条件が必要だ
- Authors: Steven Luo, Saanvi Arora, Carlos Guirado,
- Abstract要約: 個人または集団レベルの人間の行動の正確なモデルの二重利用可能性と、シミュレーション出力を検証するのが困難である。
社会規模LLMエージェントシミュレーションの3つの前提条件を提案し,議論する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simulations, and more recently LLM agent simulations, have been adopted as useful tools for policymakers to explore interventions, rehearse potential scenarios, and forecast outcomes. While LLM simulations have enormous potential, two critical challenges remain understudied: the dual-use potential of accurate models of individual or population-level human behavior and the difficulty of validating simulation outputs. In light of these limitations, we must define boundaries for both simulation developers and decision-makers to ensure responsible development and ethical use. We propose and discuss three preconditions for societal-scale LLM agent simulations: 1) do not treat simulations of marginalized populations as neutral technical outputs, 2) do not simulate populations without their participation, and 3) do not simulate without accountability. We believe that these guardrails, combined with our call for simulation development and deployment reports, will help build trust among policymakers while promoting responsible development and use of societal-scale LLM agent simulations for the public benefit.
- Abstract(参考訳): シミュレーションや近年のLLMエージェントシミュレーションは、政策立案者が介入を探索し、潜在的なシナリオをリハーサルし、結果を予測するための有用なツールとして採用されている。
LLMシミュレーションには大きな可能性があるが、個人または集団レベルの人間の行動の正確なモデルの二重利用ポテンシャルとシミュレーション出力の検証の難しさの2つの重要な課題がまだ検討されている。
これらの制限を考慮して、私たちは、責任ある開発と倫理的使用を保証するために、シミュレーション開発者と意思決定者の両方の境界を定義しなければなりません。
社会規模LLMエージェントシミュレーションの3つの前提条件を提案し,議論する。
1) 疎化人口のシミュレーションを中立的な技術出力として扱わない。
2【参加なしで人口をシミュレートしない】
3)説明責任なしではシミュレートしない。
我々は、これらのガードレールと、我々のシミュレーション開発・展開報告の要請が組み合わさって、政策立案者間の信頼の構築に役立ちつつ、公共の利益のために社会規模LLMエージェントシミュレーションの責任ある開発・活用を促進するだろうと考えている。
関連論文リスト
- Mind the Sim2Real Gap in User Simulation for Agentic Tasks [101.69142591891234]
ユーザシミュレーションにおけるSim2Realのギャップを形式化し、実際の人間に対して$$$-benchプロトコルを実行する最初の研究を示す。
LLMシミュレータは過度に協調的であり、スタイリスティックに均一であり、現実的なフラストレーションや曖昧さを欠いている。
これらの知見は, LLMベースのユーザシミュレータをエージェント開発サイクルで使用する際の人間による検証の重要性を強調した。
論文 参考訳(メタデータ) (2026-03-11T19:12:31Z) - LLM-Based Social Simulations Require a Boundary [3.351170542925928]
大規模言語モデル(LLM)に基づく社会シミュレーションは明確な境界を確立するべきである。
本稿では、アライメント(実世界のパターンにマッチするシミュレーション行動)、一貫性(時間とともに一貫性のあるエージェント動作を維持する)、堅牢性という3つの重要な境界問題について検討する。
論文 参考訳(メタデータ) (2025-06-24T17:14:47Z) - YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models [50.35333054932747]
本稿では,YuLan-OneSimというソーシャルシミュレータを紹介する。
ユーザは、シミュレータとの自然言語インタラクションを通じて、シミュレーションシナリオを記述し、洗練することができます。
我々は、経済学、社会学、政治、心理学、組織、人口統計学、法律、コミュニケーションを含む8つの領域にまたがる50のデフォルトシミュレーションシナリオを実装した。
論文 参考訳(メタデータ) (2025-05-12T14:05:17Z) - From ChatGPT to DeepSeek: Can LLMs Simulate Humanity? [32.93460040317926]
大規模言語モデル(LLM)は、複雑な人間の社会的行動を探究するための有望な方法となっている。
最近の研究では、シミュレートされた相互作用と現実世界の相互作用の相違が強調されている。
論文 参考訳(メタデータ) (2025-02-25T13:54:47Z) - GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.00666003559324]
我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文 参考訳(メタデータ) (2024-10-06T05:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。