論文の概要: Characterizing the ability of LLMs to recapitulate Americans' distributional responses to public opinion polling questions across political issues
- arxiv url: http://arxiv.org/abs/2603.20229v1
- Date: Fri, 06 Mar 2026 01:53:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.916248
- Title: Characterizing the ability of LLMs to recapitulate Americans' distributional responses to public opinion polling questions across political issues
- Title(参考訳): LLMの政治的問題に対する世論調査に対するアメリカ人の分布的反応を再現する能力の特徴付け
- Authors: Eric Gong, Nathan E. Sanders, Bruce Schneier,
- Abstract要約: 大規模言語モデルは、ポーリングの文脈における人間の人口研究を増強する可能性に注意を向けている。
我々は,多票政治問題に対する質問に対する人間の反応を予測するための新しい枠組みを提案し,実装する。
提案手法は,個別クエリよりも低コストで精度の高い予測を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional survey-based political issue polling is becoming less tractable due to increasing costs and risk of bias associated with growing non-response rates and declining coverage of key demographic groups. With researchers and pollsters seeking alternatives, Large Language Models have drawn attention for their potential to augment human population studies in polling contexts. We propose and implement a new framework for anticipating human responses on multiple-choice political issue polling questions by directly prompting an LLM to predict a distribution of responses. By comparison to a large and high quality issue poll of the US population, the Cooperative Election Study, we evaluate how the accuracy of this framework varies across a range of demographics and questions on a variety of topics, as well as how this framework compares to previously proposed frameworks where LLMs are repeatedly queried to simulate individual respondents. We find the proposed framework consistently exhibits more accurate predictions than individual querying at significantly lower cost. In addition, we find the performance of the proposed framework varies much more systematically and predictably across demographics and questions, making it possible for those performing AI polling to better anticipate model performance using only information available before a query is issued.
- Abstract(参考訳): 従来の調査に基づく政治問題調査は、非反応率の増加と主要な人口集団のカバー率の減少に伴うコストの増大と偏見のリスクにより、より魅力的になってきている。
研究者や世論調査者が代替手段を求める中で、Large Language Modelsは、世論調査における人間の人口調査を増やす可能性に注意を向けている。
我々は,LLMに応答の分布を予測するよう直接促すことで,多票政治問題ポーリング質問に対する人間の反応を予測する新しい枠組みを提案し,実装する。
本研究は、米国住民の大規模かつ高品質な課題調査である協同選挙研究(Cooperative Election Study)と比較し、この枠組みの正確さが、様々なトピックに関する様々な人口統計や質問によってどのように異なるかを評価するとともに、従来提案されていたLCMを個別の回答者をシミュレートするために繰り返しクエリしたフレームワークと比較した。
提案手法は,個別クエリよりも低コストで精度の高い予測を行う。
さらに、提案フレームワークの性能は、人口統計や質問によってより体系的に、予測的に変化しており、AIポーリングを実行している人は、クエリが発行される前に利用可能な情報のみを使用して、モデルパフォーマンスをより正確に予測することが可能である。
関連論文リスト
- Evidence-based Distributional Alignment for Large Language Models [58.65469623911573]
LLM分布推定の忠実度とロバスト性を改善する証拠に基づくアライメント手法であるEvi-DAを提案する。
対象国が与えられた場合、Evi-DAは関連するWorld Values Survey項目とその回答分布を検索し、オプション毎に粗いヴェルツェル値シグネチャを予測し、国条件の回答分布を構造化形式で推測する。
論文 参考訳(メタデータ) (2026-03-03T03:34:06Z) - Whom to Query for What: Adaptive Group Elicitation via Multi-Turn LLM Interactions [13.900123583700472]
エージェントが明示的なクエリと参加予算の下で、質問と回答者の両方を適応的に選択するマルチラウンド・セッティングであるアダプティブ・グループ・エリケーション(Adaptive group elicitation)について検討する。
提案手法は, (i) LLMに基づく予測情報取得目標と (ii) 不均一なグラフニューラルネットワークの伝搬を組み合わせ, 観測された応答と属性を集約し, 欠落した応答をインプットし, 丸ごとの応答選択をガイドする。
実世界の3つの世論データセット全体で、我々の手法は、制約された予算下での人口レベルの反応予測を継続的に改善します。
論文 参考訳(メタデータ) (2026-02-15T19:05:34Z) - Prompts to Proxies: Emulating Human Preferences via a Compact LLM Ensemble [46.82793004650415]
大規模言語モデル(LLM)は、様々なタスクにまたがる人間のような応答をエミュレートする可能性を実証している。
本研究では,LLMをエージェントプロキシとして扱う新しいアライメントフレームワークを提案する。
我々は、構造化されたプロンプトエンジニアリング、エントロピーに基づくサンプリング、回帰に基づく選択を用いて、LLMエージェントを代表的行動パターンに向けて操るシステムであるP2Pを紹介する。
論文 参考訳(メタデータ) (2025-09-14T15:08:45Z) - Language Model Fine-Tuning on Scaled Survey Data for Predicting Distributions of Public Opinions [4.020002996724124]
大規模言語モデル(LLM)は、調査設計の初期段階において、事前に調査応答を予測する。
本研究では, 調査データの特異な構造特性を利用して, 応答分布を推定するために, 直接微調整LLMを提案する。
本研究では,SubPOPの微調整により,様々なサブポピュレーションにおけるLLM予測と人間の反応の一致が大幅に改善されることを示す。
論文 参考訳(メタデータ) (2025-02-24T00:31:33Z) - Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.908708778200115]
我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文 参考訳(メタデータ) (2025-02-10T21:59:27Z) - Large Language Models (LLMs) as Agents for Augmented Democracy [6.491009626125319]
我々は、市民の嗜好に関するデータを増やすために、既成のLLMを微調整した拡張民主主義システムについて検討する。
被験者の個人の政治的選択と参加者の全サンプルの集合的選好の両方をLLMが予測する精度を推定するために、列車試験のクロスバリデーション・セットアップを使用する。
論文 参考訳(メタデータ) (2024-05-06T13:23:57Z) - Large Language Models Are Not Robust Multiple Choice Selectors [117.72712117510953]
複数選択質問(MCQ)は、大規模言語モデル(LLM)の評価において、一般的なが重要なタスク形式として機能する。
この研究は、現代のLLMが、その固有の「選択バイアス」によるオプション位置変化に対して脆弱であることを示している。
そこで本研究では,オプションIDに対する事前バイアスを全体予測分布から分離するPriDeという,ラベルのない推論時間脱バイアス手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T17:44:56Z) - Predicting Survey Response with Quotation-based Modeling: A Case Study
on Favorability towards the United States [0.0]
そこで我々は,機械学習を用いて探索応答を推定する先駆的手法を提案する。
我々は、さまざまな国籍の個人から引用された膨大なコーパスを活用して、彼らの好意のレベルを抽出する。
自然言語処理技術と機械学習アルゴリズムを組み合わせて,質問応答の予測モデルを構築した。
論文 参考訳(メタデータ) (2023-05-23T14:11:01Z) - MS-Ranker: Accumulating Evidence from Potentially Correct Candidates for
Answer Selection [59.95429407899612]
そこで我々は,MS-Ranker という,新しい強化学習に基づくマルチステップランキングモデルを提案する。
我々は、候補の潜在的な正しさを明示的に考慮し、ゲーティング機構で証拠を更新する。
我々のモデルは、外部リソースに依存しない既存の手法を著しく上回ります。
論文 参考訳(メタデータ) (2020-10-10T10:36:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。