論文の概要: DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views
- arxiv url: http://arxiv.org/abs/2603.10018v1
- Date: Sun, 22 Feb 2026 09:00:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-15 16:38:22.573273
- Title: DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views
- Title(参考訳): DeliberationBench: 大規模言語モデルがユーザ視点に与える影響の規範的ベンチマーク
- Authors: Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx,
- Abstract要約: 大型言語モデル(LLM)は、アシスタントや思考パートナーとして広く普及している。
ユーザの信念に対する説得力のある影響を特徴づけることが重要である。
LLMの影響を評価するためのベンチマークであるDeliberationBenchを提案する。
- 参考スコア(独自算出の注目度): 0.3490064670707313
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As large language models (LLMs) become pervasive as assistants and thought partners, it is important to characterize their persuasive influence on users' beliefs. However, a central challenge is to distinguish "beneficial" from "harmful" forms of influence, in a manner that is normatively defensible and legitimate. We propose DeliberationBench, a benchmark for assessing LLM influence that takes the process of deliberative opinion polling as its standard. We demonstrate our approach in a preregistered randomized experiment in which 4,088 U.S. participants discussed 65 policy proposals with six frontier LLMs. Using opinion change data from four prior Deliberative Polls conducted by the Deliberative Democracy Lab, we find evidence that the tested LLMs' influence is substantial in magnitude and positively associated with the net opinion shifts following deliberation, suggesting that these models exert broadly epistemically desirable effects. We further explore differential influence between topic areas, demographic subgroups, and models. Our framework can function as an evaluation and monitoring tool, helping to ensure that the influence of LLMs remains consistent with democratically legitimate standards, and preserves users' autonomy in forming their views.
- Abstract(参考訳): 大規模言語モデル(LLM)がアシスタントや思考パートナーとして普及するにつれ,ユーザの信念に対する説得力のある影響を特徴づけることが重要である。
しかし、中心的な課題は「利益」と「有害」な影響の形式を、規範的に防御可能で正当な方法で区別することである。
本稿では, LLM の影響評価ベンチマークである DeliberationBench を提案する。
我々は、米国参加者4,088人が6つのフロンティアLSMで65の政策提案について議論した事前登録ランダム化実験において、我々のアプローチを実証した。
本研究は, 自由主義的民主主義研究所(Deliberative Democracy Lab)が実施した4つの事前審議票の意見変化データを用いて, LLMs の影響が大規模であり, 熟考後の純意見変化と正の相関関係があることを実証し, これらのモデルが広く認識学的に望ましい効果を示すことを示唆する。
さらに、トピック領域、人口統計サブグループ、モデル間の差分の影響について検討する。
我々のフレームワークは、評価・監視ツールとして機能し、LLMの影響が民主的に合法な標準と一致し続けることを保証するのに役立ち、ビューの形成におけるユーザの自律性を維持する。
関連論文リスト
- Think Again! The Effect of Test-Time Compute on Preferences, Opinions, and Beliefs of Large Language Models [6.9347404883379316]
大規模言語モデル(LLM)は、ますます人間の生活に統合され、意思決定に影響を及ぼしている。
主観的嗜好、意見、信念をどの程度、どの程度提示するかを評価することが不可欠である。
本稿では、社会的、文化的、倫理的、個人的領域にまたがるLLMの主観的傾向を評価するために、POB(Preference, Opinion, and Belief Survey)を提案する。
論文 参考訳(メタデータ) (2025-05-26T07:41:21Z) - Diverging Preferences: When do Annotators Disagree and do Models Know? [92.24651142187989]
我々は,4つのハイレベルクラスにまたがる10のカテゴリにまたがる相違点の分類法を開発した。
意見の相違の大部分は、標準的な報酬モデリングアプローチに反対している。
本研究は,選好の変化を識別し,評価とトレーニングへの影響を緩和する手法を開発する。
論文 参考訳(メタデータ) (2024-10-18T17:32:22Z) - Evaluating Interventional Reasoning Capabilities of Large Language Models [58.52919374786108]
大規模言語モデル(LLM)は意思決定タスクを自動化するために使用される。
本稿では,LPMが介入に応じてデータ生成プロセスの知識を正確に更新できるかどうかを評価する。
さまざまな因果グラフ(例えば、コンバウンディング、仲介)と変数タイプにまたがるベンチマークを作成します。
これらのベンチマークにより、LLMが事実を記憶したり、他のショートカットを見つけたりすることで、変化を正確に予測する能力を切り離すことができます。
論文 参考訳(メタデータ) (2024-04-08T14:15:56Z) - Prompting Fairness: Integrating Causality to Debias Large Language Models [19.76215433424235]
大規模言語モデル(LLM)は偏見や差別的な反応を生じさせる可能性がある。
社会的偏見に対処するための因果性誘導型脱バイアスフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-13T17:46:28Z) - Political Compass or Spinning Arrow? Towards More Meaningful Evaluations for Values and Opinions in Large Language Models [61.45529177682614]
我々は,大規模言語モデルにおける価値と意見の制約評価パラダイムに挑戦する。
強制されない場合、モデルが実質的に異なる答えを与えることを示す。
我々はこれらの知見をLLMの価値と意見を評価するための推奨とオープンな課題に抽出する。
論文 参考訳(メタデータ) (2024-02-26T18:00:49Z) - Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。
本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。
観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文 参考訳(メタデータ) (2023-11-15T00:02:25Z) - From Values to Opinions: Predicting Human Behaviors and Stances Using
Value-Injected Large Language Models [10.520548925719565]
本稿では,価値注入型大言語モデル(LLM)を用いて意見や行動を予測することを提案する。
VIMの有効性を検証するために,4つのタスクについて一連の実験を行った。
以上の結果から,基本的アプローチよりも価値注入型LCMの方が,意見や行動の予測が優れていることが示唆された。
論文 参考訳(メタデータ) (2023-10-27T02:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。