Fugu-MT 論文翻訳(概要): Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions

論文の概要: Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions

arxiv url: http://arxiv.org/abs/2606.06443v2
Date: Mon, 08 Jun 2026 14:12:52 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:42:04.999463
Title: Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions
Title（参考訳）: 文脈の見直しとシミュレート・スタンスの変化:オンライン討論におけるLCMに基づくスタンス・シミュレーションの検証
Authors: Xinnong Zhang, Wanting Shan, Hanjia Lyu, Zhongyu Wei, Jiebo Luo,
Abstract要約: ソーシャルメディアのユーザーをシミュレートするために、大規模な言語モデルがますます使われている。 LLMに基づくスタンスシミュレーションを監査するための枠組みとして,反実的文脈修正について検討する。その結果、テキストのみの戦略とマルチモーダル戦略の両方において、効果的かつ堅牢なスタンス遷移が明らかとなった。
参考スコア（独自算出の注目度）: 62.99524765341952
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models are increasingly used to simulate social media users and infer how individuals may respond to online discussions. However, it remains unclear whether these simulations reflect precise user-specific beliefs or whether they are highly sensitive to semantically independent changes in conversational contexts. In this work, we study counterfactual context revision as a framework for auditing LLM-based stance simulation. Given an original online conversation, we first infer a target user's stance toward a specific topic. We then apply controlled revision strategies to the conversational context and simulate the user's stance again under the revised context. We compare text-only revision strategies with a multimodal one that incorporates meme-based context and evaluate two main effectiveness metrics, i.e., average directional stance shift and stance transition rate. The results reveal effective and robust stance transitions in both text-only and multimodal strategies across different polarization-preference mechanisms. Our study contributes an evaluation framework for understanding the context sensitivity of LLM-based stance simulation. More broadly, it highlights both the promise and risk of using LLMs to simulate online opinion dynamics.
Abstract（参考訳）: 大規模な言語モデルは、ソーシャルメディアのユーザーをシミュレートし、個人がオンラインの議論にどう反応するかを推測するためにますます使われている。しかし、これらのシミュレーションが正確なユーザ固有の信念を反映しているのか、あるいは会話の文脈における意味的に独立した変化に非常に敏感なのかは、まだ不明である。本研究では,LLMに基づくスタンスシミュレーションを監査するためのフレームワークとして,対実的文脈修正について検討する。元のオンライン会話を前提として、まず特定のトピックに対する対象ユーザの姿勢を推測する。次に、制御されたリビジョン戦略を会話コンテキストに適用し、リビジョンコンテキストの下でユーザのスタンスを再びシミュレートする。テキストのみのリビジョン戦略を,ミームベースのコンテキストを取り入れたマルチモーダル手法と比較し,平均姿勢シフトと姿勢遷移率の2つの主要な有効性指標を評価する。その結果、テキストのみとマルチモーダル戦略の両方において、異なる偏光-参照機構をまたいだ効果的かつ堅牢なスタンス遷移が明らかとなった。本研究は,LLMに基づくスタンスシミュレーションの文脈感度を理解するための評価枠組みに貢献する。より広義には、オンラインの意見力学をシミュレートするためにLLMを使用するという約束とリスクの両方を強調している。

関連論文リスト

From Static Context to Calibrated Interactive RL: Mitigating Distribution Shift in Multi-turn Dialogue with Aligned Simulator [33.62561779855603]
研究コミュニティの長年の目標は、高度にインタラクティブなLDMベースの対話エージェントを開発することである。最近の研究は、固定オフラインログ(Static Context RL)やプロンプトベースのシミュレータ(Interactive RL)を用いたポリシーの最適化に焦点をあてている。両パラダイムは,文脈分布シフトによって根本的に制限されていることを示す。本稿では,対話型RLとシミュレータアライメントを結合した統合フレームワークCalibrated Interactive RLを提案する。
論文参考訳（メタデータ） (2026-05-26T00:25:12Z)
Do LLM-Driven Agents Exhibit Engagement Mechanisms? Controlled Tests of Information Load, Descriptive Norms, and Popularity Cues [28.621781661498545]
テストケースとしてソーシャルメディア上での情報エンゲージメントを用いて,LCMによるシミュレーションが確実にサポートできることを評価する。 Weiboのような環境では、情報負荷や記述規範を操作しつつ、人気度を内在的に進化させる。これらの制御された変動の下では、単に可塑性トレースを生成するのではなく、理論的に解釈可能な方法でシミュレートされた振る舞いが変化するかどうかを問う。
論文参考訳（メタデータ） (2026-03-21T18:50:22Z)
Simulation-in-the-Reasoning (SiR): A Conceptual Framework for Empirically Grounded AI in Autonomous Transportation [0.0]
本稿では,Large Language Models (LLMs) 推論ループに直接ドメイン固有シミュレータを組み込む,新しい概念フレームワークSiRを紹介する。私たちは、SiRが自律輸送システムのための信頼に値する、実証的に検証されたAIへの重要なステップであると主張している。
論文参考訳（メタデータ） (2026-03-11T00:27:13Z)
Consistently Simulating Human Personas with Multi-Turn Reinforcement Learning [52.07170679746533]
大規模言語モデル(LLM)は、セラピー、教育、社会的役割プレイといったインタラクティブな環境において、人間のユーザをシミュレートするためにますます使われています。 LLM生成対話におけるペルソナの一貫性の評価と改善のための統一的なフレームワークを提案する。我々は3つの自動メトリクス、即行一貫性、行間一貫性、Q&A一貫性を定義し、異なるタイプのペルソナドリフトをキャプチャし、それぞれが人間のアノテーションに対して検証する。
論文参考訳（メタデータ） (2025-10-31T19:40:41Z)
DEBATE: A Large-Scale Benchmark for Role-Playing LLM Agents in Multi-Agent, Long-Form Debates [10.609797175227644]
マルチエージェントロールプレイングLLM間の相互作用の信頼性を評価するための,最初の大規模実証的ベンチマークであるDEBATEを紹介する。我々は,シミュレーション群と真正群との重要な相違点を系統的に評価し,同定した。
論文参考訳（メタデータ） (2025-10-29T02:21:10Z)
LANPO: Bootstrapping Language and Numerical Feedback for Reinforcement Learning in LLMs [73.27182315028021]
LANPOは、フィードバックの役割をきれいに分離するフレームワークである。我々の研究は、歴史体験をLLM RLループに統合する堅牢な方法を提供し、より効果的でデータ効率のよい学習エージェントを作成します。
論文参考訳（メタデータ） (2025-10-18T15:51:19Z)
Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。 ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文参考訳（メタデータ） (2025-10-11T18:11:09Z)
A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.81207927088117]
PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文参考訳（メタデータ） (2025-05-20T09:13:22Z)
Dynamic benchmarking framework for LLM-based conversational data capture [0.0]
本稿では,大規模言語モデル(LLM)を評価するためのベンチマークフレームワークを提案する。生成エージェントシミュレーションを統合して、情報抽出、コンテキスト認識、適応エンゲージメントといった重要次元のパフォーマンスを評価する。その結果,不明瞭な応答を扱う場合,適応戦略によりデータの抽出精度が向上することが示唆された。
論文参考訳（メタデータ） (2025-02-04T15:47:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。