論文の概要: The Algorithmic Caricature: Auditing LLM-Generated Political Discourse Across Crisis Events
- arxiv url: http://arxiv.org/abs/2605.12452v1
- Date: Tue, 12 May 2026 17:42:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:57.061146
- Title: The Algorithmic Caricature: Auditing LLM-Generated Political Discourse Across Crisis Events
- Title(参考訳): アルゴリズム・カリキュア:危機イベントにおけるLLM生成政治談話の聴取
- Authors: Gunjan, Sidahmed Benabderrahmane, Talal Rahwan,
- Abstract要約: 9つの危機イベントにまたがって1,789,406件のコーパスを構築した。
各事象について、同じ文脈で生成された合成談話と、社会的プラットフォームからの観察された談話を比較した。
イベント全体を通じて、合成談話は流動的であるが、人口レベルでは非現実的である。
- 参考スコア(独自算出の注目度): 1.0666869578393299
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models (LLMs) can generate fluent political text at scale, raising concerns about synthetic discourse during crises and social conflict. Existing AI-text detection often focuses on sentence-level cues such as perplexity, burstiness, or token irregularities, but these signals may weaken as generative systems improve. We instead adopt a Computational Social Science perspective and ask whether synthetic political discourse behaves like an observed online population. We construct a paired corpus of 1,789,406 posts across nine crisis events: COVID-19, the Jan. 6 Capitol attack, the 2020 and 2024 U.S. elections, Dobbs/Roe v. Wade, the 2020 BLM protests, U.S. midterms, the Utah shooting, and the U.S.-Iran war. For each event, we compare observed discourse from social platforms with synthetic discourse generated for the same context. We evaluate four dimensions: emotional intensity, structural regularity, lexical-ideological framing, and cross-event dependency, using mean gaps and dispersion evidence. Across events, synthetic discourse is fluent but population-level unrealistic. It is generally more negative and less dispersed in sentiment, structurally more regular, and lexically more abstract than observed discourse. Observed discourse instead shows broader emotional variation, longer-tailed structural distributions, and more context-specific, colloquial lexical markers. These differences are event-dependent: larger for fast-moving, decentralized crises and smaller for formal or institutionally mediated events. We summarize them with a simple event-level measure, the Caricature Gap. Our findings suggest that the main limitation of synthetic political discourse is not grammar or fluency, but reduced population realism. Population-level auditing complements traditional text-detection and provides a CSS framework for evaluating the social realism of generated discourse.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、危機や社会紛争の際の合成談話に関する懸念を提起し、大規模に影響力のある政治的テキストを生成することができる。
既存のAIテキスト検出は、しばしばパープレキシティ、バーストネス、トークンの不規則といった文レベルの手がかりに焦点を当てるが、生成システムが改善するにつれて、これらの信号は弱まる可能性がある。
代わりに、計算社会科学の視点を採用し、合成政治談話が観察されたオンライン人口のように振る舞うかどうかを問う。
我々は、新型コロナウイルス(COVID-19)、1月6日の議事堂攻撃、2020年と2024年のアメリカ合衆国大統領選挙、ドブス/ロー対ウェイド、2020年のBLM抗議運動、米国の中間選挙、ユタ州の銃撃、そして米国とイランの戦争という9つの危機イベントにまたがって、1,789,406の投稿からなるコーパスを構築した。
各事象について、同じ文脈で生成された合成談話と、社会的プラットフォームからの観察された談話を比較した。
平均的ギャップと分散証拠を用いて,感情的強度,構造的規則性,語彙的イデオロギー的フレーミング,相互依存性の4つの次元を評価する。
イベント全体を通じて、合成談話は流動的であるが、人口レベルでは非現実的である。
概して否定的であり、感情の分散が低く、構造的には規則的であり、観察された言説よりも語彙的に抽象的である。
観察された言説は、より広い感情的変動、長い尾の構造的分布、より文脈固有の語彙的マーカーを示す。
これらの違いはイベントに依存しており、素早く動き、分散化された危機に対して大きく、形式的または制度的なイベントに対して小さい。
それらを単純なイベントレベル尺度であるCaricature Gapで要約する。
以上の結果から, 合成政治談話の主な限界は文法や流布ではなく, 人口リアリズムの減少であると考えられた。
人口レベルの監査は、従来のテキスト検出を補完し、生成された言論の社会的リアリズムを評価するためのCSSフレームワークを提供する。
関連論文リスト
- Anatomy of the Modality Gap: Dissecting the Internal States of End-to-End Speech LLMs [15.914430317382077]
音声とテキストの表現が階層的にどのように進化するかを分析する。
音声表現は、冗長な音声の性質に起因して、広い層間アライメントバンドを示す。
論文 参考訳(メタデータ) (2026-03-02T06:21:43Z) - Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [51.95395936342771]
ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文 参考訳(メタデータ) (2025-10-16T20:30:20Z) - Generative Exaggeration in LLM Social Agents: Consistency, Bias, and Toxicity [2.3997896447030653]
ソーシャルメディア上での政治談話のシミュレーションにおいて,Large Language Models (LLM) がどのように振る舞うかを検討する。
我々は、実ユーザ1,186名に基づくLCMエージェントを構築し、制御された条件下で政治的に健全なツイートに返信するよう促す。
よりリッチな文脈化によって内部の一貫性が向上するだけでなく、分極、スタイリングされた信号、有害な言語も増幅される。
論文 参考訳(メタデータ) (2025-07-01T10:54:51Z) - Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - The Problem of Alignment [1.2277343096128712]
大規模言語モデルは、大きなコーパスから統計的パターンとして学習されたシーケンスを生成する。
最初のトレーニングモデルが人間の価値観と一致しなくてはならない場合、他のモデルよりも一定の継続が望ましい。
ユーザとモデル間の双方向インタラクションとして,この構造化の実践について検討する。
論文 参考訳(メタデータ) (2023-12-30T11:44:59Z) - ContextSpeech: Expressive and Efficient Text-to-Speech for Paragraph
Reading [65.88161811719353]
本研究は、軽量で効果的なテキスト音声合成システムであるContextSpeechを開発する。
まず,グローバルテキストと音声コンテキストを文エンコーディングに組み込むメモリキャッシュ再帰機構を設計する。
我々は,グローバルな文脈拡張の範囲を広げるため,階層的に構造化されたテキストセマンティクスを構築した。
実験の結果,ContextSpeechは段落読解における音質と韻律を競争モデル効率で著しく改善することがわかった。
論文 参考訳(メタデータ) (2023-07-03T06:55:03Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - Collective moderation of hate, toxicity, and extremity in online
discussions [1.114199733551736]
われわれはTwitter上で4年間に13万件以上の議論を交わした大規模なコーパスを分析した。
我々は、後続のつぶやきにおけるヘイトスピーチの確率に関係している可能性のある、さまざまな談話の次元を識別する。
事実によって必ずしも支持されない単純な意見を表現することは、その後の議論において最も憎悪に関係している。
論文 参考訳(メタデータ) (2023-03-01T09:35:26Z) - Towards Debiasing Sentence Representations [109.70181221796469]
Sent-Debiasはバイアスを取り除くのに有効であり、同時に文レベルの下流タスクのパフォーマンスを保っていることを示す。
我々は、より公平なNLPのための広く採用されている文表現から社会的偏見を識別・除去する今後の研究に刺激を与えることを期待している。
論文 参考訳(メタデータ) (2020-07-16T04:22:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。