論文の概要: ControBench: An Interaction-Aware Benchmark for Controversial Discourse Analysis on Social Networks
- arxiv url: http://arxiv.org/abs/2605.00513v1
- Date: Fri, 01 May 2026 08:39:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.914097
- Title: ControBench: An Interaction-Aware Benchmark for Controversial Discourse Analysis on Social Networks
- Title(参考訳): ControBench: ソーシャルネットワーク上での会話分析のための対話型ベンチマーク
- Authors: Ta Thanh Thuy, Jiaqi Zhu, Xuan Liu, Lin Shang, Reihaneh Rabbany, Guillaume Rabusseau, Lihui Chen, Zheng Yilun, Sitao Luan,
- Abstract要約: ControBenchは議論の余地のある談話分析のベンチマークである。
RedditのTrump、中絶、宗教に関する議論から生まれたものだ。
我々はControBench上で,グラフニューラルネットワーク,事前学習言語モデル,および大規模言語モデルを評価する。
- 参考スコア(独自算出の注目度): 17.87131765035957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding how people argue across ideological divides online is important for studying political polarization, misinformation, and content moderation. Existing datasets capture only part of this problem: some preserve text but ignore interaction structure, some model structure without rich semantics, and others represent conversations without stable user-level ideological identity. We introduce ControBench, a benchmark for controversial discourse analysis that combines heterogeneous social interaction graphs with rich textual semantics. Built from Reddit discussions on three topics, Trump, abortion, and religion, ControBench contains 7,370 users, 1,783 posts, and 26,525 interactions. The graph contains user and post nodes connected by semantically enriched edges; in particular, user-comment-user edges encode both a reply and the parent comment that it responds to, preserving local argumentative context. User labels are derived from self-declared Reddit flairs, providing a scalable proxy for ideological identity without manual annotation. The resulting datasets exhibit low or negative adjusted homophily (Trump: -0.77, Abortion: 0.06, Religion: 0.04), reflecting the cross-cutting structure of real-world debate. We evaluate graph neural networks, pretrained language models, and large language models on ControBench and observe distinct performance patterns across topics and model families, especially when ideological boundaries are ambiguous. These results position ControBench as a challenging and realistic benchmark for controversial discourse analysis.
- Abstract(参考訳): 人々がオンラインのイデオロギー的分割をどう議論するかを理解することは、政治的分極、誤情報、コンテンツモデレーションを研究する上で重要である。
既存のデータセットは、テキストを保存するが相互作用構造を無視するもの、リッチセマンティクスのないモデル構造、安定したユーザレベルのイデオロギーのアイデンティティを持たない会話を表現するものなど、この問題の一部のみをキャプチャする。
異種ソーシャルインタラクショングラフとリッチテキストセマンティクスを組み合わせた議論の的となっている談話分析のベンチマークであるControBenchを紹介する。
RedditでTrump、中絶、宗教の3つのトピックに関する議論から構築されたControBenchには、7,370のユーザ、1,783の投稿、26,525のインタラクションが含まれている。
このグラフには、セマンティックに強化されたエッジによって接続されたユーザノードとポストノードが含まれている。
ユーザラベルは自己宣言型のReddit flairsから派生したもので、手動のアノテーションなしでイデオロギー的アイデンティティのスケーラブルなプロキシを提供する。
得られたデータセットは低または負に調整されたホモフィリー(トランプ:-0.77、中絶:0.06、宗教:0.04)を示し、現実世界の議論の横断的な構造を反映している。
グラフニューラルネットワーク、事前学習言語モデル、およびControBench上の大規模言語モデルを評価し、特にイデオロギー境界が曖昧である場合、トピックやモデルファミリ間で異なるパフォーマンスパターンを観察する。
これらの結果はControBenchを議論の的になっている談話分析の挑戦的で現実的なベンチマークと位置づけている。
関連論文リスト
- Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [51.95395936342771]
ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文 参考訳(メタデータ) (2025-10-16T20:30:20Z) - Identifying & Interactively Refining Ambiguous User Goals for Data Visualization Code Generation [48.63200319578052]
本研究では,この課題に現れるあいまいさの分類法を開発し,それらを定量化するための指標を提案する。
我々の研究は、マルチターン対話が曖昧さを減らし、ユーザ目標の整合性を高めてコード精度を向上させる方法についても検討している。
論文 参考訳(メタデータ) (2025-10-10T13:44:40Z) - GASCOM: Graph-based Attentive Semantic Context Modeling for Online
Conversation Understanding [4.9711707739781215]
本稿では,オンライン会話理解のためのグラフベースの意味意味テキストモデリング(GASCOM)フレームワークを提案する。
具体的には、オンライン会話のグラフ構造と、個々の投稿のセマンティック情報の両方を利用する2つの新しいアルゴリズムを設計する。
提案手法は,両タスクの最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-10-21T14:45:26Z) - When Crowd Meets Persona: Creating a Large-Scale Open-Domain Persona
Dialogue Corpus [13.051107304650627]
自然言語データセットの構築には、単語の意味論が微妙なテキストの変更や注釈付き概念の定義に弱いため、注意が必要である。
本研究では,大規模なオープンドメインペルソナ対話コーパスを作成する際に,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-01T16:10:36Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - A Graph-Based Context-Aware Model to Understand Online Conversations [3.8345539498627437]
オンライン会話では、コメントや返信は、すぐに関連する情報以外の外部のコンテキストに基づいている可能性がある。
グラフウォークを用いて会話のより広いコンテキストを組み込む新しいグラフベースのディープラーニングアーキテクチャであるGraphNLIを提案する。
極性予測と擬似的ヘイトスピーチ検出という2つのタスクでGraphNLIを評価する。
論文 参考訳(メタデータ) (2022-11-16T20:51:45Z) - GraphNLI: A Graph-based Natural Language Inference Model for Polarity
Prediction in Online Debates [3.8345539498627437]
グラフウォーク技術を用いて、議論スレッドのより広いコンテキストをキャプチャするグラフベースの新しいディープラーニングアーキテクチャであるGraphNLIを提案する。
次に、これらの埋め込みを使用して、返信と返信するポストの間の極性関係を予測する。
我々のモデルはS-BERTを含む関連するベースラインを83%の精度で上回ります。
論文 参考訳(メタデータ) (2022-02-16T16:26:21Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Deep Neural Framework for Contextual Affect Detection [51.378225388679425]
感情を持たない短い単純なテキストは、その文脈と共に読むときに強い感情を表現することができる。
文中の単語の相互依存を学習する文脈影響検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-28T05:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。