論文の概要: A Multi-Level Benchmark for Causal Language Understanding in Social Media Discourse
- arxiv url: http://arxiv.org/abs/2509.16722v1
- Date: Sat, 20 Sep 2025 15:20:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:15.945043
- Title: A Multi-Level Benchmark for Causal Language Understanding in Social Media Discourse
- Title(参考訳): ソーシャルメディアにおける因果語理解のためのマルチレベルベンチマーク
- Authors: Xiaohan Ding, Kaike Ping, Buse Çarık, Eugenia Rho,
- Abstract要約: CausalTalkは、非公式テキストに対するきめ細かい因果検出とギストベースの推論をブリッジする。
ソーシャルメディアの文脈における因果推論を研究するための豊富なリソースを提供する。
- 参考スコア(独自算出の注目度): 9.402242726967453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding causal language in informal discourse is a core yet underexplored challenge in NLP. Existing datasets largely focus on explicit causality in structured text, providing limited support for detecting implicit causal expressions, particularly those found in informal, user-generated social media posts. We introduce CausalTalk, a multi-level dataset of five years of Reddit posts (2020-2024) discussing public health related to the COVID-19 pandemic, among which 10120 posts are annotated across four causal tasks: (1) binary causal classification, (2) explicit vs. implicit causality, (3) cause-effect span extraction, and (4) causal gist generation. Annotations comprise both gold-standard labels created by domain experts and silver-standard labels generated by GPT-4o and verified by human annotators. CausalTalk bridges fine-grained causal detection and gist-based reasoning over informal text. It enables benchmarking across both discriminative and generative models, and provides a rich resource for studying causal reasoning in social media contexts.
- Abstract(参考訳): 非公式の談話における因果語を理解することは、NLPにおける未発見の課題である。
既存のデータセットは、構造化されたテキストにおける明示的な因果関係に重点を置いており、特に非公式なユーザー生成ソーシャルメディア投稿に見られる暗黙的な因果表現の検出を限定的にサポートする。
新型コロナウイルスのパンデミックに関連する公衆衛生について論じる5年間のReddit投稿(2020-2024)のマルチレベルデータセットであるCausalTalkを紹介した。その中の10120投稿は,(1)バイナリ因果分類,(2)明示的・暗黙的因果分類,(3)因果的因果抽出,(4)因果的ギスト生成という4つの因果的タスクでアノテートされている。
アノテーションは、ドメインの専門家によって作成された金標準ラベルと、GPT-4oによって生成された銀標準ラベルと、人間のアノテーションによって検証された銀標準ラベルの両方で構成されている。
CausalTalkは、非公式テキストに対するきめ細かい因果検出とギストベースの推論をブリッジする。
識別モデルと生成モデルの両方のベンチマークを可能にし、ソーシャルメディアの文脈における因果推論を研究するための豊富なリソースを提供する。
関連論文リスト
- InfoCausalQA:Can Models Perform Non-explicit Causal Reasoning Based on Infographic? [14.443840118369176]
本稿ではインフォグラフィックに基づく因果推論を評価するための新しいベンチマークであるInfoCausalQAを紹介する。
第1タスクは推論された数値傾向に基づく定量的因果推論に焦点を当て,第2タスクは5種類の因果関係を含む意味因果推論を対象とする。
実験の結果,現在のビジョン・ランゲージモデルでは,計算的推論の能力に限界があり,意味的因果推論の能力にも限界があることが明らかとなった。
論文 参考訳(メタデータ) (2025-08-08T11:03:23Z) - ACCESS : A Benchmark for Abstract Causal Event Discovery and Reasoning [47.540945048737434]
我々は、抽象因果イベントの発見と推論のために設計されたベンチマークである textttACCESS を紹介する。
本稿では,暗黙的なコモンセンス因果的知識の大規模データセットから,イベント一般化のための抽象化を識別するためのパイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-12T06:19:02Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Complex Reasoning over Logical Queries on Commonsense Knowledge Graphs [61.796960984541464]
論理クエリをサンプリングして作成した新しいデータセットであるCOM2(COMplex COMmonsense)を提示する。
我々は、手書きのルールと大きな言語モデルを用いて、複数の選択とテキスト生成の質問に言語化します。
COM2でトレーニングされた言語モデルでは、複雑な推論能力が大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-12T08:13:52Z) - HeadlineCause: A Dataset of News Headlines for Detecting Casualties [0.20305676256390934]
HeadlineCauseは、ニュースの見出しのペア間の暗黙的な因果関係を検出するデータセットである。
データセットには、英国のニュースから5000以上の見出しペアと、クラウドソーシングを通じてラベル付けされたロシアのニュースから9000以上の見出しペアが含まれている。
論文 参考訳(メタデータ) (2021-08-28T11:12:49Z) - Everything Has a Cause: Leveraging Causal Inference in Legal Text
Analysis [62.44432226563088]
因果推論は変数間の因果関係を捉えるプロセスである。
本論文では,事実記述から因果グラフを構築するための新たなグラフベース因果推論フレームワークを提案する。
GCIに含まれる因果知識を強力なニューラルネットワークに効果的に注入することで、パフォーマンスと解釈性が向上します。
論文 参考訳(メタデータ) (2021-04-19T16:13:10Z) - Causal BERT : Language models for causality detection between events
expressed in text [1.0756038762528868]
イベント間の因果関係の理解は、ヘルスケア、ビジネスリスク管理、財務など、多くの分野で役立ちます。
自然言語イベント間の「因果関係」は、暗黙的に表現されることが多いため、単に挑戦を続ける。
提案手法は3つの異なるデータ分布において最先端の性能を達成し,因果図の抽出に利用できる。
論文 参考訳(メタデータ) (2020-12-10T04:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。