論文の概要: A Context-Aware Dataset for Stance Detection in Bioethical Controversies on Reddit
- arxiv url: http://arxiv.org/abs/2606.13187v1
- Date: Thu, 11 Jun 2026 10:53:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.738072
- Title: A Context-Aware Dataset for Stance Detection in Bioethical Controversies on Reddit
- Title(参考訳): Redditにおける生物倫理論争におけるスタンス検出のための文脈認識データセット
- Authors: Hu Huang, Genan Dai, Fuqiang Niu, Yi Yang, Zhaoya Gong, Bowen Zhang,
- Abstract要約: BioStanceは、Redditのバイオ倫理的議論から39,600の注釈付きPost-Commentペアのコンテキスト対応データセットである。
BioStanceは、生物倫理論争の3次元にわたる6つの論争の対象をカバーしている。
- 参考スコア(独自算出の注目度): 11.286858157181811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bioethical debates increasingly unfold on social media, yet stance detection research lacks large-scale, domain-specific resources for modeling such context-dependent discourse. We present BioStance, a context-aware dataset of 39,600 annotated Post-Comment pairs from Reddit bioethical discussions. BioStance covers six controversial targets across three dimensions of bioethical controversy: fundamental value conflicts, individual liberty versus collective responsibility, and technological uncertainty. Each instance preserves hierarchical conversational context and is labeled by three independent annotators using a three-class stance scheme: Favor, Against, and None. The annotations achieve a mean Krippendorff's $α$ of 0.82, indicating substantial reliability. By combining thematic diversity, conversational structure, and high-quality human annotation, BioStance supports research on context-aware stance detection, argument mining, and computational analysis of bioethical discourse.
- Abstract(参考訳): ソーシャルメディア上での倫理的議論はますます広まりつつあるが、スタンス検出の研究には、そのような文脈に依存した言説をモデル化するための大規模でドメイン固有のリソースが欠けている。
Redditのバイオ倫理的議論から39,600対の注釈付きポストコメンデーションの文脈認識データセットであるBioStanceを紹介した。
バイオスタンスは、基本的価値紛争、個人の自由と集団的責任、技術的不確実性の3つの側面にまたがる論争の的となっている6つの標的をカバーしている。
各インスタンスは階層的な会話コンテキストを保持し、3つの独立したアノテータによって3つのクラスのスタンススキーム(Favor, Against, None)を使用してラベル付けされる。
アノテーションは平均的なクリッペンドルフの0.82ドルを達成しており、かなりの信頼性を示している。
テーマの多様性、会話の構造、高品質な人間のアノテーションを組み合わせることで、BioStanceは文脈認識の姿勢検出、議論のマイニング、バイオ倫理的言説の計算分析の研究を支援している。
関連論文リスト
- ControBench: An Interaction-Aware Benchmark for Controversial Discourse Analysis on Social Networks [17.87131765035957]
ControBenchは議論の余地のある談話分析のベンチマークである。
RedditのTrump、中絶、宗教に関する議論から生まれたものだ。
我々はControBench上で,グラフニューラルネットワーク,事前学習言語モデル,および大規模言語モデルを評価する。
論文 参考訳(メタデータ) (2026-05-01T08:39:26Z) - When Numbers Tell Half the Story: Human-Metric Alignment in Topic Model Evaluation [0.0]
本稿では,話題間の相違性を評価する新しい人間評価課題である,話題語混合(TWM)を紹介する。
我々は,学術出版物の分野固有の哲学のコーパスから,約4,000のアノテーションに基づいて,自動メトリクスと人的評価手法を比較した。
論文 参考訳(メタデータ) (2026-03-02T14:58:20Z) - PERSPECTRA: A Scalable and Configurable Pluralist Benchmark of Perspectives from Arguments [16.8677147128948]
PERSPECTRAは、モデルが複数の視点をいかにうまく表現し、区別し、推論するかを評価するための複数のベンチマークである。
議論の的になっているトピック100件について、762件のプロ/コンスタンスにまたがる3,810件のリッチな議論を構築した。
各意見は複数の自然主義的変種に拡張され、多元論の堅牢な評価を可能にする。
論文 参考訳(メタデータ) (2026-02-09T14:25:07Z) - SAD: A Large-Scale Strategic Argumentative Dialogue Dataset [60.33125467375306]
実際には、議論はしばしばマルチターン対話として実現される。
大規模なtextbfStrategic textbfArgumentative textbfDialogue データセットは,392,822例からなる。
論文 参考訳(メタデータ) (2026-01-12T11:11:37Z) - Latent Topic Synthesis: Leveraging LLMs for Electoral Ad Analysis [51.95395936342771]
ラベルなしコーパスから解釈可能なトピック分類を自動生成するエンドツーエンドフレームワークを提案する。
われわれはこの枠組みを、2024年アメリカ合衆国大統領選挙の1ヶ月前のMeta政治広告の大規模なコーパスに適用する。
提案手法は,潜在談話構造を明らかにし,意味的に豊かなトピックラベルを合成し,モラル・フレーミングの次元でトピックを注釈する。
論文 参考訳(メタデータ) (2025-10-16T20:30:20Z) - How Persuasive Could LLMs Be? A First Study Combining Linguistic-Rhetorical Analysis and User Experiments [1.1277995582894218]
研究によると、参加者はChatGPTが強調する利点をしばしば認めるが、倫理的懸念はポスト・アクションを持続または強化する傾向にある。
これらの発見は、倫理的に敏感な領域におけるAIが生み出す説得に関する新たな洞察を浮き彫りにし、将来の研究の基盤となる。
論文 参考訳(メタデータ) (2025-08-13T08:45:04Z) - A Controllable Examination for Long-Context Language Models [62.845852724511964]
本研究では,長文言語モデルを評価するベンチマークである$textbfLongBioBenchを紹介する。
その結果,ほとんどのモデルでは,検索結果に対する意味的理解や基礎的推論が不足していることが判明した。
我々のさらなる分析は、文脈的非コヒーレンスなど、既存の合成ベンチマークで採用されているいくつかの設計選択を示している。
論文 参考訳(メタデータ) (2025-06-03T14:23:06Z) - PanoSent: A Panoptic Sextuple Extraction Benchmark for Multimodal Conversational Aspect-based Sentiment Analysis [74.41260927676747]
本稿では,マルチモーダル対話感分析(ABSA)を導入することでギャップを埋める。
タスクをベンチマークするために、手動と自動の両方で注釈付けされたデータセットであるPanoSentを構築し、高品質、大規模、マルチモーダル、マルチ言語主義、マルチシナリオを特徴とし、暗黙の感情要素と明示的な感情要素の両方をカバーする。
課題を効果的に解決するために,新しい多モーダルな大規模言語モデル(すなわちSentica)とパラフレーズベースの検証機構とともに,新しい感覚の連鎖推論フレームワークを考案した。
論文 参考訳(メタデータ) (2024-08-18T13:51:01Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - BiERU: Bidirectional Emotional Recurrent Unit for Conversational
Sentiment Analysis [18.1320976106637]
会話感情分析と単文感情分析の主な違いは、文脈情報の存在である。
既存のアプローチでは、会話内の異なるパーティを区別し、コンテキスト情報をモデル化するために複雑なディープラーニング構造を採用している。
本稿では,会話感情分析のための双方向感情的反復単位という,高速でコンパクトでパラメータ効率のよい非依存フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-31T11:13:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。