論文の概要: TWeddit : A Dataset of Triggering Stories Predominantly Shared by Women on Reddit
- arxiv url: http://arxiv.org/abs/2601.11819v1
- Date: Fri, 16 Jan 2026 22:45:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.332913
- Title: TWeddit : A Dataset of Triggering Stories Predominantly Shared by Women on Reddit
- Title(参考訳): TWeddit : Redditで女性によって広く共有された物語をトリガーするデータセット
- Authors: Shirlene Rose Bandela, Sanjeev Parthasarathy, Vaibhav Garg,
- Abstract要約: 中絶、流産、性的暴力に影響された人々は、感情を表現し、支援を求めるためにソーシャルメディアで経験を共有することが多い。
Redditのような公開プラットフォームでは、長い詳細なストーリーを投稿できる(最大4万文字まで)。
経験をトリガーするためにラベル付けされたRedditストーリーにはデータセットが不足している。
我々は、女性が直面している問題にまつわる経験をトリガーする、キュレートされたデータセットTWedditを提案する。
- 参考スコア(独自算出の注目度): 2.6307359124048566
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Warning: This paper may contain examples and topics that may be disturbing to some readers, especially survivors of miscarriage and sexual violence. People affected by abortion, miscarriage, or sexual violence often share their experiences on social media to express emotions and seek support. On public platforms like Reddit, where users can post long, detailed narratives (up to 40,000 characters), readers may be exposed to distressing content. Although Reddit allows manual trigger warnings, many users omit them due to limited awareness or uncertainty about which categories apply. There is scarcity of datasets on Reddit stories labeled for triggering experiences. We propose a curated Reddit dataset, TWeddit, covering triggering experiences related to issues majorly faced by women. Our linguistic analyses show that annotated stories in TWeddit express distinct topics and moral foundations, making the dataset useful for a wide range of future research.
- Abstract(参考訳): 警告:本論文は、一部の読者、特に流産や性的暴力の生き残りを悩ませる事例や話題を含む可能性がある。
中絶、流産、性的暴力に影響された人々は、感情を表現し、支援を求めるためにソーシャルメディアで経験を共有することが多い。
Redditのような公開プラットフォームでは、長い詳細なストーリーを投稿できる(最大4万文字まで)。
Redditは手動によるトリガー警告を許可しているが、多くのユーザーはどのカテゴリが適用されるかという認識や不確実性のために警告を省略している。
経験をトリガーするためにラベル付けされたRedditストーリーにはデータセットが不足している。
我々はRedditのキュレートされたデータセットであるTWedditを提案する。
我々の言語学的分析によると、TWedditの注釈付きストーリーは異なるトピックや道徳的基礎を表現しており、このデータセットは幅広い将来の研究に有用である。
関連論文リスト
- Exploratory Data Analysis on Code-mixed Misogynistic Comments [0.0]
我々は、ミックスコードHinglishでYouTubeコメントの新しいデータセットを提示する。
これらのコメントは「ミソジニスト」と「非ミソジニスト」とラベル付けされている。
論文 参考訳(メタデータ) (2024-03-09T23:21:17Z) - The Uli Dataset: An Exercise in Experience Led Annotation of oGBV [3.1060730586569427]
ヒンディー語、タミル語、インド英語の3言語で性別による虐待に関するデータセットを提示する。
このデータセットは、女性や南アジアのLGBTQIAコミュニティのメンバーと同一視する専門家によって、性虐待の経験に関する3つの質問に沿って注釈付けされたツイートで構成されている。
論文 参考訳(メタデータ) (2023-11-15T16:30:44Z) - SQuARe: A Large-Scale Dataset of Sensitive Questions and Acceptable
Responses Created Through Human-Machine Collaboration [75.62448812759968]
このデータセットは、韓国の大規模データセットで、49kの機密性があり、42kの許容範囲と46kの非許容応答がある。
データセットは、実際のニュースの見出しに基づいて、HyperCLOVAを人道的に活用して構築された。
論文 参考訳(メタデータ) (2023-05-28T11:51:20Z) - Analyzing Norm Violations in Live-Stream Chat [49.120561596550395]
本研究は,ライブストリーミングプラットフォーム上での会話における規範違反を検出することを目的とした,最初のNLP研究である。
ライブストリームチャットにおける標準違反カテゴリを定義し、Twitchから4,583のコメントを注釈付けします。
以上の結果から,適切なコンテキスト情報がモデレーション性能を35%向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-18T05:58:27Z) - Detecting and Reasoning of Deleted Tweets before they are Posted [5.300190188468289]
削除されたツイート、特にアラビアの文脈内で識別し、それに対応するきめ細かい偽情報カテゴリにラベル付けします。
次に、削除されるツイートの可能性を予測できるモデルを開発します。
論文 参考訳(メタデータ) (2023-05-05T08:25:07Z) - Extracting Incidents, Effects, and Requested Advice from MeToo Posts [12.545285425297395]
長い投稿では、(i)セクハラ事件、(ii)生存者への影響、(iii)求められているアドバイスの組み合わせが述べられている。
有望な支援者は、そのようなポストから生存者のニーズを理解する必要がある。
上記の3つのカテゴリのいずれかを記述した投稿から文を識別する自然言語モデルを構築した。
さらに,Reddit投稿から抽出した8,947のラベル付き文からなるデータセットであるMeThreeをコントリビュートする。
論文 参考訳(メタデータ) (2023-03-19T05:22:12Z) - DisinfoMeme: A Multimodal Dataset for Detecting Meme Intentionally
Spreading Out Disinformation [72.18912216025029]
偽情報ミームの検出を支援するためにDisinfoMemeを提案する。
このデータセットには、COVID-19パンデミック、Black Lives Matter運動、ベジタリアン/ベジタリアンという3つのトピックをカバーするRedditのミームが含まれている。
論文 参考訳(メタデータ) (2022-05-25T09:54:59Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - #MeToo on Campus: Studying College Sexual Assault at Scale Using Data
Reported on Social Media [71.74529365205053]
我々は、#トレンドが大学フォロワーのプールに与える影響を分析した。
その結果、これらの#ツイートに埋め込まれたトピックの大部分は、セクシャルハラスメントのストーリーを詳述している。
この傾向といくつかの主要地理的地域に関する公式な報告との間には大きな相関関係がある。
論文 参考訳(メタデータ) (2020-01-16T18:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。