論文の概要: IsamasRed: A Public Dataset Tracking Reddit Discussions on Israel-Hamas
Conflict
- arxiv url: http://arxiv.org/abs/2401.08202v1
- Date: Tue, 16 Jan 2024 08:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 14:35:04.773937
- Title: IsamasRed: A Public Dataset Tracking Reddit Discussions on Israel-Hamas
Conflict
- Title(参考訳): IsamasRed: RedditのイスラエルとHamasの対立に関する議論を追跡する公開データセット
- Authors: Kai Chen, Zihao He, Keith Burghardt, Jingxin Zhang, Kristina Lerman
- Abstract要約: われわれは、2023年8月から2023年11月にかけて、40万件近い会話と、Redditからの800万件以上のコメントを慎重に収集したデータセットを提示する。
このデータセットに関する最初の分析では、話題、論争、感情的、道徳的な言語傾向を時間とともに調査し、感情的に荷電され、複雑な言論の性質を強調した。
このデータセットは、オンライン議論の理解を深めることを目的としており、デジタル空間におけるイデオロギー、感情、コミュニティエンゲージメントの間の複雑な相互作用に光を当てている。
- 参考スコア(独自算出の注目度): 14.937352663734178
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The conflict between Israel and Palestinians significantly escalated after
the October 7, 2023 Hamas attack, capturing global attention. To understand the
public discourse on this conflict, we present a meticulously compiled
dataset--IsamasRed--comprising nearly 400,000 conversations and over 8 million
comments from Reddit, spanning from August 2023 to November 2023. We introduce
an innovative keyword extraction framework leveraging a large language model to
effectively identify pertinent keywords, ensuring a comprehensive data
collection. Our initial analysis on the dataset, examining topics, controversy,
emotional and moral language trends over time, highlights the emotionally
charged and complex nature of the discourse. This dataset aims to enrich the
understanding of online discussions, shedding light on the complex interplay
between ideology, sentiment, and community engagement in digital spaces.
- Abstract(参考訳): イスラエルとパレスチナの紛争は2023年10月7日のハマス攻撃で激増し、世界的な注目を集めた。
2023年8月から2023年11月までの間に、約40万件の会話と800万件のredditからのコメントをまとめた、細心の注意深いデータセットを提示する。
本稿では,関連するキーワードを効果的に識別するために,大規模言語モデルを活用した革新的なキーワード抽出フレームワークを提案する。
データセットに関する最初の分析では、トピック、議論、感情的、道徳的な言語トレンドを調査し、会話の感情的チャージと複雑な性質を強調した。
このデータセットは、オンライン議論の理解を深めることを目的としており、デジタル空間におけるイデオロギー、感情、コミュニティエンゲージメントの間の複雑な相互作用に光を当てている。
関連論文リスト
- The MuSe 2024 Multimodal Sentiment Analysis Challenge: Social Perception and Humor Recognition [64.5207572897806]
マルチモーダル・センティメント・アナリティクス・チャレンジ (MuSe) 2024は、現代の2つのマルチモーダル・インフルエンスと感情分析の問題に対処する。
Social Perception Sub-Challenge (MuSe-Perception)では、参加者は16種類の個人の社会的属性を予測する。
クロスカルカルカルチャー・ヒューモー検出サブチャレンジ(MuSe-Humor)データセットは、Passau Spontaneous Football Coach Humorデータセット上に拡張される。
論文 参考訳(メタデータ) (2024-06-11T22:26:20Z) - Coordinated Activity Modulates the Behavior and Emotions of Organic
Users: A Case Study on Tweets about the Gaza Conflict [9.58546889761175]
この研究は、ガザ紛争の最中のTwitter上で、コーディネートされた(悪意のある)エンティティとオーガニックな(規則的な)ユーザの間の相互作用のダイナミクスを詳しく調べる。
13万以上のユーザーから約350万件のツイートを分析した結果、ユーザのコーディネートが情報のランドスケープに大きく影響していることが判明した。
結果は、ソーシャルメディアプラットフォーム上での情報操作に対する警戒と、微妙な理解の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-02-08T18:07:17Z) - MetaHate: A Dataset for Unifying Efforts on Hate Speech Detection [2.433983268807517]
ヘイトスピーチは、標的となる個人やコミュニティに対して、社会的、心理的、時には身体的脅威を生じさせる。
この現象に対処するための現在の計算言語学的アプローチは、トレーニングのためのラベル付きソーシャルメディアデータセットに依存している。
我々は60以上のデータセットを精査し、その関連するものをMetaHateに選択的に統合しました。
我々の発見は、既存のデータセットのより深い理解に寄与し、より堅牢で適応可能なモデルをトレーニングするための道を開いた。
論文 参考訳(メタデータ) (2024-01-12T11:54:53Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog [83.63849872250651]
ビデオグラウンドダイアログは、正確な応答生成のために、ダイアログ履歴とビデオコンテンツの両方を深く理解する必要がある。
本稿では,テキストエンコーダ,ビジュアルエンコーダ,ジェネレータで構成される反復探索・推論フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-11T07:37:13Z) - Unveiling Global Narratives: A Multilingual Twitter Dataset of News Media on the Russo-Ukrainian Conflict [5.0337106694127725]
ロシアとウクライナの紛争は世界中で激しいメディア報道の対象となっている。
ソーシャルメディア上でニュースやメディアが投稿したつぶやきを収集・処理することで,この話題に焦点を当てた新たなマルチメディアデータセットを提案する。
私たちは2022年2月から2023年5月までのツイートを収集し、60の言語で約150万のツイートとそれらの画像を取得しました。
論文 参考訳(メタデータ) (2023-06-22T13:52:31Z) - EDSA-Ensemble: an Event Detection Sentiment Analysis Ensemble
Architecture [63.85863519876587]
Sentiment Analysisを使って、イベントに属する各メッセージの極性やイベント全体を理解することで、オンラインソーシャルネットワークにおける重要なトレンドやダイナミクスに関する一般的な感情や個人の感情をよりよく理解することができます。
本研究では,ソーシャルメディアから現在起きているイベントの極性検出を改善するために,イベント検出と知覚分析を用いた新しいアンサンブルアーキテクチャEDSA-Ensembleを提案する。
論文 参考訳(メタデータ) (2023-01-30T11:56:08Z) - Codes, Patterns and Shapes of Contemporary Online Antisemitism and
Conspiracy Narratives -- an Annotation Guide and Labeled German-Language
Dataset in the Context of COVID-19 [0.0]
インターネット上の反ユダヤ的・陰謀論のコンテンツは、データ駆動型アルゴリズムアプローチを不可欠にしている。
我々は、新型コロナウイルスのパンデミックの文脈において、オンラインコンテンツにおける反ユダヤ的・陰謀的理論のためのアノテーションガイドを開発する。
我々は、コード化やホロコースト後のアンチ・セミズムのような特定の形のアンチ・セミズムを含む作業定義を提供する。
論文 参考訳(メタデータ) (2022-10-13T10:32:39Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - Sentiment Analysis of Political Tweets for Israel using Machine Learning [0.0]
本研究では、イスラエルの政治Twitterデータを用いて、パレスチナとイスラエルの対立に対する世論を解釈する分析研究を提案する。
ツイート形式での民族グループと世論指導者の態度を機械学習アルゴリズムを用いて分析する。
論文 参考訳(メタデータ) (2022-04-12T12:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。