論文の概要: DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model
- arxiv url: http://arxiv.org/abs/2403.03334v3
- Date: Tue, 29 Oct 2024 02:03:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 02:59:54.184923
- Title: DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model
- Title(参考訳): DIVERSE: データプログラミングモデルによるYouTubeビデオコメントスタンスのデータセット
- Authors: Iain J. Cruickshank, Amir Soofi, Lynnette Hui Xian Ng,
- Abstract要約: このデータセットは、アメリカ陸軍の公式YouTubeチャンネルビデオからのすべてのコメントで構成されている。
我々は、最先端の弱い監督アプローチを採用し、大きな言語モデルを利用して、それぞれのコメントのスタンスを、それぞれのビデオと米軍に対してラベル付けする。
- 参考スコア(独自算出の注目度): 1.2289361708127877
- License:
- Abstract: Public opinion of military organizations significantly influences their ability to recruit talented individuals. As recruitment efforts increasingly extend into digital spaces like social media, it becomes essential to assess the stance of social media users toward online military content. However, there is a notable lack of data for analyzing opinions on military recruiting efforts online, compounded by challenges in stance labeling, which is crucial for understanding public perceptions. Despite the importance of stance analysis for successful online military recruitment, creating human-annotated, in-domain stance labels is resource-intensive. In this paper, we address both the challenges of stance labeling and the scarcity of data on public opinions of online military recruitment by introducing and releasing the DIVERSE dataset: https://doi.org/10.5281/zenodo.10493803. This dataset comprises all comments from the U.S. Army's official YouTube Channel videos. We employed a state-of-the-art weak supervision approach, leveraging large language models to label the stance of each comment toward its respective video and the U.S. Army. Our findings indicate that the U.S. Army's videos began attracting a significant number of comments post-2021, with the stance distribution generally balanced among supportive, oppositional, and neutral comments, with a slight skew towards oppositional versus supportive comments.
- Abstract(参考訳): 軍事組織に対する世論は、有能な人材を募集する能力に大きな影響を及ぼす。
採用努力がソーシャルメディアのようなデジタル空間へと拡大するにつれて、ソーシャルメディア利用者のオンライン軍事コンテンツに対する姿勢を評価することが不可欠となる。
しかし、オンライン上での軍事的採用活動に関する意見を分析するためのデータ不足は、世論の理解に欠かせないスタンスラベリングの課題によって補われている。
オンライン軍事採用の成功に対するスタンス分析の重要性にもかかわらず、人間による注釈付きドメイン内スタンスラベルの作成はリソース集約型である。
本稿では、姿勢ラベル付けの課題と、DIVERSEデータセットを導入したり、公開したりすることで、オンライン軍事採用の世論に関するデータの不足に対処する。
このデータセットは、アメリカ陸軍の公式YouTubeチャンネルビデオからのすべてのコメントで構成されている。
我々は、最先端の弱い監督アプローチを採用し、大きな言語モデルを利用して、それぞれのコメントのスタンスをそれぞれのビデオと米軍にラベル付けしました。
以上の結果から、2021年以降、アメリカ陸軍の動画にはかなりの数のコメントが寄せられ始めており、姿勢分布は概して支持的、反対的、中立的なコメントの間でバランスが取れており、反対的、支持的なコメントに対してわずかに歪んでいることが示唆された。
関連論文リスト
- PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.20471076045916]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。
Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。
Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文 参考訳(メタデータ) (2024-09-19T06:28:18Z) - Towards Generalist Robot Learning from Internet Video: A Survey [56.621902345314645]
ディープラーニングを巨大なインターネットスクレイプデータセットにスケールすることで、自然言語処理と視覚的理解と生成において、極めて一般的な機能を実現している。
データはロボット工学で収集するには不十分で費用がかかる。これは、他の領域で観測される能力の一般性に合わせるために、ロボット学習が苦労しているのである。
Learning from Videos (LfV)メソッドは、従来のロボットデータを大規模なインターネットスクラッドビデオデータセットで拡張することで、このデータボトルネックに対処しようとしている。
論文 参考訳(メタデータ) (2024-04-30T15:57:41Z) - Countering Misinformation via Emotional Response Generation [15.383062216223971]
ソーシャルメディアプラットフォーム(SMP)における誤情報拡散は、公衆衛生、社会的結束、民主主義に重大な危険をもたらす。
これまでの研究では、社会的訂正が誤情報を抑制する効果的な方法であることが示された。
約1万のクレーム応答対からなる最初の大規模データセットであるVerMouthを提案する。
論文 参考訳(メタデータ) (2023-11-17T15:37:18Z) - A Call to Arms: AI Should be Critical for Social Media Analysis of
Conflict Zones [5.479613761646247]
本稿では、コンピュータビジョンを用いて、特定の武器システムとそれを用いた武装集団の署名を特定するための予備的、横断的な作業について述べる。
武器の配布方法を追跡するだけでなく、ウクライナの様々な種類の国家や非国家の軍事俳優がどの種類の武器を使用しているかを追跡する可能性がある。
このようなシステムは、人道支援や医療援助がもっとも必要となる場所を含む、リアルタイムでの紛争を理解するために最終的に使用できる。
論文 参考訳(メタデータ) (2023-11-01T19:49:32Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - EgoTaskQA: Understanding Human Tasks in Egocentric Videos [89.9573084127155]
EgoTaskQAベンチマークは、現実世界のエゴセントリックなビデオに対する質問回答を通じて、タスク理解の重要な次元を提供する。
我々は,(1)行動依存と効果,(2)意図と目標,(3)エージェントの他者に対する信念の理解を念頭に設計する。
我々は、我々のベンチマークで最先端のビデオ推論モデルを評価し、複雑なゴール指向のエゴセントリックなビデオを理解する上で、人間の間に大きなギャップがあることを示します。
論文 参考訳(メタデータ) (2022-10-08T05:49:05Z) - The Spread of Propaganda by Coordinated Communities on Social Media [43.2770127582382]
我々は、2019年イギリス総選挙に関する大規模なTwitterデータセット上で、プロパガンダの拡散とその協調行動との相互作用を分析する。
プロパガンダの利用と協調行動を組み合わせることで、異なるコミュニティの真正性と有害性を明らかにすることができる。
論文 参考訳(メタデータ) (2021-09-27T13:39:10Z) - Cross-Domain Learning for Classifying Propaganda in Online Contents [67.10699378370752]
本稿では,ラベル付き文書や,ニュースやつぶやきからの文をベースとしたクロスドメイン学習の手法を提案する。
本実験は,本手法の有効性を実証し,移動過程におけるソースやターゲットの様々な構成における困難さと限界を同定する。
論文 参考訳(メタデータ) (2020-11-13T10:19:13Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - Fighting the COVID-19 Infodemic in Social Media: A Holistic Perspective
and a Call to Arms [42.7332883578842]
新型コロナウイルス(COVID-19)のパンデミックが勃発すると、人々はソーシャルメディアに、タイムリーな情報を読み、共有するよう促した。
また、医療と政治の誤報と偽情報の新しいブレンドがあり、これが最初の世界的なインフォデミックを引き起こした。
これは、ジャーナリスト、ファクトチェッカー、政策立案者、政府機関、ソーシャルメディアプラットフォーム、社会全体の観点からの総合的なアプローチを必要とする複雑な問題である。
論文 参考訳(メタデータ) (2020-07-15T21:18:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。