論文の概要: Hiding in Plain Sight: Finding MAHA on Reddit
- arxiv url: http://arxiv.org/abs/2605.20435v1
- Date: Tue, 19 May 2026 19:32:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.346738
- Title: Hiding in Plain Sight: Finding MAHA on Reddit
- Title(参考訳): RedditでMAHAを見つける
- Authors: Sabit Ahmed, Subigya Nepal, Henry Kautz,
- Abstract要約: Make America Healthy Again (MAHA) は、国民の健康運動である。
ソーシャルメディアにおけるMAHA運動の様々なインフルエンサーやプロモーターが、オンライン空間に散在している。
このデータセットは、様々な領域の研究者に、MAHA運動のダイナミクスを研究する機会を提供する。
- 参考スコア(独自算出の注目度): 0.9987191686786273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Make America Healthy Again (MAHA) is a national health movement that encompasses a striking mix of beliefs, from broadly accepted concerns about good diet and exercise to controversial takes on organic and genetically modified food, childhood vaccination, science, and institutions. Various influencers and promoters of the MAHA movement on social media are scattered throughout the online space. Investigating the structure, discourse, and contagion of MAHA beliefs requires large-scale fine-grained digital footprints. Constructing structured data covering different MAHA themes from vast unstructured social media data is challenging. We introduce a Reddit dataset that spans six years (2020-2025), comprising 19.4M posts from 4M users. Containing the natural and thematic context of 12 MAHA-aligned beliefs, this dataset offers researchers from various domains the opportunity to study the dynamics of the MAHA movement, its structural and functional components, and the linguistic and behavioral patterns of its proponents.
- Abstract(参考訳): Make America Healthy Again (MAHA) は、良い食事と運動に関する広く受け入れられた関心事から、有機的、遺伝学的に改変された食品、幼児予防接種、科学、制度への論争まで、様々な信念を包含する国民健康運動である。
ソーシャルメディアにおけるMAHA運動の様々なインフルエンサーやプロモーターが、オンライン空間に散在している。
MAHAの信念の構造、言論、伝染を調査するには、大規模できめ細かなデジタルフットプリントが必要である。
膨大な未構造化ソーシャルメディアデータから異なるMAHAテーマをカバーする構造化データを構築することは困難である。
Redditのデータセットは6年(2020-2025年)で、400万人から194万件の投稿がある。
このデータセットは、12のMAHA-アラインな信念の自然的・主題的文脈を持ち、様々な領域の研究者に、MAHA運動のダイナミクス、その構造的・機能的構成要素、およびその支持者の言語的・行動的パターンを研究する機会を提供する。
関連論文リスト
- Multi-Platform Aggregated Dataset of Online Communities (MADOC) [64.45797970830233]
MADOCはBluesky、Koo、Reddit、Voat(2012-2024)のデータを集め、標準化している。
このデータセットは、標準化されたインタラクション記録と感情分析を通じて、プラットフォーム間の有害な振る舞いの進化の比較研究を可能にする。
論文 参考訳(メタデータ) (2025-01-22T14:02:11Z) - BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.39593644054865]
BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文 参考訳(メタデータ) (2025-01-13T09:58:03Z) - 1024m at SMM4H 2024: Tasks 3, 5 & 6 -- Ensembles of Transformers and Large Language Models for Medical Text Classification [1.1470070927586018]
ソーシャルメディアは、ユーザーが情報を報告し、その健康状態や、さまざまなことがそれらにどのような影響を及ぼしたかについて、非常に優れたデータ源である。
本稿ではトランスフォーマーと大規模言語モデルを用いた様々なアプローチとそのアンサンブルについて述べる。
論文 参考訳(メタデータ) (2024-10-21T13:29:08Z) - The MuSe 2024 Multimodal Sentiment Analysis Challenge: Social Perception and Humor Recognition [64.5207572897806]
マルチモーダル・センティメント・アナリティクス・チャレンジ (MuSe) 2024は、現代の2つのマルチモーダル・インフルエンスと感情分析の問題に対処する。
Social Perception Sub-Challenge (MuSe-Perception)では、参加者は16種類の個人の社会的属性を予測する。
クロスカルカルカルチャー・ヒューモー検出サブチャレンジ(MuSe-Humor)データセットは、Passau Spontaneous Football Coach Humorデータセット上に拡張される。
論文 参考訳(メタデータ) (2024-06-11T22:26:20Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Topic Modelling of Swedish Newspaper Articles about Coronavirus: a Case
Study using Latent Dirichlet Allocation Method [8.405827390095064]
トピックモデリング(TM)は、自然言語理解(NLU)と自然言語処理(NLP)の研究分野からのものである。
本研究では,LDA(Latent Dirichlet Allocation)法を用いて,コロナウイルスに関するスウェーデンの新聞記事の話題変化をモデル化する。
我々は,2020年1月17日から2021年3月13日までの約1年2ヶ月間のトピック変更に関する6515の論文,適用方法,統計データを含むコーパスについて述べる。
論文 参考訳(メタデータ) (2023-01-08T12:33:58Z) - Surveillance of COVID-19 Pandemic using Social Media: A Reddit Study in
North Carolina [5.38552621556164]
我々はソーシャルメディアに侵入し、緩和と検出戦略の取り込みを回避し、パンデミックに関する問題や懸念を捉えます。
ノースカロライナの4大サブレディットコミュニティから6ヶ月にわたって新型コロナウイルス関連の投稿を抽出した後、ノイズの多いデータをきれいにするためにNLPベースの前処理を行いました。
我々は,「マスク」,「フル」,「テスト」が「個人保護装置」,「症状」,「検査」のカテゴリーで最も多い名前であることを示した。
論文 参考訳(メタデータ) (2021-06-07T06:55:25Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - Health, Psychosocial, and Social issues emanating from COVID-19 pandemic
based on Social Media Comments using Natural Language Processing [8.150081210763567]
新型コロナウイルス(COVID-19)のパンデミックは、世界の健康危機を引き起こし、多くの人の生活に影響を与えている。
ソーシャルメディアのデータは、政府や保健機関がパンデミックにどう対処しているかに対する大衆の認識を明らかにすることができる。
本稿は、新型コロナウイルスのパンデミックが世界規模でソーシャルメディアデータを利用した人々に与える影響を調査することを目的とする。
論文 参考訳(メタデータ) (2020-07-23T17:19:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。