論文の概要: Machines in the Crowd? Measuring the Footprint of Machine-Generated Text on Reddit
- arxiv url: http://arxiv.org/abs/2510.07226v1
- Date: Wed, 08 Oct 2025 16:57:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.643588
- Title: Machines in the Crowd? Measuring the Footprint of Machine-Generated Text on Reddit
- Title(参考訳): 群衆のマシン : Redditにおける機械学習テキストのフットプリントの測定
- Authors: Lucio La Cava, Luca Maria Aiello, Andrea Tagarelli,
- Abstract要約: Reddit 上で MGT (Machine-Generated Text) の大規模評価を行った。
MGT検出のための最先端統計手法を用いて,51個のサブレディットにわたる2年間の活動(2022-2024)を分析した。
MGTの有病率に関する非常に保守的な推定は、合成テキストがRedditにわずかに存在していることを示しているが、一部のコミュニティでは最大9%に達する可能性がある。
- 参考スコア(独自算出の注目度): 8.318350327150437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Artificial Intelligence is reshaping online communication by enabling large-scale production of Machine-Generated Text (MGT) at low cost. While its presence is rapidly growing across the Web, little is known about how MGT integrates into social media environments. In this paper, we present the first large-scale characterization of MGT on Reddit. Using a state-of-the-art statistical method for detection of MGT, we analyze over two years of activity (2022-2024) across 51 subreddits representative of Reddit's main community types such as information seeking, social support, and discussion. We study the concentration of MGT across communities and over time, and compared MGT to human-authored text in terms of social signals it expresses and engagement it receives. Our very conservative estimate of MGT prevalence indicates that synthetic text is marginally present on Reddit, but it can reach peaks of up to 9% in some communities in some months. MGT is unevenly distributed across communities, more prevalent in subreddits focused on technical knowledge and social support, and often concentrated in the activity of a small fraction of users. MGT also conveys distinct social signals of warmth and status giving typical of language of AI assistants. Despite these stylistic differences, MGT achieves engagement levels comparable than human-authored content and in a few cases even higher, suggesting that AI-generated text is becoming an organic component of online social discourse. This work offers the first perspective on the MGT footprint on Reddit, paving the way for new investigations involving platform governance, detection strategies, and community dynamics.
- Abstract(参考訳): Generative Artificial Intelligenceは、Machine-Generated Text(MGT)を低コストで大量生産可能にすることで、オンラインコミュニケーションを再構築している。
Web全体での存在感は急速に高まりつつあるが、MGTがソーシャルメディア環境にどのように統合されるのかについては、ほとんど分かっていない。
本稿では,Reddit上でMGTの大規模評価を行った。
MGT検出のための最先端統計手法を用いて,情報検索,ソーシャルサポート,議論などのRedditの主要なコミュニティタイプを代表する51のサブレディットを対象に,2年以上にわたる活動(2022-2024)を分析した。
地域社会や時間とともにMGTの濃度を調査し、MGTが表現する社会的信号やエンゲージメントの点から人間によるテキストと比較した。
MGTの有病率に関する非常に保守的な推定は、合成テキストがRedditにわずかに存在していることを示しているが、いくつかのコミュニティでは数ヶ月で最大9%に達する可能性がある。
MGTはコミュニティに均等に分散しており、技術的知識と社会的支援に焦点を当てたサブレディットで普及しており、少数のユーザーの活動に集中していることが多い。
MGTはまた、AIアシスタントの典型的な言語を与える温かさと地位の異なる社会的シグナルも伝達している。
これらのスタイリスティックな違いにもかかわらず、MGTは人間が書いたコンテンツに匹敵するエンゲージメントレベルを達成し、さらにいくつかのケースでは、AI生成テキストがオンライン社会談話のオーガニックな構成要素になりつつあることを示唆している。
この研究は、RedditにおけるMGTのフットプリントに関する最初の視点を提供し、プラットフォームガバナンス、検出戦略、コミュニティのダイナミクスに関する新たな調査の道を開く。
関連論文リスト
- RedNote-Vibe: A Dataset for Capturing Temporal Dynamics of AI-Generated Text in Social Media [48.63633320837672]
ソーシャルメディアAIGT分析のための最初の縦長(5年)データセットであるRedNote-Vibeを紹介する。
このデータセットはXiaohongshuプラットフォームから提供されており、LLM以前の期間から2025年7月までのユーザエンゲージメントメトリクスとタイムスタンプが含まれている。
ソーシャルメディアの文脈でAIGTを検出するために,解釈可能なアプローチである心理言語AIGT検出フレームワーク(PLAD)を提案する。
論文 参考訳(メタデータ) (2025-09-26T08:36:45Z) - Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media [38.99664377299462]
ソーシャルメディアプラットフォームはAIGT(AI-Generated Texts)の存在感が高まっている
その重要性にもかかわらず、AIGTがソーシャルメディア上でどの程度普及しているかは不明だ。
本稿では,オンラインソーシャルメディアプラットフォーム上でAIGTを定量化し,監視することを目的とする。
論文 参考訳(メタデータ) (2024-12-24T04:04:54Z) - LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection [87.43727192273772]
テキストが人間の書いたものなのか、機械で作られたものなのかを判断するのは、しばしば困難である。
細粒度検出のためのLLM-DetectAIveを提案する。
i) 人書き、ii) 機械生成、(iii) 機械書、次いで機械書、(iv) 人書き、そして機械ポリッシュの4つのカテゴリをサポートする。
論文 参考訳(メタデータ) (2024-08-08T07:43:17Z) - M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection [69.41274756177336]
大規模言語モデル (LLMs) は様々なチャネルにまたがる機械生成テキスト (MGT) を前例のない急激な増加をもたらした。
このことは、その潜在的な誤用と社会的意味に関する正当な懸念を提起する。
本稿では,MGT-M4GT-Benchの多言語,マルチドメイン,マルチジェネレータコーパスに基づく新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2024-02-17T02:50:33Z) - GPT-4V(ision) as A Social Media Analysis Engine [77.23394183063238]
本稿では,GPT-4Vのソーシャルマルチメディア分析能力について考察する。
我々は、感情分析、ヘイトスピーチ検出、フェイクニュース識別、人口推定、政治的イデオロギー検出を含む5つの代表的なタスクを選択する。
GPT-4Vはこれらのタスクにおいて顕著な効果を示し、画像とテキストのペアの理解、文脈と文化の認識、広義のコモンセンス知識などの強みを示している。
論文 参考訳(メタデータ) (2023-11-13T18:36:50Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。