論文の概要: Machines in the Crowd? Measuring the Footprint of Machine-Generated Text on Reddit
- arxiv url: http://arxiv.org/abs/2510.07226v1
- Date: Wed, 08 Oct 2025 16:57:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.643588
- Title: Machines in the Crowd? Measuring the Footprint of Machine-Generated Text on Reddit
- Title(参考訳): 群衆のマシン : Redditにおける機械学習テキストのフットプリントの測定
- Authors: Lucio La Cava, Luca Maria Aiello, Andrea Tagarelli,
- Abstract要約: Reddit 上で MGT (Machine-Generated Text) の大規模評価を行った。
MGT検出のための最先端統計手法を用いて,51個のサブレディットにわたる2年間の活動(2022-2024)を分析した。
MGTの有病率に関する非常に保守的な推定は、合成テキストがRedditにわずかに存在していることを示しているが、一部のコミュニティでは最大9%に達する可能性がある。
- 参考スコア(独自算出の注目度): 8.318350327150437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Artificial Intelligence is reshaping online communication by enabling large-scale production of Machine-Generated Text (MGT) at low cost. While its presence is rapidly growing across the Web, little is known about how MGT integrates into social media environments. In this paper, we present the first large-scale characterization of MGT on Reddit. Using a state-of-the-art statistical method for detection of MGT, we analyze over two years of activity (2022-2024) across 51 subreddits representative of Reddit's main community types such as information seeking, social support, and discussion. We study the concentration of MGT across communities and over time, and compared MGT to human-authored text in terms of social signals it expresses and engagement it receives. Our very conservative estimate of MGT prevalence indicates that synthetic text is marginally present on Reddit, but it can reach peaks of up to 9% in some communities in some months. MGT is unevenly distributed across communities, more prevalent in subreddits focused on technical knowledge and social support, and often concentrated in the activity of a small fraction of users. MGT also conveys distinct social signals of warmth and status giving typical of language of AI assistants. Despite these stylistic differences, MGT achieves engagement levels comparable than human-authored content and in a few cases even higher, suggesting that AI-generated text is becoming an organic component of online social discourse. This work offers the first perspective on the MGT footprint on Reddit, paving the way for new investigations involving platform governance, detection strategies, and community dynamics.
- Abstract(参考訳): Generative Artificial Intelligenceは、Machine-Generated Text(MGT)を低コストで大量生産可能にすることで、オンラインコミュニケーションを再構築している。
Web全体での存在感は急速に高まりつつあるが、MGTがソーシャルメディア環境にどのように統合されるのかについては、ほとんど分かっていない。
本稿では,Reddit上でMGTの大規模評価を行った。
MGT検出のための最先端統計手法を用いて,情報検索,ソーシャルサポート,議論などのRedditの主要なコミュニティタイプを代表する51のサブレディットを対象に,2年以上にわたる活動(2022-2024)を分析した。
地域社会や時間とともにMGTの濃度を調査し、MGTが表現する社会的信号やエンゲージメントの点から人間によるテキストと比較した。
MGTの有病率に関する非常に保守的な推定は、合成テキストがRedditにわずかに存在していることを示しているが、いくつかのコミュニティでは数ヶ月で最大9%に達する可能性がある。
MGTはコミュニティに均等に分散しており、技術的知識と社会的支援に焦点を当てたサブレディットで普及しており、少数のユーザーの活動に集中していることが多い。
MGTはまた、AIアシスタントの典型的な言語を与える温かさと地位の異なる社会的シグナルも伝達している。
これらのスタイリスティックな違いにもかかわらず、MGTは人間が書いたコンテンツに匹敵するエンゲージメントレベルを達成し、さらにいくつかのケースでは、AI生成テキストがオンライン社会談話のオーガニックな構成要素になりつつあることを示唆している。
この研究は、RedditにおけるMGTのフットプリントに関する最初の視点を提供し、プラットフォームガバナンス、検出戦略、コミュニティのダイナミクスに関する新たな調査の道を開く。
関連論文リスト
- SoMe: A Realistic Benchmark for LLM-based Social Media Agents [64.05026384906915]
SoMeは、ソーシャルメディアデータにアクセスし分析するための様々なエージェントツールを備えたソーシャルメディアエージェントを評価するために設計されたベンチマークである。
SoMeは8つのソーシャルメディアエージェントタスク、9,164,284の投稿、6,591のユーザープロフィール、さまざまなソーシャルメディアプラットフォームや外部ウェブサイトからの25,686のレポートで構成されている。
定量的,質的な分析により,現実的なソーシャルメディア環境における主流エージェントLLMの性能について概観する。
論文 参考訳(メタデータ) (2025-12-09T08:36:09Z) - RedNote-Vibe: A Dataset for Capturing Temporal Dynamics of AI-Generated Text in Social Media [48.63633320837672]
ソーシャルメディアAIGT分析のための最初の縦長(5年)データセットであるRedNote-Vibeを紹介する。
このデータセットはXiaohongshuプラットフォームから提供されており、LLM以前の期間から2025年7月までのユーザエンゲージメントメトリクスとタイムスタンプが含まれている。
ソーシャルメディアの文脈でAIGTを検出するために,解釈可能なアプローチである心理言語AIGT検出フレームワーク(PLAD)を提案する。
論文 参考訳(メタデータ) (2025-09-26T08:36:45Z) - Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media [38.99664377299462]
ソーシャルメディアプラットフォームはAIGT(AI-Generated Texts)の存在感が高まっている
その重要性にもかかわらず、AIGTがソーシャルメディア上でどの程度普及しているかは不明だ。
本稿では,オンラインソーシャルメディアプラットフォーム上でAIGTを定量化し,監視することを目的とする。
論文 参考訳(メタデータ) (2024-12-24T04:04:54Z) - LLM-DetectAIve: a Tool for Fine-Grained Machine-Generated Text Detection [87.43727192273772]
テキストが人間の書いたものなのか、機械で作られたものなのかを判断するのは、しばしば困難である。
細粒度検出のためのLLM-DetectAIveを提案する。
i) 人書き、ii) 機械生成、(iii) 機械書、次いで機械書、(iv) 人書き、そして機械ポリッシュの4つのカテゴリをサポートする。
論文 参考訳(メタデータ) (2024-08-08T07:43:17Z) - M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection [69.41274756177336]
大規模言語モデル (LLMs) は様々なチャネルにまたがる機械生成テキスト (MGT) を前例のない急激な増加をもたらした。
このことは、その潜在的な誤用と社会的意味に関する正当な懸念を提起する。
本稿では,MGT-M4GT-Benchの多言語,マルチドメイン,マルチジェネレータコーパスに基づく新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2024-02-17T02:50:33Z) - Anti-Sexism Alert System: Identification of Sexist Comments on Social
Media Using AI Techniques [0.0]
ソーシャルメディア(新聞記事のコメント、ソーシャルネットワークなど)に投稿された性的なコメントは、通常多くの注目を集め、ウイルスに感染し、関係者に被害を与える。
本稿では,自然言語処理(NLP)と人工知能(AI)に基づく反性行為警告システムを提案する。
このシステムはあらゆる公開投稿を分析し、性差別的なコメントと見なせるかどうかを判断する。
論文 参考訳(メタデータ) (2023-11-28T19:48:46Z) - GPT-4V(ision) as A Social Media Analysis Engine [77.23394183063238]
本稿では,GPT-4Vのソーシャルマルチメディア分析能力について考察する。
我々は、感情分析、ヘイトスピーチ検出、フェイクニュース識別、人口推定、政治的イデオロギー検出を含む5つの代表的なタスクを選択する。
GPT-4Vはこれらのタスクにおいて顕著な効果を示し、画像とテキストのペアの理解、文脈と文化の認識、広義のコモンセンス知識などの強みを示している。
論文 参考訳(メタデータ) (2023-11-13T18:36:50Z) - Gender Gaps in Online Social Connectivity, Promotion and Relocation
Reports on LinkedIn [0.7373617024876725]
本稿では、英国および米国情報技術(IT)分野の約1000万人のLinkedInユーザーから匿名化されたデータを解析する。
IT部門ではLinkedInの男性に比べて女性の割合は少ない。
女性は、仕事で最近昇進したことを報告した男性よりも多く、高学歴の女性はLinkedInで自己選択しているかもしれないことを示唆している。
論文 参考訳(メタデータ) (2023-08-25T10:43:30Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z) - ChatGPT: A Meta-Analysis after 2.5 Months [16.62394237011141]
我々は30万以上のツイートと150以上の科学論文を分析し、ChatGPTがどのように認識され、議論されているかを調べる。
以上の結果から,ChatGPTは,ソーシャルメディアにおいて肯定的な感情や快楽の感情が支配的であり,品質の高いものと見なされている。
論文 参考訳(メタデータ) (2023-02-20T15:43:22Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。