論文の概要: The Rise of AI-Generated Content in Wikipedia
- arxiv url: http://arxiv.org/abs/2410.08044v1
- Date: Thu, 10 Oct 2024 15:36:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 05:45:05.992510
- Title: The Rise of AI-Generated Content in Wikipedia
- Title(参考訳): ウィキペディアにおけるAI生成コンテンツの増加
- Authors: Creston Brooks, Samuel Eggert, Denis Peskoff,
- Abstract要約: 私たちは、プロプライエタリなAI検出ツールであるGPTZeroと、オープンソースの代替手段であるBinocularsを使って、最近作成されたWikipediaページでAI生成コンテンツの存在を低く設定しています。
しきい値はGPT-3.5以前の記事に対して1%の偽陽性率を達成するために調整されており、新たに作成されたウィキペディア記事の5%以上をAI生成としてフラグ付けしている。
フラッグ付きのウィキペディア記事は、典型的には品質が低く、しばしば自己宣伝的または特定の視点に向けて部分的である。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of AI-generated content in popular information sources raises significant concerns about accountability, accuracy, and bias amplification. Beyond directly impacting consumers, the widespread presence of this content poses questions for the long-term viability of training language models on vast internet sweeps. We use GPTZero, a proprietary AI detector, and Binoculars, an open-source alternative, to establish lower bounds on the presence of AI-generated content in recently created Wikipedia pages. Both detectors reveal a marked increase in AI-generated content in recent pages compared to those from before the release of GPT-3.5. With thresholds calibrated to achieve a 1% false positive rate on pre-GPT-3.5 articles, detectors flag over 5% of newly created English Wikipedia articles as AI-generated, with lower percentages for German, French, and Italian articles. Flagged Wikipedia articles are typically of lower quality and are often self-promotional or partial towards a specific viewpoint on controversial topics.
- Abstract(参考訳): 人気情報ソースにおけるAI生成コンテンツの増加は、説明責任、正確性、バイアス増幅に関する重大な懸念を提起する。
消費者に直接影響を与えること以外に、このコンテンツが広く存在していることは、巨大なインターネット網上でのトレーニング言語モデルの長期的な生存可能性に疑問を投げかけている。
私たちは、プロプライエタリなAI検出ツールであるGPTZeroと、オープンソースの代替手段であるBinocularsを使って、最近作成されたWikipediaページでAI生成コンテンツの存在を低く設定しています。
両方の検出器は、GPT-3.5のリリース前のものと比較して、最近のページでAI生成コンテンツが顕著に増加したことを示している。
しきい値はGPT-3.5以前の記事に対して1%の偽陽性率を達成するために調整され、新たに作成された英語ウィキペディア記事の5%以上をAI生成としてフラグ付けし、ドイツ語、フランス語、イタリア語記事の比率は低い。
フラッグ付きのウィキペディア記事は、典型的には品質が低く、しばしば議論の的となっているトピックに関する特定の視点に向けて自己宣伝的または部分的なものである。
関連論文リスト
- REVERSUM: A Multi-staged Retrieval-Augmented Generation Method to Enhance Wikipedia Tail Biographies through Personal Narratives [4.427603894929721]
本研究は,ウィキペディアのBとCカテゴリの伝記記事を強化するための新しいアプローチを提案する。
複数段階の検索拡張生成手法を用いて、より知られていない記事の情報内容の充実を図る。
論文 参考訳(メタデータ) (2025-02-17T18:53:42Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.09665704993751]
本稿では,AI生成コンテンツ分類器におけるグループ固有のしきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のアプローチは、属性(例えば、テキストの長さと書き込みスタイル)に基づいて、データをサブグループに分割し、各グループの決定しきい値を学ぶ。
我々のフレームワークは、AIが生成する出力検出において、より堅牢で公平な分類基準の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - The Value of AI-Generated Metadata for UGC Platforms: Evidence from a Large-scale Field Experiment [6.8951681566687055]
われわれはアジアの短ビデオプラットフォームで、約100万人のユーザーがアップロードしたビデオのAI生成タイトルにアクセスできるようにするフィールド実験を行った。
以上の結果から,AIによるタイトル提供によってコンテンツ消費が著しく増加し,有効視聴時間が1.6%増加し,視聴時間が0.9%向上した。
このビューワーシップ・ブースト効果は、この生成AI(GAI)ツールを使用することで、タイトルを持つビデオの確率が41.4%増加したことに起因する。
論文 参考訳(メタデータ) (2024-12-24T10:47:27Z) - Suspected Undeclared Use of Artificial Intelligence in the Academic Literature: An Analysis of the Academ-AI Dataset [0.0]
アカデミックAIは、学術文献における未宣言のAI使用の疑いのある事例を文書化している。
宣言されていないAIは、引用基準が高く、記事処理料金が高いジャーナルに現れるようだ。
論文 参考訳(メタデータ) (2024-11-20T21:29:36Z) - Human Bias in the Face of AI: The Role of Human Judgement in AI Generated Text Evaluation [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。
ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文 参考訳(メタデータ) (2024-09-29T04:31:45Z) - Lying Blindly: Bypassing ChatGPT's Safeguards to Generate Hard-to-Detect Disinformation Claims [0.7478304180168185]
本研究は、ウクライナにおける戦争に関する短文の偽情報を発生させるため、GPT-3.5を用いたChatGPTの能力について検討する。
我々は、そのモデルに人書きの偽情報物語をインプロンプトに含めることで提供しない。
また,ChatGPTは,特定のカットオフ後のイベントにおいても,現実的で,ターゲット固有の偽情報クレームを生成できることを示す。
論文 参考訳(メタデータ) (2024-02-13T13:50:08Z) - Orphan Articles: The Dark Matter of Wikipedia [13.290424502717734]
われわれは,他のウィキペディア記事からのリンクを含まない記事である孤児記事について,最初の体系的な研究を行っている。
すべての記事の約15%(8.8M)の驚くほど多くのコンテンツが、ウィキペディアをナビゲートする読者には事実上見えない。
また, 孤児に新たなリンク(脱孤児化)を追加することで, 統計的に有意な可視性向上につながるという疑似実験を通じて因果的証拠を提供する。
論文 参考訳(メタデータ) (2023-06-06T18:04:33Z) - Paraphrasing evades detectors of AI-generated text, but retrieval is an
effective defense [56.077252790310176]
本稿では,パラフレーズ生成モデル(DIPPER)を提案する。
DIPPERを使って3つの大きな言語モデル(GPT3.5-davinci-003)で生成されたテキストを言い換えると、透かしを含むいくつかの検出器を回避できた。
我々は,言語モデルAPIプロバイダによって維持されなければならない,意味論的に類似した世代を検索するシンプルなディフェンスを導入する。
論文 参考訳(メタデータ) (2023-03-23T16:29:27Z) - A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to
GPT-5 All You Need? [112.12974778019304]
生成AI(AIGC、つまりAI生成コンテンツ)は、テキスト、画像、その他を分析、作成する能力により、あらゆる場所で話題を呼んだ。
純粋な分析から創造へと移行するAIの時代において、ChatGPTは最新の言語モデルであるGPT-4とともに、多くのAIGCタスクからなるツールである。
本研究は,テキスト,画像,ビデオ,3Dコンテンツなど,出力タイプに基づいたAIGCタスクの技術的開発に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-21T10:09:47Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。