論文の概要: Synthetic Sources?: Auditing Generative Search Engine Citations for Evidence of AI-Generated Sources
- arxiv url: http://arxiv.org/abs/2605.23684v1
- Date: Fri, 22 May 2026 14:33:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.389946
- Title: Synthetic Sources?: Auditing Generative Search Engine Citations for Evidence of AI-Generated Sources
- Title(参考訳): 合成源?:AI生成源のエビデンスのための生成検索エンジン Citation の検討
- Authors: Mowafak Allaham, Nicholas Diakopoulos,
- Abstract要約: 生成検索エンジンが合成源を引用して確実に省略できるかどうかは不明である。
本研究は,実世界の712件の人間生成クエリを用いた4つの生成検索エンジンのオーディションを示す。
以上の結果から,AI生成源が4つの生成検索エンジンにまたがって引用されている証拠が得られた。
- 参考スコア(独自算出の注目度): 3.2065257821139195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The growing accessibility of Large Language Models via conversational interfaces capable of responding to users' questions by drawing on, synthesizing, and citing information from the web (i.e., Generative Search Engines) has simplified the information-seeking process for users. However, with the proliferation of AI-generated content on the web, it is unclear whether these engines can reliably omit citing synthetic sources (i.e., AI-generated sources). Should these engines be unable to do so, this puts users at risk of harm by treating information from AI-generated sources synthesized in responses of generative search engines as equivalent to information from authoritative or official sources. In a step towards identifying whether AI-generated sources are being cited by these engines, this work presents an audit of four generative search engines (ChatGPT, Copilot, Gemini, Perplexity) using a total of 712 real-world human-generated queries spanning domains of public importance: politics, health, and the environment. Our findings show evidence of AI-generated sources being cited across all four generative search engines (~16% of cited sources) and identifies key source web domains these sources belong to that are frequently cited across these engines and topics. In addition, we observed that generative search engines include a somewhat narrow set of repeatedly cited domains while predominantly surfacing a large number of minimally cited domains in responses to users' queries. These findings contribute to the growing body of work on assessing the risks of generative search engines with the objective of increasing public awareness of their limitations and encouraging appropriate measures to improve information quality and governance of these systems.
- Abstract(参考訳): 対話型インタフェースによる大規模言語モデルのアクセシビリティの向上により,Webからの情報(ジェネレーティブ検索エンジン)を描画,合成,引用することで,ユーザの質問に答えることが可能になった。
しかし、Web上のAI生成コンテンツの普及に伴い、これらのエンジンが合成ソース(つまりAI生成ソース)を引用して確実に省略できるかどうかは不明である。
これらのエンジンがそうできなければ、ユーザーは、生成検索エンジンの応答で合成されたAI生成ソースから情報を、権威または公式情報源の情報と同等に扱うことで、有害なリスクを被ることになる。
これらのエンジンによってAI生成ソースが引用されているかどうかを確認するために、この研究は、政治、健康、環境の4つの生成検索エンジン(ChatGPT、Copilot、Gemini、Perplexity)の監査を行う。
その結果,4つの生成検索エンジンでAI生成ソースが引用されている証拠(引用されたソースの約16%)と,これらのソースが属する主要なソースWebドメインが,これらのエンジンやトピックで頻繁に引用されていることを示す。
さらに, 生成検索エンジンには, 繰り返し参照されるドメインの集合がやや狭く, ユーザのクエリに対する応答として, 最小限参照されるドメインが多数存在することも確認した。
これらの知見は,これらのシステムの情報品質とガバナンスを改善するための適切な対策を奨励し,その限界に対する一般の意識を高めることを目的として,生成検索エンジンのリスクを評価するための活動の活発化に寄与する。
関連論文リスト
- Answer Bubbles: Information Exposure in AI-Mediated Search [14.377773240202849]
バニラGPT,検索GPT,Google AI概要,従来のGoogle検索という,4つのシステムにわたる11,000のリアルタイム検索クエリに対する応答について検討する。
生成検索システムは,その引用に有意なテキストソース選択バイアスを示すことがわかった。
論文 参考訳(メタデータ) (2026-03-17T05:41:39Z) - DeepTRACE: Auditing Deep Research AI Systems for Tracking Reliability Across Citations and Evidence [50.97612134791782]
生成検索エンジンと深層研究のLLMエージェントは、信頼できるソース・グラウンドの合成を約束するが、ユーザーは常に過剰な自信、弱いソーシング、紛らわしい引用の慣行に遭遇する。
DeepTRACEは、社会技術的に基礎をおく新しい監査フレームワークで、コミュニティが特定した失敗事例を、回答テキスト、情報源、引用にまたがる8つの測定可能な次元に変換する。
論文 参考訳(メタデータ) (2025-09-02T00:32:38Z) - From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.65646344634524]
推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文 参考訳(メタデータ) (2025-06-23T17:27:19Z) - Generative AI Search Engines as Arbiters of Public Knowledge: An Audit of Bias and Authority [2.860575804107195]
本稿では, 生成型AIシステム(ChatGPT, Bing Chat, Perplexity)の監査研究について報告する。
7日間に4つのトピックに対する48の真正クエリを用いてシステム応答を収集し,感情分析,帰納的符号化,ソース分類を用いて分析した。
その結果,これらのシステムにまたがるシステム応答の性質を概観し,クエリとトピックに基づく感情バイアスの証拠と,情報源における商業的および地理的バイアスの証拠を提供する。
論文 参考訳(メタデータ) (2024-05-22T22:09:32Z) - Search Engines Post-ChatGPT: How Generative Artificial Intelligence
Could Make Search Less Reliable [2.7557703490816268]
我々は、生成人工知能(GenAI)が生成したコンテンツを生成、インデックス化、配布し始めるにつれて、検索エンジンの進化する性質について議論する。
我々の議論は、GenAI統合の初期段階、特に事実上の矛盾とバイアスに関する課題を強調します。
論文 参考訳(メタデータ) (2024-02-18T21:10:18Z) - Evaluating Verifiability in Generative Search Engines [70.59477647085387]
生成検索エンジンは、インラインの引用とともに、ユーザークエリへの応答を直接生成する。
我々は,一般的な4つの生成検索エンジンの評価を行う。
既存の生成検索エンジンからの応答は流動的であり、情報的に見えるが、しばしばサポートされていない文や不正確な引用を含んでいる。
論文 参考訳(メタデータ) (2023-04-19T17:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。