論文の概要: Unexpected Knowledge: Auditing Wikipedia and Grokipedia Search Recommendations
- arxiv url: http://arxiv.org/abs/2512.17027v1
- Date: Thu, 18 Dec 2025 19:41:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.151389
- Title: Unexpected Knowledge: Auditing Wikipedia and Grokipedia Search Recommendations
- Title(参考訳): 予想外の知識:ウィキペディアとGrokipediaの検索レコメンデーションの監査
- Authors: Erica Coppolillo, Simone Mungari,
- Abstract要約: われわれはWikipediaとGrokipediaで検索エンジンの比較分析を行った。
7万以上の検索結果を収集し、それらのセマンティックアライメント、重複、トピック構造を調べます。
以上の結果から,予期せぬ検索エンジンの結果が両プラットフォームに共通する特徴であることが示唆された。
- 参考スコア(独自算出の注目度): 1.4323566945483497
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Encyclopedic knowledge platforms are key gateways through which users explore information online. The recent release of Grokipedia, a fully AI-generated encyclopedia, introduces a new alternative to traditional, well-established platforms like Wikipedia. In this context, search engine mechanisms play an important role in guiding users exploratory paths, yet their behavior across different encyclopedic systems remains underexplored. In this work, we address this gap by providing the first comparative analysis of search engine in Wikipedia and Grokipedia. Using nearly 10,000 neutral English words and their substrings as queries, we collect over 70,000 search engine results and examine their semantic alignment, overlap, and topical structure. We find that both platforms frequently generate results that are weakly related to the original query and, in many cases, surface unexpected content starting from innocuous queries. Despite these shared properties, the two systems often produce substantially different recommendation sets for the same query. Through topical annotation and trajectory analysis, we further identify systematic differences in how content categories are surfaced and how search engine results evolve over multiple stages of exploration. Overall, our findings show that unexpected search engine outcomes are a common feature of both the platforms, even though they exhibit discrepancies in terms of topical distribution and query suggestions.
- Abstract(参考訳): 百科事典知識プラットフォームは、ユーザがオンラインで情報を探すための重要なゲートウェイである。
最近リリースされた完全なAI生成百科事典であるGrokipediaは、Wikipediaのような伝統的に確立されたプラットフォームに代わる新しい代替手段を導入している。
この文脈では,検索エンジン機構はユーザの探索経路を導く上で重要な役割を担っているが,様々な百科事典システムにまたがる動作はいまだ解明されていない。
本稿では,WikipediaとGrokipediaにおける検索エンジンの比較分析を初めて提供することで,このギャップに対処する。
1万近い中性英語の単語とそのサブストリングをクエリとして使用し、70,000以上の検索結果を収集し、それらのセマンティックアライメント、重複、トピック構造を調べます。
両プラットフォームは、元のクエリと弱い関係の検索結果を頻繁に生成し、多くの場合、無害なクエリから始まる予期せぬコンテンツを表面化する。
これらの共有プロパティにもかかわらず、2つのシステムは、しばしば同じクエリに対してかなり異なるレコメンデーションセットを生成する。
トピックのアノテーションや軌跡分析を通じて,コンテンツカテゴリの出現状況と,検索エンジンの検索結果が探索の複数の段階にわたってどのように進化するかについて,系統的な差異を更に同定する。
概して,検索結果の予期せぬ結果は,トピック分布やクエリ提案の点で相違があるにもかかわらず,両プラットフォームに共通する特徴であることがわかった。
関連論文リスト
- How Similar Are Grokipedia and Wikipedia? A Multi-Dimensional Textual and Structural Comparison [0.0]
イーロン・マスクのxAIが開発したAI生成百科事典であるGrokipediaは、ウィキペディアのイデオロギーと構造的偏見に対する反応として発表された。
本研究は,GrokipediaとWikipediaの1,800のマッチング記事の大規模比較を行った。
語彙的豊かさ,可読性,構造的構造,参照密度,意味的類似性にまたがる指標を用いて,両プラットフォームが形と実体の密接な整合性を評価する。
論文 参考訳(メタデータ) (2025-10-30T18:04:46Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - NeuralSearchX: Serving a Multi-billion-parameter Reranker for
Multilingual Metasearch at a Low Cost [4.186775801993103]
検索結果をマージし、文章をハイライトする多目的大規模階調モデルに基づくメタサーチエンジンであるNeuralSearchXについて述べる。
我々の設計選択は、幅広い公開ベンチマークで最先端の結果に近づきながら、競争力のあるQPSを備えたよりコスト効率の高いシステムに繋がったことを示す。
論文 参考訳(メタデータ) (2022-10-26T16:36:53Z) - A Large-Scale Characterization of How Readers Browse Wikipedia [13.106604261718381]
読者がウィキペディアを閲覧する方法に関する,最初の体系的な大規模分析を提示する。
Wikipediaのサーバーログからの数十億のページリクエストを使用して、読者が記事にアクセスする方法を測定します。
ナビゲーションの挙動は、非常に多様な構造によって特徴づけられる。
論文 参考訳(メタデータ) (2021-12-22T12:54:44Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Search Engine Similarity Analysis: A Combined Content and Rankings
Approach [6.69087470775851]
我々は、DuckDuckGoとともに、GoogleとBingという2つの主要な検索エンジンの親和性について分析する。
我々は、検索応答のコンテンツとランキングの両方を活用する新しい類似度指標を開発した。
しかしBingとDuckDuckGoは相違点が多い。
論文 参考訳(メタデータ) (2020-11-01T23:57:24Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - On the Social and Technical Challenges of Web Search Autosuggestion
Moderation [118.47867428272878]
自動提案は通常、検索ログと文書表現のコーパスに基づいてトレーニングされた機械学習(ML)システムによって生成される。
現在の検索エンジンは、このような問題のある提案を抑えるのに、ますます熟練している。
問題のある提案のいくつかの側面、パイプラインに沿った困難な問題、そしてWeb検索を超えたアプリケーションの増加になぜ私たちの議論が適用されるのかについて論じる。
論文 参考訳(メタデータ) (2020-07-09T19:22:00Z) - A Deeper Investigation of the Importance of Wikipedia Links to the
Success of Search Engines [7.433327915285967]
検索結果ページ(SERP)におけるウィキペディアリンクの発生状況に関する調査結果について報告する。
ウィキペディアのリンクは重要な検索コンテキストでは極めて一般的であり、一般的なクエリやトレンドクエリでは全SERPの67~84%に表示されるが、医療クエリではそれほど多くはない。
本研究は,(1)ウィキペディアのコンテンツと研究はウィキペディア領域以外で大きな影響を与え,(2)検索エンジンのような強力な技術はボランティアが作成した無料コンテンツに大きく依存している,という補完的な概念を裏付けるものである。
論文 参考訳(メタデータ) (2020-04-21T19:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。